版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章 频数分布与集中趋势频数分布的补充知识百分位数百分等级内插法茎叶图百分位数与百分等级原始分数的不足在班级中该分数高吗?考试成绩:43在班级中该分数低吗?百分位数与百分等级原始分数不能提供更多信息,可将其转化为更有意义的形式,如百分位数。
百分等级:一个特定分数百分等级指的是分布中分数不高于该特定分数的人数所占的百分率。
比如,如果低于或等于43分的人数占总人数的60%,则称43分对应的百分等级为60%;百分等级和百分位数百分位数:当一个分数用它所在的百分等级描述时,该分数即为百分位数。在这组数据中第60个百分位数43分。百分等级指的是一个分数对应的百分等级,而百分位数指的是某个百分等级对应的分数。百分位数与百分等级当全班恰好有60%的人的分数等于或低于43时考试成绩:43分数43具有百分等级60%分数43也被称为第60个百分位数指百分率指一个分数累积频数和累积百分率累积频数:计算量表中位于或低于每个类别的个体数目的所得的值,表示了沿着量表向上时积累的个体个数。累积百分率:将累积频数转化为百分率,得到的值即为累积百分率,表示了沿着量表向上时累积的个体百分率。累积频数和累积百分率累积百分率XfcfC%5120100%451995%381470%24630%12210%累积频数累积频数和累积百分率注意:表中的X值并非量表中的点而是区间。 例如,分数X=2的意思是这个测量处于实限1.5和2.5之间。当一个表显示分数X=2具有累积百分率30%时,应解释为,在达到区间X=2的上限前积累了
30%的个体个数。每个累积百分率值都与它区间的上实限对应。累积频数和累积百分率XfcfC%5120100%451995%381470%24630%12210%X=3.5的百分等级是多少?第95个百分位数是多少?X=4的百分等级是多少?第50个百分位数是多少?内插法内插法是一种估计中间值的方法基本假定:一个区间从一端到另一端的变化是正常的,线性变化X=7.0位于实限6.5和7.5限定的区间内。右方下表对应着这个实限的累积百分率分别为20%和44%数值X百分率7.544%7.0?6.520%XC%860%744%620%54%内插法假设与A1对应的数据是B1,与A2对应的数据是B2,现在已知与A对应的数据是B,A介于A1和A2之间则可以按照(A1-A)/(A1-A2)=(B1-B)/(B1-B2)计算得出A的数值,其中A1、A2、B1、B2、B都是已知数据。内插法步骤:a
找出两个量表的区间宽度;b找出中间值在区间中的位置,这个位置对应着整个区间的一个分数:分数=到区间定点的距离/区间宽度c用这个分数确定另一量表中到区间顶点的距离:距离=分数*宽度d
用这个距离决定所求值在另一个量表中的位置内插法XfcfC%20-24220100%15-1931890%10-1431575%5-9101260%0-42210%第50个百分位数是多少?练习第80个百分位数和第40个百分位数对应的原始分数那个值高?对于下表中的数据分布找出第60个百分位数;找出39.5对应的百分等级。XfcfC%40-49425100%30-3962184%20-29101560%10-193520%0-9228%练习找出第40个百分位数;分数32对应的百分等级。XfcfC%40-49425100%30-3962184%20-29101560%10-193520%0-9228%茎叶图数据茎叶图83
82
63
62
93
7871
68
33
76
52
9785
42
46
32
57
5956
73
74
74
81
76排序:97
93
85
83
82
8178
76
76
74
73
7168
63
62
59
57
5652
46
42
33
323
234
265
62796
2837
1643868
35219
37茎叶茎叶图茎叶图:将每个数字分为两个部分,数字的第一位或前几位被称为茎,数字的后几位或最后一位被称为叶。如X=85的茎为8,叶为5。思考:茎叶图和频数分布图的比较?茎叶图集中趋势平均数中数众数集中趋势集中趋势:是一种统计测量,它确定了能够代表分布中心的一个数值。集中趋势的目的是找到最典型的或最能代表整个数据分布的单个数值。即确认“平均的”或
“典型的”个体。注意:没有一种测量集中趋势的代表性数值的方法适用于所有情况。(正态分布,偏态分
布……)平均数算术平均数(arithmeticaverage,mean):将分布中的所有数据相加并除以数据的个数得到的值。总体平均数:样本平均数:nXMNX
平均数平均数是平衡点由上述公式可得平均数的几个重要性质X
nM
X
nM
0C
X
nC
X
C
Mn
n连加和计算规则CX
CX
CMn
n学习检查
a.计算下面样本中数据的平均数:6,1,8,0,5b.将每个数据增加4,计算之后的样本平均数;c.将每个数据乘以5,计算之后的样本平均数;一总体平均数为μ=80。如果每个数据增加6,新的平均数是多少?
b.如果每个数据都乘以2,新的平均数是多少?一个样本有n=5个数据,平均值为M=8。如果增加一个 新数据2,那么新的平均数将是?加权平均数第一个样本:n=12,M=6;第二个样本:n=8,M=7;如果将两个样本合并,整体组的平均数是多少?加权平均数
数据总和
X
1
X
2数据个数
n1
n2加权平均数注意:
整体平均数并非原先两个样本的平均数中心。由于两个样本大小不同,其中一个对整体组做出了更大贡献,因此,决定整体平均数时占了更大权数。频数分布表计算公式j
Cjkkf
Xn
j
1f1
f2
fM
f1
XC1
f2
XC
2
fkXCk
1CnM
1
fXXf102958773625041XffX102209545875673216212500414和2015820
158
7.9CnM
1
fX表3-252名学生数学成绩平均数计算表CnX
1
fX
72
.1523749
.0成绩Xc频数fF*Xc95-99972194
90-94922184
85-89873261
80-84825410
75-79778616
70-747211792
65-69679603
60-64625310
55-59574228
50-54522104
45-4947147合计5237491:下表是花园小学5年级各半语文期末考试的成绩和各班人数,计算全年级的平均成绩。学习检查2:西山小学规定,评定学生一个学期的学习成绩时,期中成绩占40%,期末成绩占60%。五(1)班杨华的算术期中成绩是86分,期末成绩是94分;李杰的算术成绩是94分,期末成绩是86分,分别计算他们的算术学期总成绩。学习检查中数中数(median):恰好将一个分布一分为二的数值。分布中恰好有50%的个体得分高于或低于中数。一般用Md或Mdn表示。中数当N为奇数时:将所有数据由低至高按顺序排列,中数就是排在中间的那个分数中数是?3,5,8,10,11当N为偶数时:将所有数据由低至高按顺序排列,并找出中间的两个数,它们的平均值即为中数。3,3,4,5,7,8
中数是?中数分布的中点,将分布图分成相等的两半众数众数:在一个频数分布中,众数是具有最大频率的分数或类别。众数(mode)用Mo表示。一个分布可能具有多个众数。术语众数经常也被用来指那些具有相对高频数的值,如果有两个众数的话,频数较多的众数称为主要众数,频数较少的众数称为次要众数。选择一种集中趋势测量平均数:用到了分布中的每个数值,通常具有很好的代表性;与方差和标准差等最常见的变异性测量具有紧密关系;通常被认为是三种集中趋势测量中最好的一种。但是存在一些特殊情况,无法计算平均数或平均数并不是特别具有代表性。何时使用中数一、极端数值和偏态分布当一个分布含有几个与其他数值非常不同的极端数值时,平均数可能不能很好的代表分布。此时中数是一个较好的集中趋势测量。二、未确定数值由于存在未确定值,无法计算平均数,但是可以计算中数。何时使用中数三、尾端开放式分布当一个分布的类别没有上限和下限时,该分布称为尾端开放式分布。此时也不可以计算所有数据的平均数,可以找出中数。孩子的个数(X)f5个或更3多2423326104何时使用中数四、顺序量表许多研究者认为,用平均数描述顺序数据的集中趋势是不对的。当用顺序量表的数据时,中数是较为合理、常采用的集中趋势测量。何时使用众数一、称名量表众数主要优势是它可以用来测量和描述用称名量表测量数据的集中趋势。二、离散变量此时众数是更加合理的集中趋势测量三、描述形状经常作为额外的无成本的平均数和中数的补充测量。不仅测量集中趋势,而且表示了分布的形状。练习:42请问下列数据适合用哪种几种集中量数?学习成绩(原始分数、等级)人均年收入/消费水平身高/体重饭量民族/性别鞋号/衣服尺寸寿命用图表示平均数和中数图形也可以用于报告和比较集中趋
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全国大学生广告艺术大赛作品欣赏
- 《设立粮食仓库的战》课件
- 山东省济宁市邹城市2025届高三第五次模拟考试语文试卷含解析
- 陕西省西安市碑林区铁一中学2025届高考数学三模试卷含解析
- 吉林省汪清县六中2025届高考数学三模试卷含解析
- 测量学基础常识100个知识点
- 2025届四川省会理县第一中学高三冲刺模拟英语试卷含解析
- 甘肃省天水市甘谷县第一中学2025届高三第五次模拟考试英语试卷含解析
- 现代学徒制课题:中国特色学徒制实施现状调查研究(附:研究思路模板、可修改技术路线图)
- 《信使的信号通路》课件
- 线性规划课后题答案
- 2023河南中医药大学学士学位英语题
- 压裂作业质量、安全、环保管理体系与措施
- JGJ120-2012建筑基坑支护技术规程
- 2023-2024学年广东省深圳市福田区八年级上册期末考试生物模拟试题(附答案)
- 国防教育基地建设项目运营方案
- 护理文书相关案例分享
- 维生素B市场研究报告
- 狭义相对论(电动力学部分)
- 上海生煎包行业分析
- Flutter(从0到1构建大前端应用)
评论
0/150
提交评论