频数分布和集中趋势_第1页
频数分布和集中趋势_第2页
频数分布和集中趋势_第3页
频数分布和集中趋势_第4页
频数分布和集中趋势_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、频数分布与集中趋势09/3/6频数分布 百分位数 百分等级 内插法百分位数与百分等级原始分数的不足在班级中该分数高吗?考试成绩:43在班级中该分数低吗?百分位数与百分等级 原始分数不能提供更多信息,可将其转化为更有意义的形式,如百分位数。 百分等级:一个特定分数的等级或百分等级指的是分布中分数不高于该特定分数的人数所占的百分率。 比如,如果低于或等于43分的人数占总人数的60%,则称43分对应的百分等级为60%;百分等级和百分位数百分位数:当一个分数用它所在的百分等级描述时,该分数即为百分位数。在这组数据中第60个百分位数43分。百分等级指的是一个分数对应的百分等级,而百分位数指的是某个百分等

2、级对应的分数。百分位数与百分等级当全班恰好有60%的人的分数等于或低于43时考试成绩:43分数43具有百分等级60%分数43也被称为第60个百分位数指百分率指一个分数累积频数和累积百分率累积频数:计算量表中位于或低于每个类别的个体数目的所得的值,表示了沿着量表向上时积累的个体个数。累积百分率:将累积频数转化为百分率,得到的值即为累积百分率,表示了沿着量表向上时累积的个体百分率。累积频数和累积百分率XfcfC%543211584220191462100%95%70%30%10%累积百分率累积频数累积频数和累积百分率注意: 表中的X值并非量表中的点而是区间。例如,分数X=2的意思是这个测量处于实限

3、1.5和2.5之间。当一个表显示分数X=2具有累积百分率30%时,应解释为,在达到区间X=2的上限前积累了30%的个体个数。每个累积百分率值都与它区间的上实限对应。累积频数和累积百分率XfcfC%543211584220191462100%95%70%30%10%X=3.5的百分等级是多少?第95个百分位数是多少?X=4的百分等级是多少? 第50个百分位数是多少?内插法内插法是一种估计中间值的方法基本假定:一个区间从一端到另一端的变化是正常的,线性变化。X=7.0位于实限6.5和7.5限定的区间内。右方下表对应着这个实限的累积百分率分别为20%和44%数值(X)百分率7.57.06.544%?

4、20%XC%876560%44%20%4%内插法XfcfC%20-24220100%15-1931890%10-1431575%5-9101260%0-42210%第50个百分位数是多少? 内插法步骤: a 找出两个量表的区间宽度; b 找出中间值在区间中的位置,这个位置对应着真个区间的一个分数: 分数=到区间定点的距离/区间宽度 c 用这个分数确定另一量表中到区间顶点的距离: 距离=分数*宽度 d 用这个距离决定所求值在另一个量表中的位置 练习第80个百分位数和第40个百分位数对应的原始分数那个值高?对于下表中的数据分布(1)找出第60个百分位数; (2)找出39.5对应的百分等级。Xfcf

5、C%40-49425100%30-3962184%20-29101560%10-193520%0-9228%练习找出第40个百分位数;分数32对应的百分等级。XfcfC%40-49425100%30-3962184%20-29101560%10-193520%0-9228%茎叶图数据茎叶图 83 82 63 62 93 78 71 68 33 76 52 97 85 42 46 32 57 59 56 73 74 74 81 76排序: 97 93 85 83 82 81 78 76 76 74 73 71 68 63 62 59 57 56 52 46 42 33 32 3 234 265

6、62796 2837 9 37茎叶茎叶图茎叶图: 将每个数字分为两个部分,数字的第一位或前几位被称为茎,数字的后几位或最后一位被称为叶。如X=85的茎为8,叶为5。思考:茎叶图和频数分布的比较?茎叶图1茎叶图2集中趋势平均数中数 众数集中趋势集中趋势 是一个统计测量,它确定了能够代表分布中心的一个数值。集中趋势的目的是找到最典型的或最能代表整个组的单个数值。目标:确认“平均的”或“典型的”个体。注意:没有一种测量集中趋势的代表性数值的方法适用于所有情况。(正态分布,偏态分布)平均数算术平均数:将分布中的所有数据相加并除以数据的个数得到的值。总体平均数:样本平均数:加权平均数第一个样本:n=12

7、,M=6;第二个样本:n=8,M=7;如果将两个样本合并,整体组的平均数是多少?加权平均数注意: 整体平均数并非原先两个样本的平均数中心。由于两个样本大小不同,其中一个对整体组做出了更大贡献,因此,决定整体平均数时占了更大权数。中数中数:恰好将一个分布一分为二的数值。分布中恰好有50%的个体具有小于或等于中数的数值。中数也相当于 第50个百分位数。中数当N为奇数时: 将所有数据由低至高按顺序排列,中数就是排在中间的那个分数 3,5,8,10,11 中数是?当N为偶数时: 将所有数据由低至高按顺序排列,并找出中间的两个数,它们的平均值即为中数。 3,3,4,5,7,8 中数是?众数众数:在一个频

8、数分布中,众数是具有最大频率的分数或类别。一个分布可能具有多个众数。术语众数经常也被用来指那些具有相对高频数的值,如果有两个众数的话,频数较多的众数称为主要众数,频数较少的众数称为次要众数。选择一种集中趋势测量平均数:用到了分布中的每个数值,通常具有很好的代表性;与方差和标准差等最常见的变异性测量具有较紧密关系;通常被认为是三种集中趋势测量中最好的一种。但是存在一些特殊情况,无法计算平均数或平均数并不是特别具有代表性。何时使用中数一、极端数值和偏态分布 当一个分布含有几个与其他数值非常不同的极端数值时,平均数可能不能很好的代表分布。此时中数是一个较好的集中趋势测量。二、未确定数值 由于存在未确

9、定值,无法计算平均数,但是可以计算中数。何时使用中数三、尾端开放式分布 当一个分布的类别没有上限和下限时,该分布称为尾端开放式分布。此时也不可以计算所有数据的平均数,可以找出中数。孩子的个数(X)f5个或更多43210322364何时使用中数四、顺序量表 许多研究者认为,用平均数描述顺序数据的集中趋势是不对的。当用顺序量表的数据时,中数是较为合理、常采用的集中趋势测量。何时使用众数一、称名量表 众数主要优势是它可以用来测量和描述用称名量表测量数据的集中趋势。二、离散变量 此时众数是更加合理的集中趋势测量三、描述形状 经常作为额外的无成本的平均数和中数的补充测量。不仅测量集中趋势,而且表示了分布的形状。用图表示平均数和中数图形也可以用于报告和比较集中趋势测量。通常图形用于表示样本平均数,但有时候也可以用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论