第四章-差异量数课件_第1页
第四章-差异量数课件_第2页
第四章-差异量数课件_第3页
第四章-差异量数课件_第4页
第四章-差异量数课件_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章差异量数有如下三组数据:A:7,7,8,8,8,9,9M=8B:4,5,7,8,9,11,12M=8C:1,4,7,8,9,12,15M=8图4-1平均数相同的三组数据分布图这三组数据的平均数都是8,但它们的整齐程度显然不一样。可见,对于一组数据只用集中量数来代表还不能全面反映情况,还须有反映其变异性(整齐程度,或离中趋势)的度量,变异性实质上刻化了集中量数的代表性程度。要想描述一组数据的全貌,必须同时使用集中量数和差异量数。因为集中量数描述数据的典型性特点,差异量数描述数据的变异性特点。差异量数:离散量数,是指对一组数据的变异性,即离中趋势特点进行度量和描述的统计量。差异量数越大,表明数据分布越分散、越不集中;差异量数越小,表明数据分布越集中,变动范围越小。常用的差异量数主要有:全距、四分位差、百分位差、平均差、标准差与方差等。第一节全距与百分位差一、全距全距(Range,R):两极差,一组数据的最大值与最小值之差。R=Xmax-Xmin全距是说明数据离散程度的最简单的统计量。如果两极端值有偶然性或属于异常值时,全距不稳定、不可靠、也不灵敏;受抽样变动影响。二、百分位差(百分位距)百分位数(Percentile):百分位点,是指量尺上的一个点,在此点以下,包括数据分布中全部数据个数的一定百分比。百分位差是指两个百分位数之差。常用的百分位距有两种:P90-P10和P93-P7。用几个百分位距能较好地反映一组数据的差异程度。(一)百分位数的计算公式Pp:所求的第P个百分位数;Lb:百分位数所在组的精确下限;f:百分位数所在组的次数;Fb:小于Lb的各组次数的和;N:总次数;i:组距。向上累加频数分布表,求百分位数的步骤:1.找到P百分位数所对应的名次,即nP%;2.从累加频数中找到该名次所在的分组,以及该组的频数f和组距i;3.找到该分组区间精确下限值Lb和此值以下的累加频数Fb;4.代入公式即可算出Pp值。例4-1用下面的次数分布表计算该分布的百分位差P90-P10。组别f向上累加次数65~115760~415655~615250~814645~1613840~2412235~349830~216425~164320~112715~91610~77合计157解:157×10/100=15.70157×90/100=141.30P90-P10=51.56-19.33=32.23(二)百分位数与百分等级利用百分位数的计算公式可以计算出任意分数在整个分数分布中所处的百分位置,称为该分数的百分等级(percentilerank,PR)。百分等级是一种相对位置量数,是百分位数的逆运算。当分数按照大小顺序排列后,用百分等级就可以表示任何一个分数在该团体中的相对位置。百分等级的计算公式PR:百分等级;X:给定的原始分数;f:该分数所在组的频数;Lb:该分数所在组的精确下限;Fb:小于Lb的各组次数的和;N:总次数;i:组距。三、四分位差四分位差(quartiledeviation,Q):百分位差的一种,指在一个次数分布中,中间50%的次数的距离的一半。四分位差反映了数据分布中中间50%数据的散布情况。P25、P75与中位数一起把整个数据的次数等分为四部分,因此称它们为四分值,或四分位数(quartile)。四分位距是第三个四分位数与第一个四分位数之差的一半,计算公式为四分位差通常与中位数联系起来共同应用。第二节平均差、方差与标准差一、动差体系中心动差:以平均数为原点的动差。常见的中心动差:一级动差二级动差三级动差四级动差平均差(averagedeviation,A.D.;meandeviation,M.D.):次数分布中所有原始数据与平均数绝对离差的平均值。例4-2有5名受试的错觉实验数据如下,求其平均差。被试12345错觉量(ms)1618202217解:已知N=5,=18.6原始数据计算公式次数分布表计算公式三、方差与标准差(一)定义公式方差与标准差是最常用的描述次数分布离散程度的差异量数。例4-3计算6,5,7,4,6,8这一组数据的方差和标准差。解:平均数:方差标准差(二)原始分数计算公式例4-3计算6,5,7,4,6,8这一组数据的方差和标准差。解:(三)计算分组数据的方差与标准差组距离差计算法分组区间XCfdfdfd296~9726127293~9435157590~9144166487~8883247284~85112224481~82171171778~791900075~7614﹣1﹣141472~7310﹣2﹣204069~707﹣3﹣216366~673﹣4﹣124863~641﹣5﹣52560~611﹣6﹣636合计10028570分组数据求方差与标准差的步骤标准差(三)总标准差的合成方差具有可加性。需要注意的是,只有在应用同一种观测手段,测量的是同一种特质,只是样本不同的数据时,才能计算合成方差或标准差。例4-4在三个班级进行某项能力研究,三个班测查结果的平均数和标准差分别如下,求三个班的总标准差。班级ns14210316236110123509817解:①∑Ni=42+36+50=128②标准差(四)方差与标准差的性质和意义1.性质方差具有可加性和可分解性。标准差:(1)每一个观测值都加上一个相同常数C之后,计算得到的标准差等于原标准差。(2)每一个观测值都乘以一个相同的常数C(C≠0),则所得的标准差等于原标准差乘以常数C。(3)每一个观测值都乘以同一个常数C(C≠0),再加一个常数d,则所得的标准差等于原标准差乘以常数C。2.方差与标准差的意义方差与标准差是表示一组数据离散程度的最好指标,是统计分析中最常用的差异量数。标准差具备一个良好的差异量数应具备的条件:反应灵敏、计算公式严密确定、容易计算、适合代数运算、受抽样变动影响小、简单明了。切比雪夫定理随机变量落在平均值附近的概率与标准差有一定的数量关系。对于任何一个数据集合,至少有的数据落在平均数的h(h为大于1的实数)个标准差之内。如果数据呈正态分布,则落在平均数上下一个标准差之内的占68.26%,落在平均数上下两个标准差之内的占95.45%,落在平均数上下三个标准差之内的占99.73%。第三节标准差的应用一、差异系数差异系数(coefficientofvariation,CV):变异系数、相对标准差,是一种相对差异量,指标准差与其算术平均数的百分比。差异系数在心理与教育研究中常用于:①同一团体不同观测值离散程度的比较;②对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。例4-5已知某小学一年级学生的平均体重为25千克,体重的标准差是3.7千克,平均身高110厘米,标准差为6.2厘米,问体重与身高的离散程度哪个大?解:差异系数的应用条件:测量的数据要保证具有等距尺度;观测工具应具备绝对零;差异系数只能用于一般的相对差异量的描述。二、标准分数标准分数(standardscore),又称为基分数或Z分数(Z-score),是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。标准分数从分数对平均数的相对地位、该组分数的离中趋势两个方面来表示原始分数的地位。(一)计算公式例4-7某班平均成绩为90分,标准差为3分,甲生得94.2分,乙生得89.1分,求甲乙二学生的Z分数各是多少?解:(二)标准分数的性质1.Z分数无实际单位,是以平均数为参照点、以标准差为单位的一个相对量。2.一组原始分数转换得到的Z分数既有正值,也有负值,所有原始分数的Z分数之和为零,即∑Z=0,。3.一组原始数据中,各个Z分数的标准差为1,即sZ=1。4.若原始分数呈正态分布,则转换得到的所有Z分数值呈均值为0,标准差为1的标准正态分布。(三)标准分数的优点可比性可加性明确性稳定性(四)标准分数的应用1.用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。例4-8某年高考理科数学全国平均成绩65分,标准差是12.5分。考生A、B、C三人的数学原始分数是50分、65分、85分。求他们的标准分数是多少?2.计算不同质的观测值的总和或平均值,以表示在团体中的相对位置。例4-9A、B两个学生在三种考试中的分数见下表,试比较二人的分数是否有差别。

考试sXAXBxAxBZAZB1708709002002.5255457512-40.5-1342545403-20.6-0.4∑1721811.11.1例4-10下表是高等学校入学考试中两名考生甲与乙的成绩分数。试问根据考试成绩应优先录取哪名考生?考试科目原始分数全体考生Z分数甲乙平均分标准差甲乙语文858970101.51.9政治706265510.6外语68726980.1250.375数学53405060.51.67理化72877580.3751.5∑3483502.51.5053.表示标准测验分数经过标准化的心理和教育测验,常常用标准分数表示测验结果。如果其常模分数分布接近正态分布,为了克服标准分数出现的小数、负数和不易为人们所接受等缺点,常常是将其转换成正态标准分数。转换公式为:三、异常值的取舍表4-2全距与标准差的比率随N变化率N510152040501002004005007001000R/s2.33.13.53.74.34.55.05.55.96.16.36.5第四节差异量数的选用一、优良差异量数具备的标准1.应该是根据客观数据资料获得的,而不是人为的主观估计决定的;2.应该是根据全部观测值计算得出来的,而不是个别数据计算的结果,否则就不能代表全部数据的分布特征;3.应当简明,容易理解,不应过于带有数学抽象性质;4.计算应该方便、容易、迅速;5.应该最少受到抽样变动的影响(样本的稳定性),在反复取样过程中具有相对恒常性;6.应当能够采用代数方法计算。二、各种差异量数优缺点比较标准差方差全距平均差百分位差四分位差三、各种差异量数之间的关系当次数分布的N值相当大,分布形式呈正态分布时,各种差异量数之间存在着固定的数量关系:s=1.2533AD=1.4826QAD=0.7979s=1.1829QQ=0.6745s=0.8453AD四、如何选用差异量数1.当样本是随机取样时,s、Q、R三个差异

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论