




已阅读5页,还剩52页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
现代心理与教育统计学,南昌大学教育学院心理李力,第四章差异量数,学习目标1、离散程度各测度值的计算方法2、离散程度各测度值的特点及应用场合3、偏态与峰态的测度方法,离中趋势,数据分布的另一个重要特征反映各变量值远离其中心值的程度(离散程度)从另一个侧面说明了集中趋势测度值的代表程度不同类型的数据有不同的离散程度测度值,全距(极差)(range),一组数据的最大值与最小值之差离散程度的最简单测度值易受极端值影响未考虑数据的分布,R=max(xi)-min(xi)*R越大,说明离散程度越大。,计算公式为,百分位差(percentile),为了避免极端数据的影响,将数据的两端各截去10%,即P10和P90之间的距离作为差异量数。,百分等级分数,表示分数在整个分数分布中所处的百分位置。,其中:PR:百分等级X:对应的原始分数f:该分数所在组的次数Lb:该分数所在组的精确下限Fb:小于L的各组次数之和N:总次数i:组距*百分等级一般只用整数不用小数。,例:如下表示,求分数为77的百分等级分数。,解:,百分位分数,意义:1、原始分数在次数分布中的特定地位分数。2、表示总体中有p%的分数小于PP。计算公式:,【例】:用下面的次数分布表计算该分布的百分位差P90-P10。,解:先计算P90和P10两个百分位数。(如何确定PP所在的组位?),四分位数(quartile),1、排序后处于25%和75%位置上的值,不受极端值的影响主要用于顺序数据,也可用于数值型数据,但不能用于分类数据,四分位数(位置的确定),原始数据:,顺序数据:,顺序数据的四分位数,解:Q1位置=(300)/4=75Q3位置=(3300)/4=225从累计频数看,Q1在“不满意”这一组别中;Q3在“一般”这一组别中四分位数为Q1=不满意Q3=一般,数值型数据的四分位数(9个数据的算例),【例】:9个家庭的人均月收入数据原始数据:15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789,数值型数据的四分位数(10个数据的算例),【例】:10个家庭的人均月收入数据排序:66075078085096010801250150016302000位置:12345678910,四分位差(quartiledeviation),对顺序数据离散程度的测度也称为内距或四分间距上四分位数与下四分位数之差的一半。Q=(Q3Q1)/2反映了中间50%数据的离散程度不受极端值的影响用于衡量中位数的代表性,四分位差,解:设非常不满意为1,不满意为2,一般为3,满意为4,非常满意为5。已知Q1=不满意=2Q3=一般=3四分位差:Q=(Q3-Q1)/2=(32)/2=0.5,平均差(meandeviation),各变量值与其均值离差绝对值的平均数能全面反映一组数据的离散程度数学性质较差,实际中应用较少,计算公式为,未分组数据,组距分组数据,【例】:有5名被试的错觉实验数据如下,求其平均差。解:已知n=5x=18.6,平均差,求该电脑公司销售量的平均差,解:,含义:每一天的销售量平均数相比,平均相差17台,方差和标准差(varianceandstandarddeviation),为了避免负数出现,数据离散程度的最常用测度值反映了各变量值与均值的平均差异根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差,总体方差计算公式:总体标准差的计算公式:,样本方差和标准差(simplevarianceandstandarddeviation),未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,方差的计算公式,标准差的计算公式,样本方差自由度(degreeoffreedom),一组数据中可以自由取值的数据的个数当样本数据的个数为n时,若样本均值x确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值例如,样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当x=5确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差2时,它是2的无偏估计量,方差、标准差的计算,原始数据:【例】:计算6、5、7、4、6、8、这一组数据的方差和标准差。解:(1)公式法计算(2)计算器计算法,分组数据的样本标准差计算,样本标准差,含义:每一天的销售量与平均数相比,平均相差21.58台。*计算器的算法?!,总标准差的合成:,【例】:在三个班级进行某项能力研究,三个班测查结果的平均数和标准差如下,求三个班的总标准差。,方差和标准差的性质和意义,性质(1)每一个观测值都加上一个相同常数C之后,计算得到的标准差等于原标准差。(2)每一个观测值都乘以一个相同的常数C,则所得的标准差等原标准差乘以这个常数。(3)每一个观测值都乘以同一个常数C(C0),再加一个常数d,所得的标准差等于原标准差乘以这个常数C。,意义:,(1)方差与标准差是表示一组数据离散程度的最好指标。其值越大,次数分布越分散,反之,其值越小,离散越小。(2)标准差具备一个良好的差异量数应具备的条件:反应灵敏,每个数据取值变化,方差与标准关都随之变化;计算公式严密确定;容易计算;适合代数运算;受抽样变动影响,即不同样本的标准差或方差比较稳定;简单明了,这一点其他差异量数比较稍有不足,但其意义还是较明确的。(3)标准差与其他各种差异量数相比,具有数学上的优越性,特别是当已知一组数据的平均数与标准差后,就可以知道落在平均数上下各一个标准差、两个标准差,或三个标准差范围内的数据所占的百分比。,标准差的应用差异系数标准分数,差异系数(coefficientofvariation),1.标准差与其相应的均值之比2.对数据相对离散程度的测度3.消除了数据水平高低和计量单位的影响4.用于对不同组别数据离散程度的比较5.计算公式为,差异系数,【例】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度,解:,结论:计算结果表明,cv10为右偏分布4.偏态系数0为左偏分布,偏态系数(skewnesscoefficient),根据原始数据计算根据分组数据计算,偏态系数,偏态系数,结论:偏态系数为正值,但与0的差异不大,说明电脑销售量为轻微右偏分布,即销售量较少的天数占据多数,而销售量较多的天数则占少数,峰态,峰态(kurtosis),统计学家Pearson于1905年首次提出数据分布扁平程度的测度峰态系数=0扁平峰度适中峰态系数0为尖峰分布,峰态系数(kurtosiscoefficient),根据原始数据计算根据分组数据计算,峰态系数,结论:偏态系数为负值,但与0的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 对于新手的2025年育婴师考试指导及试题及答案
- 教师资格考试教育技术应用试题及答案
- 教师资格笔试中的应试技能试题及答案
- 突破盲点的初级会计师试题及答案
- 期待2025年公共营养师考试的变化试题及答案
- 2025届广东省揭阳市重点名校高三第二学期期终教学监控物理试题
- 2025年育婴师考试的内容设置与逻辑分析试题及答案
- 现金管理策略试题及答案
- 公共关系数试题及答案
- 护理直升面试题及答案
- 高中化学常见晶体的结构及晶胞
- 着色探伤作业指导书
- 2002-2022广东省深圳市中考数学历年真题(共24套最全)学生版+解析版
- 2022年法考重难点专题刑法习题及答案解析
- GB/T 5900.1-2008机床主轴端部与卡盘连接尺寸第1部分:圆锥连接
- GB/T 4857.13-2005包装运输包装件基本试验第13部分:低气压试验方法
- GB/T 28724-2012固体有机化学品熔点的测定差示扫描量热法
- GB/T 23743-2009饲料中凝固酶阳性葡萄球菌的微生物学检验Baird-Parker琼脂培养基计数法
- 祛痰药镇咳药课件
- AVAYAIP电话IPO500产品介绍课件
- 煤制甲醇生产工艺仿真演示模型流程说明
评论
0/150
提交评论