统计心理-第四章-差异量数 课件_第1页
统计心理-第四章-差异量数 课件_第2页
统计心理-第四章-差异量数 课件_第3页
统计心理-第四章-差异量数 课件_第4页
统计心理-第四章-差异量数 课件_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 差异量数数据分布的基本特征集中趋势 (位置)偏态和峰态(形状)离中趋势 (分散程度)数据分布的另一个重要特征反映各变量值远离其中心值的程度(离散程度)从另一个侧面说明了集中趋势测度值的代表程度离中趋势差异量数差异量数是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数,用来表示数据之间的差异程度。差异量数包括:全距、四分位差、百分位差、平均差、标准差与方差等等。第一节 全距与百分位差一、全距 1. 定义 全距(range)又称两极差,用符号R表示,是说明数据离散程度的最简单统计量。 2. 计算 排序后 R越大,说明离散程度越大。第一节 全距与百分位差一、全距 3.

2、 全距的优缺点优点:计算简便、容易理解。缺点:粗糙,不灵敏; 易受极端值的影响; 易受取样变动的影响; 未考虑数据的分布。 全距只是一种低效的差异量数,主要用 于对数据的预备性检查,了解数据的大概 范围,以确定如何统计分组。1078910789二、百分位差(percentile)为了避免极端数据的影响,将数据的两端各截去10%,即P10和P90之间的距离作为差异量数。二、百分位差1.百分位数:又叫百分位点。它是指量尺上的一个点,在此点以下,包括数据分布中全部数据个数的一定百分比。第p百分位数就是指在其值为P的数据以下,包括分布中全部数据的百分之p,其符号为2.意义:(1)表示原始分数在次数分布

3、中特定地位的分数。(2)表示总体中有p%的分数小于等于PP。二、百分位差3.百分位数的计算4.百分位差 Pp为所求的第P个百分位数Lb为百分位数所在组的精确下限f为百分位数所在组的次数Fb为小于Lb的各组次数的和N为总次数i为组距。【例】:用下面的次数分布表计算该分布的百分位差P90-P10。组 别f向上累加次数65-115760-415655-615250-814645-1613840-2412235-349830-216425-164320-112715-91610-77合计157解:先计算P90和P10两个百分位数。 (如何确定PP所在的组位?)二、百分位差5.百分等级:利用百分位数的计

4、算公式也可以计算出任意分数在整个分数分布中所处的百分位置,称为该分数的百分等级。6.百分等级的计算PR:百分等级X :对应的原始分数 f:该分数所在组的次数Lb:该分数所在组的精确下限Fb:小于L的各组次数之和N:总次数 i:组距百分等级一般只用整数不用小数。例:如下表示,求分数为77的百分等级分数。组别fF80787674724719125474336175三、四分位差 四分位数(quartile):数据排序或编成次数分布表后,把总频数分成相等四部分的分界点称为四分点或四分位,四分点位置的量数称为四分位数,用Q表示。 Q1Q2Q325%25%25%25%四分位差,也可视为百分位差的一种,通常

5、用符号Q来表示,指在一个次数分配中,中间50%次数距离的一半。在一组数据中,它的值等于P25到P75距离的二分之一。Q1Q2Q325%25%25%25%三、四分位差由于P25之下占有总次数的四分之一,故P25又称为第一四分位(Q1),中数或P50称为第二四分位(Q2),P75称为第三四分位(Q3) 。四分位差就是第三四分位与第一四分位之差的一半。Q1Q2Q325%25%25%25%三、四分位差Q = (Q3 Q1)/2排序后处于25%和75%位置上的值三、四分位差也称为内距或四分间距2. 反映了中间50%数据的离散程度3. 不受极端值的影响4. 用于衡量中位数的代表性5. 可用于顺序数据、数值

6、型数据,但不能用于分类数据顺序数据的四分位数解:Q1位置= 300(1/4) =75 Q3位置 =300(3/4 ) =225 从累计频数看, Q1在“不满意”这一组别中; Q3在“一般”这一组别中 四分位数为 Q1 = 不满意 Q3 = 一般甲城市家庭对住房状况评价的次数分布回答类别甲城市次数 (户)累计次数 非常不满意 不满意 一般 满意 非常满意 24108 93 45 30 24132225270300合计300四分位差解:设非常不满意为1,不满意为2, 一般为3, 满意为 4, 非常满意为5 。 已知 Q1= 不满意 = 2 Q3 = 一般 = 3四分位差: Q= (Q3- Q1)

7、/2 = (3 2)/2 = 0.5甲城市家庭对住房状况评价的次数分布回答类别甲城市次数 (户)累计次数 非常不满意 不满意 一般 满意 非常满意 24108 93 45 30 24132225270300合计300四分位差如果是对未分组的数据求四分位差,Q1和Q3可依照未分组数据求中数的方法求得。在分组数据中,Q1和Q3计算方法如下: 已分组归类数据求四分差组限次数自下而上累计次数算法:计算累计次数N=50计算四分位数与四分差: 959085807570656055146912854150494539 30181051思考几个概念之间的关系百分位数 百分位差 百分等级四分位数 四分位差中位数

8、?第二节 平均差、方差与标准差一、平均差1. 意义: 次数分布中所有原始数据与平均数绝对离差的平均值。一般用符号A.D.或M.D. 来表示。2. 计算:(1)原始数据求平均差例题:有5名被试的错觉实验数据如下,求其平均差。被试12345错觉量(ms)1618202217第二节 平均差、方差与标准差一、平均差2.计算:(2)分组数据求平均差分组数据求平均差组限f计算9590858075706560551469128541979287827772676257合计50分组数据求平均差组限f计算959085807570656055146912854197928782777267625719.714.7

9、9.74.70.35.310.315.320.3合计50分组数据求平均差组限f计算959085807570656055146912854197928782777267625719.714.79.74.70.35.310.315.320.319.758.858.242.33.642.451.561.220.3合计50358.03.平均差的优缺点 优点:平均差是根据全部数值计算的,受极端值影响较全距小。 缺点:由于采取绝对值的方法消除离均差的正负号,应用较少。 一、平均差二、方差与标准差(一)方差与标准差的意义1.平均差:2.方差: 方差是度量数据分散程度的一个很重要的统计量。二、方差与标准差(一

10、)方差与标准差的意义2.方差:3.标准差: 方差与标准差是最常用的描述次数分布离散程度的差异量数。(二)方差与标准差的计算计算6,5,7,4,6,8这一组数据的方差和标准差。(二)方差与标准差的计算 1. 基本公式: 2. 原始量数求标准差的公式: (二)方差与标准差的计算计算6,5,7,4,6,8这一组数据的方差和标准差。(二)方差与标准差的计算 1. 基本公式: 2. 原始量数求标准差的公式: 3. 由次数分布表求标准差: (1)由简单次数分布表求S: 3. 由次数分布表求标准差:(2)由分组次数分布表求S: (三)总标准差的合成注意:只有应用同一种观测手段,测量同一个特质,只是样本不同时

11、,才能应用该公式合成方差和标准差。例:在三个班级进行某项能力研究,三个班测查结果的平均数和标准差分别如下,求三个班的总标准差。班级人数n平均分标准差1234538407578699810例:求总标准差解:求总平均数: 求 ,填入表内第5、6、7列。 例:在三个班级进行某项能力研究,三个班测查结果的平均数和标准差分别如下,求三个班的总标准差。班级人数n平均分标准差12345384075786998101.024.02-4.981.0416.1624.88164100例:求总标准差解:求总平均数:求 ,填入表内第5、6、7列。代入公式:1. 性质 方差是对一组数据中各种变异的总和的测量,具有可加性

12、和可分解性。统计实践中常利用方差的可加性去分解和确定属于不同来源的变异性(如组内、组间等),并进一步说明各种变异对总结果的影响,是统计推论中最常用的统计特征数。(四)方差与标准差的性质和意义(1)1. 性质 标准差是方差的平方根,不可以进行代数计算,但有以下特性。 每一个观测值都加上一个相同常数C之后,计算得到的标准差等于原标准差。 每一个观测值都乘以一个相同的常数C,则所得的标准差等于原标准差乘以这个常数。 以上两点相结合,每一个观测值都乘以同一个常数C(C0),再加上一个常数d,所得的标准差等于原标准差乘以这个常数C。(四)方差与标准差的性质和意义(2)2.方差与标准差的意义 方差与标准差

13、是表示一组数据离散程度的最好指标。其值越大,说明次数分布的离散程度越大,该组数据较分散;其值越小,说明次数分布的数据比较集中,离散程度越小。(四)方差与标准差的性质和意义(3)2.方差与标准差的意义标准差的优势:反应灵敏; 计算公式严密确定; 容易计算; 适合代数运算; 受抽样变动影响小; 简单明了。(四)方差与标准差的性质和意义(4)第三节 标准差的应用标准差“绝对差异量”绝对差异量的比较不适用于下列条件:(1)两个或两个以上样本所使用的观测工具不同,所测的特质不同(标准差的单位不同);(2)两个或两个以上样本使用的是同一种观测工具,所测的特质相同,但样本间的水平相差较大(平均数明显不同)。

14、 相对差异量数第三节 标准差的应用一、差异系数(一)意义:又称变异系数、相对标准差等,用CV来表示。用公式表示为: (二)差异系数的适用条件同一团体不同观测值离散程度的比较;对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。(三)差异系数的应用例1:已知某小学一年级学生的平均体重为25千克,体重的标准差为3.7千克;平均身高为110厘米,标准差为6.2厘米,问体重与身高的离散程度哪个大?(同一团体不同观测值)例2:某市2个月组女童的体重平均数为5.45千克,标准差为0.62千克;6岁组女童的平均体重为19.02千克,标准差为2.12千克。试比较两组女童体重的离散情况(

15、不同团体不同水平的同一种特质)(四)应用差异系数的注意事项测量的数据要保证具有等距尺度,这时计算的平均数和标准差才有意义,应用差异系数进行比较才有意义。观测工具应具备绝对零,这时应用差异系数去比较分散程度效果才更好。因此,差异系数常用于重量、长度、时间、编制得好的测验量表范围内。差异系数只能用于一般的相对差异量的描述,至今尚无有效的假设检验方法,因此差异系数不能进行统计推论。二、标准分数(一)标准分数(standard score)的定义 又称基分数或Z分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。 原始量数与其平均数的差数,除以标准差所得的商,称之为标准分数。用公式表

16、示: 标准分数从分数对平均数的相对地位、 该组分数的离中趋势两个方面来表示原始 分数的地位。(二)标准分数的计算X96908685838281807572(二)标准分数的计算X96908685838281807572137320-1-2-3-8-11二、标准分数(三)标准分数的意义1.无实际单位,与原始分数和平均数的距离成正比,与标准差成反比(-,+,0);2.表明原分数在该组数据分布中的位置,故称为相对位置量数;3. 当把原始分数转换为Z分数后,只需要看Z分数的数值和正负号,就立即可以明确每一个原始分数的相对地位,因而比平均数和原分数表达了更多的信息。 二、标准分数(四)标准分数的性质 (1

17、)Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量。 (2)一组原始分数转换得到的Z分数可以是正值,也可以是负值。 (3)所有原始分数的Z分数之和为0, Z分数的平均数也为0,即 (4)一组原始数据的各个Z分数的标准差为1,即 。 (5)若原始分数呈正态分布,则转换得到的所有Z分数值服从均值为0,标准差为1的标准正态分布。(五)标准分数转换的意义例:某班平均成绩为90分,标准差为3分,甲生得了94.2分,乙生得了89.1分,求甲乙二学生的Z分数各是多少?(五)标准分数转换的意义 把原始分数转换成Z分数,就是把单位不等距的和缺乏明确参照点的分数转换成以1为标准差,以0为参照点的分

18、数,从而可以明确各个原始分数的相对地位,分数间可以相互比较。(六)标准分数的优点 1.可比性(均值为0,标准差为1) 2.可加性(不受原始分数单位影响) 3.明确性(根据标准正态分布表,由标准分数可以知道该分数在全体分数中的位置,即百分等级) 4.稳定性(转换为标准分数后,标准差为1,保证不同性质分数在总分数中的同等权重)1.比较几个性质不同的观测值在各自数据分布中相对位置的高低 例:测验一个班级的数学成绩,平均数为80分,标准差为8分;又测验了该班的语文成绩,平均数为70分,标准差为5分。甲生在数学测验中得81分,在语文测验中得78分,问该生哪一学科的成绩在班上比较好?(七)标准分数的应用身

19、高与体重2.计算不同质观测值的总和或平均值,以表示在团体中的相对位置例:在招生考试时,有甲、乙两考生的各科成绩如下表,如果这两个考生只录取一个,应录取哪位考生?(七)标准分数的应用考试科目个人分数全体考生甲乙平均分标准差语文数学外语政治历史74873278708982506065708035756812811107合计341346(七)标准分数的应用考试科目个人分数全体考生个人标准分甲乙平均分标准差甲乙语文数学外语政治历史748732787089825060657080357568128111070.330.88-0.270.300.281.580.251.36-1.50-0.42合计3413

20、462.计算不同质观测值的总和或平均值,以表示在团体中的相对位置例:在招生考试时,有甲、乙两考生的各科成绩如下表,如果这两个考生只录取一个,应录取哪位考生?(七)标准分数的应用考试科目个人分数全体考生个人标准分甲乙平均分标准差甲乙语文数学外语政治历史748732787089825060657080357568128111070.330.88-0.270.300.281.580.251.36-1.50-0.42合计3413461.5211.272.计算不同质观测值的总和或平均值,以表示在团体中的相对位置例:在招生考试时,有甲、乙两考生的各科成绩如下表,如果这两个考生只录取一个,应录取哪位考生?3

21、. 表示标准测验分数 为了克服标准分数出现的小数、负数和不易为人们所接受等缺点,常常是将其转换成正态标准分数。(七)标准分数的应用4. 异常值的取舍 在一个正态分布中,平均数上下一定的标准差处,包含有确定百分数的数据个数。 根据这个原理,整理数据时,常采用三个标准差法取舍数据。 即如果数据值落在平均数加减三个标准差之外( ),则在整理数据时,可将此数据作为异常值舍弃。 (七)标准分数的应用第四节 差异量数的选用(一)良好的差异量数应具备的条件: 反应灵敏。 代表性强。 含义简明。 较为可靠,不易受两极量数的影响。 适合于代数运算。(二)各种差异量数的比较: 各种差异量数的比较差异量数优点缺点全

22、距百分位差四分位差平均差方差标准差 差异系数 标准分数各种差异量数的比较差异量数优点缺点全距计算简便,易理解,所有类型数据粗糙,极值影响百分位差易计算,易理解,无极值影响无法反映中间数值差异情况四分位差反映中间数值差异情况,无极值影响无法反映全部数据差异情况平均差易理解,易计算,反映全部数据差异情况绝对值不适合代数运算方差可加性,可分解性,推论统计中最常用描述作用不大标准差考虑全部数据,适合代数运算、抽样影响小难理解、运算繁琐、极值影响 差异系数比较两组数据的离散程度只能描述和比较,不适合统计运算 标准分数可比(具体分数其分布中的相对位置)可加(不同质分数的加和或平均)第四节 差异量数的选用(一)良好的差异量数应具备的条件: 反应灵敏。 代表性强。 含义简明。 较为可靠,不易受两极量数的影响。 适合于代数运算。(二)各种差异量数的比较: 标准差和方差为高效差异量。 课堂练习1. 在差异量数中性能较好的统计量是_。A. 平均差B. 四分位差C. 标准差D

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论