




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关于常用统计量数第一页,共八十二页,2022年,8月28日描述统计(descriptivestatistics)描述统计对数据特征进行描述数据的两个主要特征中心位置离散性第二页,共八十二页,2022年,8月28日Outline第一节集中量数一、算术平均数二、几何平均数三、中数与众数第二节差异量数一、平均差二、方差与标准差三、差异系数第三节地位量数一、百分位分数二、百分等级分数第三页,共八十二页,2022年,8月28日第一节集中量数一、算术平均数二、几何平均数三、中数与众数第四页,共八十二页,2022年,8月28日集中量数集中量数对数据的集中趋势的度量确定一组数据的代表值第五页,共八十二页,2022年,8月28日常用的集中量数算术平均数mean加权平均数几何平均数geometricmean中数median众数mode第六页,共八十二页,2022年,8月28日问题某部门有5名一般职员和1名经理。一般职员的薪水是3000元,而经理的薪水是10000元,请问该部门收入的平均水平是多少?第七页,共八十二页,2022年,8月28日算术平均数:可简称为平均数或均数,是用以度量次数分布集中趋势及位置最常用的集中量数。(一)总体平均数与样本平均数(二)加权平均数第八页,共八十二页,2022年,8月28日(三)算术平均数的性质1.每一个观测值加上一个相同常数C,其平均数为原来的平均数加常数C2.每一个观测值乘以一个相同常数C,其平均数为原来的平均数乘常数C3.每个观测值都乘以一个相同常数c,再加上一个常数d后,计算得到的平均数等于原平均数乘以该常数c再加上常数d4.观测值与平均数的差(离均差)的总和等于零5.观测值与任意常数C的离差平方和不小于观测值与平均数的差的平方和。-离差平方和最小,样板平均数是总体平均数的最佳估计。第九页,共八十二页,2022年,8月28日算术平均数的优点反应灵敏,确定严密,简明易解,计算简便并能作进一步的代数演算,是应用最普遍的一种集中量数。适用情境:数据准确可靠,且又同质,需要每一个数据都能加入计算,同时还要作进一步的代数运算时,一般都用算术平均数表示集中趋势。易受极端数据影响、出现模糊数据和存在不同质数据时无法计算第十页,共八十二页,2022年,8月28日几何平均数适用条件:1.一组数据中任何两个相邻数据之比接近于常数,即数据按一定比例关系变化。在教育与心理研究中,求平均增长率或对心理物理学中的等距与等比量表实验进行数据处理,均应使用几何平均数。2.当一组数据中存在极端数据时,分布呈偏态,算术平均数不能很好地反映数据的典型情况,此时应使用几何平均数或其他集中量数(如中数、众数)来反映数据的典型情况。第十一页,共八十二页,2022年,8月28日(一)几何平均数的基本公式第十二页,共八十二页,2022年,8月28日(二)几何平均数在教育与心理研究中的应用1.心理物理学中等距与等比量表实验的数据处理2.平均增长率的计算第十三页,共八十二页,2022年,8月28日(一)中数中数又称中位数,符号记为Mdn。中数是指位于一组数列中中间位置的那个数,它可以是数列中的某一个原始数据,也可以不是原始数据而是通过计算得到的一个数。总之,如果将一组数据按大小排列,则中数一定是将数据个数平均分为大小相等两部分的那个数。中数的特点:计算简单,不受极端数据影响,但由于是根据数据的相对位置来确定的,在计算时不是每个数据都加入,从而有较大的抽样误差,不如平均数稳定,且会流失很多的被试信息,同时,中数难以作进一步的代数运算第十四页,共八十二页,2022年,8月28日(二)众数众数又称为范数,常用Mo表示。众数指次数分布中出现次数最多的那个数的数值。适用条件:当一组数据中出现不同质的情况,或分布中出现极端数据时,常用众数作为集中量数的粗略估计。计算众数的皮尔逊经验法:Mo=3Mdn-2M第十五页,共八十二页,2022年,8月28日众数
Mode,Mo众数:一组数据中出现次数最多的数如2、3、5、3、4、3、6的众数为3如果次数分布最多的有两个数,而且两个数是相邻的,那么一般取两者的平均值作为众数;如果这两个数不相邻,那么一般需要报告两个众数,而且认为该组数据是bimodal双峰分布的第十六页,共八十二页,2022年,8月28日第二节差异量数一、平均差二、方差与标准差三、差异系数第十七页,共八十二页,2022年,8月28日离中趋势的度量
数据离中趋势是表示数据分散程度的一组统计量,反映的是各变量值远离其中心值的程度。表示数据离中趋势的测度有:平均差、方差、标准差、四分位差、极差(全距)、变异系数等。第十八页,共八十二页,2022年,8月28日一、平均差(Meandeviation)1.定义:也称平均离差,次数分布中所有原始数据与平均数举例的绝对值的平均,用AD表示。2.计算公式平均差的数学性质不是最优的,在实际应用中应用较少。第十九页,共八十二页,2022年,8月28日二、方差(Variance)与标准差(Standarddeviation)
方差与标准差事最经常用于描述次数分布离散程度的差异量数。(一)总体方差与总体标准差(二)样本方差与样本标准差(三)标准差的合成(四)方差与标准差的意义第二十页,共八十二页,2022年,8月28日方差与标准差的定义方差:每个数据与该组数据平均数之差乘方后的均值,即离均差平方和的平均数。标准差:方差的算术平方根,表示一列数据的平均差距。第二十一页,共八十二页,2022年,8月28日(一)总体方差与总体标准差总体方差的表示:总体标准差的表示:第二十二页,共八十二页,2022年,8月28日(二)样本方差与样本标准差样本方差的表示:样本标准差的表示:样本方差为什么要除以(n-1)与自由度(degreesoffreedom)有关。自由度是数学名词,在统计学中,n个数据如不受任何条件的限制,则n个数据可取任意值,称为有n个自由度。若受到k个条件的限制,就只有(n-k)个自由度了。计算样本方差时,n个变量值本身有n个自由度。但受到样本均数的限制,任何一个“离均差”均可以用另外的(n-1)个“离均差”表示,所以只有(n-1)个独立的“离均差”,因此只有(n-1)个自由度。第二十三页,共八十二页,2022年,8月28日(三)标准差的合成方差具有可加性。在已知几个组方差或标准差的情况下,可以计算她们的总方差或总标准差。-只有在应用同一种观测手段,对不同样本的统一特质进行测量时才能使用。标准差的合成,:总平均数;:各小组的平均数i第二十四页,共八十二页,2022年,8月28日练习表4个学习小组的竞赛成绩学习小组nSA20808B18757C16708D20706∑74——第二十五页,共八十二页,2022年,8月28日(四)标准差的性质1.每一个观测值都加一个常数c后,计算得到的标准差等于原标准差。2.每一个观测值都乘以一个常数c,则所得的标准差等于原标准差乘以这个常数。3.每个观测值都乘以同一个常数c(c≠0),再加上一个常数d,所得标准差等于原标准差乘以这个常数c。第二十六页,共八十二页,2022年,8月28日方差和标准差的优缺点(1)反应灵敏;(2)计算严密;(3)受抽样变动影响小(1)不太容易理解;(2)易受极端数值影响;(3)有个别数值模糊不清时,无法计算。方差和标准差是表示一组数据离散程度的最好指标。值越大,说明次数分布的离散程度越大。第二十七页,共八十二页,2022年,8月28日三、差异系数(Coefficientofvariation)1.差异系数也叫变异系数,它是一种相对差异量,常用CV表示。是一组数据的标准差与其相应的均值之比。2.计算公式第二十八页,共八十二页,2022年,8月28日差异系数的适用情境变异系数指出了标准差相对于平均值的大小,用于比较不同总体或样本数据的离散程度。(1)同一团体不同测量的变异的比较,如相同班级不同科目的变异的比较;-两个或两个以上样本所测的特质不同(2)不同团体同一测量的变异的比较,如不同年级同一科目变异大小的比较。-两个或两个以上样本所测的特质相同,但样本间的水平相差较大。第二十九页,共八十二页,2022年,8月28日练习1已知某小学一年级学生的平均体重为25公斤,体重的标准差是3.7公斤,平均身高110厘米,标准差位6.2厘米,问体重与身高的离散程度哪个大?2通过同一个测验,一年级学生的平均分数为60分,标准差为4.02分,五年级学生的平均分数为80分,标准差为6.04分,这两个年级的测验分数中哪一个分散程度大?第三十页,共八十二页,2022年,8月28日全距(range)也称两极差,是一组数据的最大值与最小值之差。
R=max(Xi)-min(Xi)第三十一页,共八十二页,2022年,8月28日差异系数
Coefficientofvariation变异系数指出了标准差对于平均值的大小,用于比较不同总体或样本数据的离散程度。同一样本不同测量的变异的比较,如相同班级不同科目的变异的比较;不同样本同一测量的变异的比较,如不同年级同一科目变异大小的比较。第三十二页,共八十二页,2022年,8月28日第三节地位量数一、百分位分数二、百分等级分数第三十三页,共八十二页,2022年,8月28日百分位分数百分位分数是一种相对地位量数,它是次数分布中的一个点。把一个次数分布排序之后,分为100个单位,百分位分数就是次数分布中相对于某个特定百分点的原始分数,它表明在次数分布中特定个案百分比低于该分数。用Pm表示,其中m是特定百分点。eg.P30=60,表明在该次数分布中有30%的个案低于60分。第三十四页,共八十二页,2022年,8月28日计算第p百分位步骤第一步:从小到大排列原始数据第二步:计算指数ii=(p/100)×n,n为项数,p为所求的百分位的位置第三步:若i不是整数,将i向上取整;若i是整数,则第p百分位数是第i项与第i+1项数据的平均值例:有12个职员薪金的数据,求第85和第50百分位数。解:(1)将12个数据从小到大排序如下:
221022252350238023802390242024402450255026302825(2)i=(p/100)×n=(85/100)×12=10.2(3)由于i=10.2不是整数,向上取整,所以第85百分位数对应的是第11项,其值为2630。同理,计算第50百分位(中位数)。i=(50/100)×12=6,是整数,第50百分位数是第6项和第7项的平均值,即(2390+2420)/2=2405。第三十五页,共八十二页,2022年,8月28日百分位分数的计算组下限:组上限:第三十六页,共八十二页,2022年,8月28日二、百分等级分数百分等级分数是一种相对地位量数。百分等级分数与百分位分数不同,是事先知道分布中的一个原始分数,再求这个原始分数在分布中所处的相对位置-百分等级。用PR表示。一个原始分数的百分等级分数,定义为次数分布中低于这个原始分数的次数百分比。百分等级分数指出原始数据在常模团体中的相对位置,百分等级越小,原始数据在常模团体中的相对位置越低;百分等级越大,原始数据在常模团体中的位置越高。第三十七页,共八十二页,2022年,8月28日百分位等级分数的计算公式第三十八页,共八十二页,2022年,8月28日表某市招干考试分数分布表分数分组次数累积次数累积百分数90-9458-8980-8475-7970-7465-6960-6455-5950-5445-4940-4435-3930-3425-2920-2415-1910-145-90-41327517098134131125149136134126138139147151982671900188718601809173916411507137612511102966832706568429282131337100.0099.3297.8985.2191.5386.3779.3272.4265.8458.0050.8443.7937.1629.8922.5814.846.891.740.37P90=73.52X=82,PR=96.28第三十九页,共八十二页,2022年,8月28日百分位量表的特点百分位分数和百分等级分数称为百分位量表。优点:计算简便、意义明确、对各种测验普遍适用。缺点:是一个顺序量表,不具有相等单位,从而不能作进一步的数学运算,无法作进一步的统计分析;另外,由于百分位量表的分布呈长方形,当测验分数的分布为正态或接近正态时,百分位量表将夸大分布中间的原始分数的差异而缩小分布两端的原始分数的差异。第四十页,共八十二页,2022年,8月28日第四节相关分析一、相关系数及其解释(一)相关:事物间存在联系但又不能作出因果关系的解释(二)相关系数及其解释二、常用相关分析方法及计算第四十一页,共八十二页,2022年,8月28日事物之间的关系因果关系、共变关系和相关关系因果:A→B下雨地上会湿共变:C→A,C→B
严格的说不叫相关,只是A和B之间有某些共同点婴儿身高和树苗高度的关系相关:指两类现象在发展变化的方向和大小方面存在一定的关系,不能确定是否为因果关系广告费支出与商品销售额的关系第四十二页,共八十二页,2022年,8月28日相关的判定1.散点图2.统计分析第四十三页,共八十二页,2022年,8月28日散点图(a)完全正相关(b)完全负相关(c)无相关关系(d)非线性关系(e)正相关(f)负相关第四十四页,共八十二页,2022年,8月28日散点图scatterdiagram第四十五页,共八十二页,2022年,8月28日第四十六页,共八十二页,2022年,8月28日第四十七页,共八十二页,2022年,8月28日第四十八页,共八十二页,2022年,8月28日(一)相关系数及其解释1.相关系数的取值范围:[-1,1](1)正相关Vs.负相关-只表示方向(2)相关程度的大小:相关系数的值2.有相关不一定有因果第四十九页,共八十二页,2022年,8月28日二、常用相关分析方法及其计算(一)积差相关系数(二)等级相关1.斯皮尔曼等级相关2.肯德尔W系数(肯德尔和谐系数)(三)质量相关1.点双列相关2.双列相关第五十页,共八十二页,2022年,8月28日积差&协方差1.积差的定义:成对变量的离差乘积。2.积差的表示3.协方差(covariance):积差的平均数第五十一页,共八十二页,2022年,8月28日(一)积差相关系数积差相关系数又称积矩相关系数,是英国统计学家皮尔逊提出的一种计算相关系数的方法,故也称皮尔逊相关。这是一种求直线相关的基本方法。记作:rxy。它是利用离差乘积的关系来说明事物的关系,是将原始记分转换为离差乘积(即积差),再转换为标准积差后所求得的标准积差的平均数。积差相关系数实际上就是成对变量标准积差的算术平均数。第五十二页,共八十二页,2022年,8月28日积差相关系数的使用条件(1)两列变量都是等距的或等比的测量数据(2)两列变量所来自的总体必须是正态的或近似正态的对称单峰分布(3)两列变量必须具备一一对应关系第五十三页,共八十二页,2022年,8月28日积差相关系数的计算1.均数已知3.利用原始数据2.标准差已知☆第五十四页,共八十二页,2022年,8月28日表5名学生身高和体重的测查结果编号实测记分离差记分积差标准记分标准积差身高体重XY11707203001.50.00216569-500-0.4100.00315066-20-3601.63-1.52.44418070101100.820.50.4151856815-1-151.22-0.5-0.61∑8503450055——2.24第五十五页,共八十二页,2022年,8月28日等级相关的界定等级相关是根据两列顺序变量数据中各对等级数据的差数来计算相关系数的方法。对于连续变量的数据,必要时可分别把两列数据按大小顺序赋给名次等级,进而采用等级相关法计算相关系数。等级相关法因变量个数的多少而有用于分析两列变量相互关系的斯皮尔曼等级相关和用于分析多列变量相互关系的肯德尔和谐系数和肯德尔一致性系数。第五十六页,共八十二页,2022年,8月28日1.斯皮尔曼等级相关斯皮尔曼等级相关(Spearman’scorrelationcoefficientforrankdata)是英国心理学家、统计学家斯皮尔曼根据积差相关的概念推导出来的,是通过两列变量的成对等级差数来计算相关系数,又叫“等级差数法”,用符号rR或rs表示。斯皮尔曼等级相关适用于两列具有等级顺序的测量数据,或总体为非正态的等距、等比数据。第五十七页,共八十二页,2022年,8月28日斯皮尔曼等级相关的基本公式-无相同等级
Di:二列成对变量的等级差数N:等级个数1.等级差数法2.等级序数法第五十八页,共八十二页,2022年,8月28日练习表2位教育专家对5篇论文的评价结果编号rxryDD201020304052541343125-223-1-244914∑20第五十九页,共八十二页,2022年,8月28日观测变量有相同等级的处理
在观测变量没有相同等级时能够保证RX=RY,RX2=RY2。如果观测变量出现相同等级时RX=RY,但RX2RY2。R2随相同等级数目的增多而有规律地减少。t:相同等级的数目第六十页,共八十二页,2022年,8月28日2.肯德尔W系数(和谐系数)肯德尔W系数又称为肯德尔和谐系数,是表示多列等级变量相关程度一种方法,适用于两列以上等级变量。第六十一页,共八十二页,2022年,8月28日肯德尔W系数的适用资料1.K个评分人评价N个被评价人或N件作品,以分析和评价K个评分人的评价是否一致2.同一个人先后K次评价N个被评人或N件作品,以分析其前后评价是否一致第六十二页,共八十二页,2022年,8月28日肯德尔W系数的计算公式-无相同等级K:评定者的数目R:K个评定者对同一个被评事物所给予的等级之和N:被评定事物的数目SS:R的离差平方和第六十三页,共八十二页,2022年,8月28日有相同等级的W系数n:相同等级的数目第六十四页,共八十二页,2022年,8月28日对W系数的说明1.取值范围:W[0,1]2.相关方向:从实际资料中进行分析。3.相关程度(1)若K个评价者意见完全一致,则W=1;若K个评价者的意见存在一定关系,单又不完全一致,则0<W<1;若K个评价者的意见完全不一致,则W=0。(2)SS越小,评价的一致性程度越低;SS越大,评价的一致性程度越高。第六十五页,共八十二页,2022年,8月28日练习第六十六页,共八十二页,2022年,8月28日第六十七页,共八十二页,2022年,8月28日质量相关一列变量按事物的某一属性划分种类,而另一列变量则为等比或等距的侧脸数据,这种情况下求得的相关,称为质量相关。第六十八页,共八十二页,2022年,8月28日计算相关系数时应注意的问题相关系数受样本容量n的影响如果n很小,可能完全没有相关的两事物,却计算出较大的相关系数。一般以n大于30为宜计算相关系数要求成对数据没有线性相关,不一定没有关系,可能是非线性的相关系数的计算不受以下因素影响互换两个变量第六十九页,共八十二页,2022年,8月28日2.3质量相关P66一列变量为正态的等距或比例数据,另一列变量为类别变量,求两列变量的直线相关,称为质量相关。点二列相关二列相关多系列相关第七十页,共八十二页,2022年,8月28日1.点双列相关点双列相关适用于双列变量中一列变量为来自正态总体的等距或等比的测量数据,另一列为二分称名变量,即按事物的某一性质只能分为两类相互独立的变量,如,男女,文盲与非文盲。第七十一页,共八十二页,2022年,8月28日2.3.1点二列相关缩写PB
point-biserialcorrel
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年煤矿自动化控制系统合作协议书
- 2024CFA考试难点试题及答案解析
- 高校景观说课
- 急速备考CFA试题及答案
- CFA考试成功要素试题及答案
- 多元化投资组合的构建技巧试题及答案
- 学习规划的CFA试题及答案步骤
- 集团年度工作总结
- 针对学员的2024CFA考试试题及答案
- 实事求是红色教育
- 冀教版小学四年级英语下册第二单元11课Lesson11 How's the-weather today教学设计
- 医保按病种分值付费(DIP)院内培训
- 爱莲说-王崧舟
- 普通创造学:第五章创造原理及其技法(5次)
- 施工项目部标准化配置达标检查表(新模板)(1)
- 第04章 金属的断裂韧度
- 嗅觉系统和嗅觉通路
- 装修工程施工进度计划表excel模板
- 接收电脑的团县委联系方式统计表
- BrownBear绘本附配音PPT课件
- 供电局配电网设备缺陷管理标准(试行)_图文
评论
0/150
提交评论