心理统计学重要知识点(20210403231546)_第1页
心理统计学重要知识点(20210403231546)_第2页
心理统计学重要知识点(20210403231546)_第3页
心理统计学重要知识点(20210403231546)_第4页
心理统计学重要知识点(20210403231546)_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学重要知识占八、第二章统计图表简单次数分布表的编制:Excel数据透视表列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel数据透视表直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel图表向导的柱形图来绘制散点图(Scatter plot):主要用于直观描述两个连续性变量的关系状况和变化趋向。条形图(Bar chart):用于直观描述称名数据、类别数据、等级数据的次数分布情况。简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。圆形图(circle graph )、

2、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势;第三章集中量数集中趋势和离中趋势是数据分布的两个基本特征O集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。集中量数:描述数据分布集中趋势的统计量数。离中趋势:是指数据分布中数据分散的程度O差异量数:描述数据分布离中趋势(离散程度)的统计量数常用的集中量数有:算术平均数、众数(Mo)、中位数(Md)算术平均数(简称平均数,M、 X、XiExcel统计函数 AVERAGE算术平均数的重要特性:(1) 一组数据的离均差(离差)总和为0,即(为x)

3、(2)如果变量 X的平均数为X ,将变量X按照公式y a bx转换为Y变量后,那么,变量Y的平均数Y a bX2.中位数(median , Md):在一组有序排列的数据中,处于中间位置的数值。中位数上下的数据 出现次数各占 50%。3.众数(mode, Mo): 一组数据中出现次数最多的数据。4.算术平均数、中数、众数之间的关系。XiWi x?W25.加权平均数:Mw xnWxiwiWiW2WnWi6.调和平均数(harmonic mean , Mh): 一组数值倒数的平均数的倒数Mh1111()nX1X2%(1)(2)Excel统计函数 HARMEAN用于描述同一个体 (或一组个体)不同时间

4、段的平均学习速度、平均工作效率。用于描述不同能力水平个体的平均学习速度、平均工作效率。7.几何平均数(geometric mean , Mg )是指 n个观察值连乘积的n次方根.(1) 一组数据中少部分偏大(或偏小),数据分布呈偏态时,几何平均数比算术平均数更能反映数据的集中趋势。Mg n XiX2XnExcel统计函数GEOMEAN(2)用于计算平均学习进步速度、平均发展速度(平均发展倍数),即环比的几何平均数。Mg nj丝上土旦 n1:&( X1、X2、 、Xn为各个时间段的成果数据)Xi X2 X3Xn 1 Xi平均增长率:Ma 1 g第四章差异量数差异量数:描述一组数据离散程度

5、(离中趋势)较分散,数据之间的差异较大;差异量数较小,的统计量数。差异量数较大,说明数据分布得比 说明数据分布的比较集中,数据间的差异较小。差异量数还能反映平均数对一组数据的代表性O 越大,平均数的代表性越差。差异量数越小,平均数的代表性越好;差异量数常用的差异量数是标准差、方差、差异系数标准差s: s(Xi X)2nExcel统计函数STDEVP (给定样本总体的标准偏差)标准差sn-1 :sn 1(Xi X)2n 1Excel统计函数STDEV (给定样本的标准偏差)方差s22(Xi X)Excel统计函数VARP (给定样本总体的方差)方差S22sn12(Xi X)2n 1Excel统计

6、函数VAR (给定样本的方差)差异系数(又称变异系数、离散系数、相对标准差):CV -SX(1)用于比较不同观测工具测量结果(数据单位不同)的离散程度,例如,身高离散程度大,还 是体重离散程度大?(2)用于比较用同一观测工具测得的、均数差异较大的不同样本数据的离散程度。例如:7岁组儿童和13组岁儿童的体重离散程度,哪个较大?标准差的重要特性:如果变量X的标准差为 Sx,将变量X按照公式y a bx转换为丫变量后,那么,变量丫的标准差SY bSX相对位置量数:反映个体(数据)在团体中相对位置的统计量数。主要有标准分数及其线性转换分数(Z分数、T分数)、百分等级 (PR)、正态化标准分数等。,-e

7、Xi X -Xi1 .标准分数的计算与应用:Z 或:Z ,ST 10Z 50, CEEB 100Z 500Z分数的特点:Z分数的平土匀数为 0,即 Z 0,标准差为1,即 Z 1T分数的平均数T 50,标准差为T 10CEEB分数的平均数 = ?,标准差 = ?(1)可用于比较个体各方面水平高低(横向比较,个体内差异评价)。(2)对被试多方面的测量结果进行综合,如对高考各科成绩的综合,各分测验分数的综合。(3)可用于对个体或样组某方面水平进行前后比较(纵向比较),判断其水平是提高了,退 步了,还是没有变化。2.原始分数X的百分等级的含义与计算根据简单次数分布表计算:PRx竺fFb 100X L

8、b?f Fb根据分组次数分布表计算:PRx一i 100N第五章相关关系相关关系的描述方法(1)相关散点图:适用于直观描述两个连续性数值变量(等距数据、比率数据)之间的关系。可用Excel图表向导中的 “XY散点图”绘制。(2)双向次数分布表 (交叉表、列联表):适用于描述两个等级变量(或称名变量、类别变量 )之间的关系。可用 Excel数据透视表编制列联表)。(3)相关系数(相关关系的特征值)。相关系数:描述两个变量相关关系的统计量数,在个变量之间的关系程度越密切;绝对值越小,越接近之间取值,绝对值越大,越接近 1 ,说明两0,说明两个变量的关系程度越低。常用的相关系数:1.积差相关:r(x

9、X)(y y)nSxSyExcel统计函数 CORREL适用条件:(1) X、Y两个变量都是连续性变量(等距数据或比率数据);(2) X、Y两个变量总体上为正态分布或接近正态分布。2 .斯皮尔曼等级相关:是一对(两列)名次变量的积差相关。对数据变量的分布形态没有要求。(1)等级积差相关法(名次积差相关法)。R(RxRx )(Ry Ry)NSrx SryExcel统计函数 CORREL公式中的Rx和Ry是分别代表两变量中每个数据在变量中的名次。(2)等级差数法(名次差数法)。如果每个等级(即名次)变量中没有相同的等级名次,可用下面公式计算:2等级差数法简化公式:rR 1 -6-一N(N2 1)如

10、果等级(即名次)变量中有相同的等级名次,需用下面校正公式计算:222等级差数法校正公式:rRCRCx y D 22,一,/ y . , x、 y计算万法参见教材125页2?.,( x2)( y2)3 .肯德尔 W系数(肯德尔和谐系数):描述多个名次变量一致性程度的统计量数。适用于描述和分析不同评价者(如主考、阅卷者)对同一组个体(考生或答卷)评价结果(名次)的一致性程度,在心理测量与教育评价中称为评分信度。例如,5位阅卷老师对 10篇论文评分(或等第、符号),可先将其转换n(n2 1)12排名的一致性。如果评价者给出的不是个体的水平名次,而是分数 成名次,然后再计算 W系数R2( Ri)2R2

11、(Ri)2W N校正公式: W N T123123K2(N3 N)K2(N3 N) T1212公式中:n为每个名次变量中相同名次的数目。4 .点二歹U相关(point-biserial correlation ):用于描述一列续性变量和一列真正二分变量(或非正态二分变量)之间的相关。真正二变量:指按某种性质或标准将个体划分为两种结果的变量,如对、错,男、女等。XpXqrpb ?Jpq Excel 统计函数 CORRELSt5 .二列相关(biserial correlation):用于描述由一个正态连续变量人为划分成的二分变量与另外一个正态连续变量之间的相关。或者说,用于描述一正态二分变量与一

12、正态连续变量之间的相关。人为二分变量?是指由连续变量转换而来的二分变量,例如,将测验或考试分数区分为及格和不及格,80分以上和80分以下;按中考(或高考)成绩,将考生区分为录取、 未录取 正态二分变量?如果二分变量是根据正态连续变量转换而来,那么,可称之为正态二分变量。y为将正态分布面积画分为p、q两部分的纵线的高度。y的计算方法:利用 Excel统计函数计算标准正态分布区间点函数NORMSINV( p值)区间点Z值正态分布函数 NORMDIST(区间点Z值,0,1,0 )值的概率密度 y6.相关(系数)| ad bc |,(a b)(c d)(a c)(b d)用于描述两个真正二分变量的相关

13、程度,也用于描述一个人为二分变量和真正二分变量的相关。注意:相关计算公式是由皮尔逊积差相关计算公式转换来的。因此,如果两列二分变量转换为0、1 (或1、2)的数值变量时,可以用Excel统计函数 CORREL计算系数。第六章概率分布1 .正态分布的特征(见教材)2 . Excel软件中正态分布函数和正态分布区间点函数的应用标准正态分布函数NORMSDIST 的应用:(1) P(Z< = ? =NORMSDIST= P(Z> = ? =1-NORMSDIST=(3) P<X<=? =NORMSDIST-NORMSDIST=正态分布函数 NORMDIST 的应用例如:已知某

14、次测验的分数呈正态分布,平均分为 75分,标准差为 10分,试计算:(1)低于80分的考生占多大比例,P(X < 80分尸?(2) 80分以上的考生占多大比例,P(X>80分尸?(3) 80分以上,低于 90分的考生占多大比例,P(80<X<90)=?P(X<80 分):“=NORMDIST ,75,10,1)” =P(X 近0 分):"=1- NORMDIST ,75,10,1)” =P(80 <X< 90): “ =NORMDIST ,75,10,1)- NORMDIST ,75,10,1)标准正态分布区间点函数NORMSINV 的应用根

15、据给定的向上累积概率P(Z<a),标准正态分布的临界值a=? a=NORMSINV( p值)例如:P(Z<a)= =NORMSINV = , a= , P(Z > =正态分布区间点函数NORMINV 的应用根据正态变量 X的平均数、标准差和向上累积概率P(X<a),计算临界值 a=?例:已知某次大规模招聘考试分数呈正态分布,平均分为55分,标准差为12分。现准备录取10%的考生进行面试,录取分数线大致是多少?P(X>?尸,即 P(X <?)=, =NORMINV ,55,12 尸,最低分数线应为 70分。3 .测验分数、测评等级的正态化:根据被试样本原始分或

16、等级的简单次数分布表,计算各个不同分数或等级的正态标准分数(1)计算每个不同分数X (或等级)以下累计次数Fb;(2)计算每个不同分数X (或等级)中点以下累积比率CP: CPxX0.5 fFbN(3)利用 Excel统计函数 NORMSINV ,计算CP对应的正态 Z分数。(4)根据需要,将正态 Z分数转为其他标准分数形式:T分数、CEEB分数、托福考试分数、离差智商 IQ等,500, IQ 15Z 100T 10Z 50, CEEB 100Z 500, TOEFL 70Z4 .偏态系数(SK)和峰态系数(Kurt)的计算与应用偏态系数:Excel统计函数 SKEW ;峰态系数:Excel统

17、计函数 KURT。偏态系数 SK=0,对称分布;SK>0,正偏态分布;SK<0,负偏态分布。峰态系数 Kurt = 0,正态分布的峰态;Kurt >0,次数分布的峰度比正态分布峰度低阔;Kurt <0,次数分布峰度比正态分布峰度高狭。偏态系数和峰态系数都等于0或接近0时,变量的分布为正态分布5 .二项分布的定义二项分布是二项试验验结果的概率分布。进行n次二项试验,各次试验彼此独立,每次试验时某事件出现的概率都是p,该事件不出现的概率为q (=1-p),则该事件出现x次的概率分布为:P(X x) b(x,n,p,) C:pxqnx。二项分布的 Excel统计函数:BINO

18、MDIST6 .二项分布函数 BINOMDIST 的应用对20道四选一的单项选择题,如果完全凭猜测答题,那么(1)猜对5道题的概率是多少?(2)猜对5题以下概率是多少?(3)猜对6题以上的概率是多少?n =20 ,每题猜对的概率为p =(1)猜对 5 道题的概率 P(X=5)=BINOMDIST (5, 20, , 0)=(2)猜对 5 题以下的概率 P(X<5) =BINOMDIST(5, 20, , 1)=(3)猜对 6 题以上的概率 P(X>6)=JP(X<5) =1-BINOMDIST (5, 20, , 1)=7 .二项分布的形态:随 n、p的变化具有不同的分布形态

19、(1)当p=q时,二项分布是对称分布。(2)当p=q, np>5时,接近正态分布。(3)当pF, np<5或nq<5时,二项分布为偏态分布。(4)当pF, np>5且nq>5时,二项分布接近正态分布。8 .二项分布的平均数和标准差p,则该事件出现次数的理论平均数(卜v'npq。np、npq的正态分布。进行n次二项试验,每次试验时某事件出现的概率都是方差(2)和标准差 分别为:np, 2 npq,如果np>5且nq>5,成功事件出现结果的概率分布接近进行投掷100枚硬币试验,如果进行无数次试验,正面向上的硬币数目会在0100个之间变化那么,正面向

20、上次数的理论平均数:巧np=100x =50,标准差为与;npq J10007505 5。20道四选一的单项选择题,如果完全凭猜测答题,那么,猜对题数的平均数为p=np=20X 1/4=5猜对题数的理论标准差为.npq .,20 1/4 3/4 1.94第七章总体参数估计1 .常用的点估计:总体均数 心的点估计:用样本平均数X , Excel统计函数为 AVERAGE总体方差 J的点估计:用样本标准差Sn21 ,或S2 ?n 1总体标准差 b的点估计:用样本标准差Sn 1 ,或S?/:n 12.总体平均数的区间估计1 .若样本均数的抽样分布为正态分布,总体均数的置信区间为:Z0.052SEXX

21、1.96总体均数的置信区间为:Z0.012SEXX2.582.若样本均数的抽样分布为df=n-1的t分布,那么,总体均数的置信区间为:Xt0.05/2SEXX t0.05/2总体均数的置信区间为:Xt0.01/2SEXXt0.01 /2自由度 df=n-1 , t0 05,2 = ?.也可查教材453页t值表t0.05 2 = ?,可用 Excel统计函数 TINV 计算。3.总体方差与标准差的区间估计nS22nS2.或(n1)S212(n1)Sn2 120.02520.975,取20.02520.975总体方差nS222的置信区间为:_ 2nS - (n1)S212(n1)Sn2 120.0

22、0520.99520.00520.995自由度df=n-1的2分布右侧概率区间点的计算,也可用2总体方差的置信区间为:2也可查教材 475页分布数值表Excel统计函数 CHIINV总体标准差 b的置信区间: 取总体方差2置信区间上、下限的正平方根。4.总体积差相关系数的区间估计:(1)将样本相关系数r转换为费舍Zr值,转换方法: Excel统计函数FISHER(2)计算Zr的标准误SEZr : SEz(3)计算总体Zp值的1- a置信区间:ZrZ2SEZr置信区间为:Z0.05 2 SEZrZr1.96n 3置信区间为:乙Z0.012 SEzZr2.58(4)计算总体相关系数P值的置信区间:

23、将总体Zp值区间上、下限进行费舍逆转换,转换方法:Excel统计函数 FISHERINV5.总体比率(比例)的区间估计n? 5, nq? 5时,样本比率 ?的抽样分布渐近正态分布。总体比率的置信区间为:? 1.96SEp ? 1.96总体比率的置信区间为:? 2.58SEp ? 2.58第八章假设检验在Z检验中:双侧检验临界值:单侧检验临界值:Z0.05/2 = Z0.01 /2 =Z0.05 = Zo.0i =单侧显着性概率双侧显着性概率在t检验中:单侧显着性概率双侧显着性概率1 .单个样本Z检验P: =1-NORMSDIST (ABS (Z 值)P: =(1-NORMSDIST(ABS(Z

24、 值)*2P: =TDIST (ABS (t 值),df, 1)P: =TDIST (ABS (t 值),df, 2)主要用途: 分析单个样本均数 X与已知的总体均值卬的有无显着差异,适用条件:(1)总体呈正态分布,总体方差 (2)总体是正态分布,总体方差2,已知;2 一 . . .、一虽然未知,但样本容量(3)即使总体非正态分布,总体方差2也未知,样本容量n 30 ;n 30。2 .单个样本t检验主要用途: 用于分析单个样本均数 X与已知的总体均数 眼的差异,适用条件:(1)总体呈正态分布,总体方差2未知,样本容量 n 30的情况下(2)总体非正态分布,总体方差2未知,样本容量 n 30的情况下3 .单个样本比率 Z检验主要用途:根据一个样本的比率?,分析样本所代表的总体比率p与已知比率 p0有无显着差异适用条件:np0 5, nq0 54 .两独立样本比率差异Z检验主要用途:根据两个独立样本的比率?1 ?2,推断两总体比率 p1、p2有无显着差异适用条件:两个样本相互独立,n1?1, n2?2, n1?1, n2q2都55 .两独立样本方差齐性检验推断两个总体的方差是否相等或是否有显着差异主要用途:根据相互独立的两个样本的方差,分子方差的自由度df=n1-1,分母方差的自由度df= n2-1大的S211IS2(小1)小的S221nzS;1)双侧显着性概率 P值:=FDIS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论