知识点表格3—心理统计(考研背诵版).doc_第1页
知识点表格3—心理统计(考研背诵版).doc_第2页
知识点表格3—心理统计(考研背诵版).doc_第3页
知识点表格3—心理统计(考研背诵版).doc_第4页
知识点表格3—心理统计(考研背诵版).doc_第5页
免费预览已结束,剩余17页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据类型名称观测/ 来源计数测量是否连续性离散连续名称称名测量水平顺序等距等比相关类型积差斯皮尔曼表 1数据数据区分计算量具有限真正二分 / 二分称名变量细分人为二分变量单位绝对零点运算分类/+数据 1数据 2等距等距条形图 / 饼图直方图 / 线形图统计百分比 / 众数 / 次数 / 卡方检验中位数 / 百分位数 / 等级平均数 / 积差相关 /t检验 /F 检验(等距 4 个) / 几何平数据与相关等级肯德尔 W等级等级/ 等距肯德尔 U质与量点二列真正等距二列人为等级/ 等距 系数真正人为/ 真正品质四分相关人为人为列联等级人为/ 真正注:二列:当真正二分数据足够多(参考抛硬币),形成正

2、态时,数据可为真正/ 等级。表 2 统计图表统计图表序类型注意1次数多边形图1、横坐标组中值2、可以用直方图的数据,也可以用次数多边形图次1、累加直数累加次数2、累加曲1、正态(曲线上下支相当)分 2分布图2、正偏态(曲线上支长)布线图3、负偏态(曲线下支长)图类型别称数据作用注意统3直方图组织图连续性用面积表示连续性数据总面积 =总次数1条形图直条图离散表示事物间数据大小/ 差异总面积 =总次数计用高矮表示数据多少2圆形图饼图间断性部分与整体的比重基线确定后,顺时针方向排图1、发展趋势用高矮表示数据多少3其线形图/连续性2、函数关系/他3、A 随 B 变化的情形统4散点图/1、变化趋势用远点

3、疏密表示数据大小 / 趋2、相关程度计势图1、数据分布特征5茎叶图/2、呈现侧放直方图/3、保留原始数据注:号、目、尺、形、例、注(图题在下)类型注次1简单三线表数2分组数据排序3相对频数比例分4累加统自下而上(自上而下)累加布5双列一表二变量计表6不等距工资年龄不等距表其1简单表/2分组表只有一个分类标志他3复合表2个表注:号、名、目、数、注(表题在上)平均数 M定义数据总和除以数据个数,简称平均数或均数。1、XX 0X i+CC特点2、NX3、X iCCXN1、同质性原则2、平均数与个体数值相结合的原应用则3、平均数与标准差、方差结合原则1、反应灵敏2、计算严密3、计算简单优点4、简明易解

4、5、适合进一步代数运算6、较少受抽样变动影响(稳定)1、容易受到极端值影响2、数据模糊无法计算缺点【1】未分组:(1 )定义式子表 3 集中量数集中量数中数 Md中点数、中位数、中值,是按序排列,局域中间位置的数值。1、一组数据出现两个极端值时2、一组数据有个别模糊数据时3、需要快速估计一组数据代表值1、计算简单,易理解。2、概念简单明白。1、代表性差2、反应不够灵活3、受抽样影响较大(不稳定)4、计算时需先排序5、不能进一步代数运算【1】未分组:1 无重复(1)奇数:中间的那个数。众数 M0范数、密集数、通常数,指在次数分布中出现次数最多的那个数值。1、一组数据出现两个极端值或双众数2、快速

5、粗略找数据代表值3、数据不同质4、粗略估计次数分布形态。1、概念简单明了,易理解。2、较少受到极端值影响。1、不稳定,受分组和抽样变动影响。2、反应不够灵敏3、不是严格计算,不够精准4、不能进一步代数运算1、皮尔逊经验公式M O =3M d2MXX i(1)奇数:中间的那个数。2、插补法N(2)估计平均数2 中间数列有重复( P62例子)(1)奇数(例 3-5 )131313M OLbfaifafb公式XAMx N12.512.6712.8313.1613.5【2】分组:X1fX CnXAMfdiN(2 )偶数(例 3-6 )13131312.512.8313.5其他平均数1、加权:用各个平均

6、数求总体平均数。fX iXf2、几何:求增长比率平均数的问题。lg Xi集中量数注:1、画数轴,写上下限。2、把 N个重复的数字看做是N个区间。如有 3 个重复数字,一个区间的间距为 1/3 。3、奇数时,中点在一个数字的区间内。偶数时,中点在两个区间的交接点。【2】分组:(1) 低到高累加lg MgN3、调和:求平均速率的问题。NM H1X iM0三者Md关系MniMd Lbfb2fMd(2) 高到低累加iNMdLa(Fa )MMdM0M O =3M d2MM0MdM表 4 相对量数相对量数百分位数 PP百分等级 PR定义百分位点,指两尺上的一个点,在百分等是是一种相对位置量数,分数此点一下

7、,包括数据分布中全部数按序排列,用百分等级表示一个分数据个数的一定百分比。在团体里相对位置。pFbPR100f ( XLb)NN Fb公式PpLb100iif备注百分位差为 =P90-P10标准差应用变异系数 CV标准分数 Z指出了标准差相对于平均值的大小,又称基分数或 Z 分数,是以标准差为概念用于比较不同总体或样本数据的离单位的一种量数。表示的是一个原始散程度分数在团体中所处的相对位置。公式CVS100X XXZS1、同一团体不同测量的变异的比1、观测值在数据分布中相对位置高低应用较。2、可用 Z 分数求不同的观测值的总2、不同团体同一测量的变异的比和或平均值,以表明在总体中的位置。较。注

8、意:性质:1、测量数据 要保证具有等距尺度。1、无实际单位,以平均数为参照点,标准差为单位。2、测量工具应具备绝对零。2、 Z 分数可以是正负值。3、差异系数只能用作一般相对量3、一组原始数据的 Z 分数分布:数描述。M=0,S=14、如原始数据呈正态分布,转换的 Z分数分布也为标准正态分布。1、只能用于一般的相对差异量的优点:描述。1、可比性评价2、没有有效的假设检验方法,不2、可加性能进行统计推论。3、明确性4、稳定性四分位差 Q百分位差的一种Q3-P90 -P10Q=Q1=22备注全距 R定义说明离散程度最简单的统计量,数据按序排列,最大值减去最小值。RgXmax Xmin公式1、是说明

9、数据离散程度最简单的统计量评价2、不能充分利用数据信息3、 不稳定,不可靠,也不灵敏变异系数 CV概念总体参数 2,样本参数 s2性质:1、YiX iC sysxYiX i Csy sx C2、3、YiX i C d sysxC方差是表示一组数据离散程度的最好指标。优点表 5 差异量数差异量数离差 Xi平均差 A.D.原始数据与平均数的差所有原始数据与平均数绝对离差的平均值。xi Xi XXi XXiA.D.nn1、较好反映了数据分布的离散程度;2、平均差是绝对值,使用受到限制;3、属于低效的差异量数。标准分数 Z备注总体参数 ,样本参数 s意义:/1、反应灵敏2、计算严密3、容易计算4、简明

10、明了5、适合进一步代数运算6、较少受抽样变动影响(稳定)差异量数1、未分组1、未分组2222XXXX2xxssNNNN2、原始数据2、原始数据2X2X22-X22X2XS-N X-=1 N X2-2N=N2SNXNNN公式3、总标准差合成3、分组(1)总方差22Ni si2N I di2sfX cXfx2NNSTNifd 22(2)sfdNiNi si2NI di2NST =Ni表 6 各差异量数的比较各差异量数的比较百分位差四分位数全距平均差方差、标准差全部数据稳定性代数方法计算简单简单简单简单评价适用于描述统计测量粗糙适用于描述统计优良,适用于描述和推断统计相关概念种类概念系数散点图表 7

11、 相关量数 概念相关量数概念1、因果关系:一种现象是另一种现象的因,而另一种现象是这种现象的果。2、共变关系:表面看来有联系的两种事物都与第三种现象有关,这两种事物间的关系就是共变关系。3、相关关系:两类现象在发展变化的方向及大小方面存在一定的关系。1、正相关:变化方向一致(同增共减)2、负相关:变化方向相反(此增彼减)3、零相关:变化没有趋势。相关系数是变量之间相关程度的指标。计算相关系数一般需大样本。r( 样本相关系数 ) ,( 总体相关系数 ), 是顺序数据。取值:-1 r 1注意:1、-1 r 1,是个比率,常用小数表示。2、+/- 表示方向3、r=1 完全正相关 ,r=-1完全负相关

12、 ,r=0 零相关4、取值大小表示相关强弱程度,绝对值接近1 表示相关密切。1、明显倾斜:奇 +偶- 。2、倾斜不明显,呈圆形,则为零相关或弱相关。3、拟合直线 : 代表数据相关趋势。数据与它的拟合直线离差小,成为最佳拟合直线,相关预测更可靠。表 8 相关量数方法相关量数方法备注公式1、成对数据1、标准差、离均差条件2、等距 / 等比数据rxy3、正态分布 ( 或接近正态 )NSx Sy4、线性关系相关系数合并(要求样本同质)2、Z积差相关ni3 Zir1 ZXZYZN注ni33、原始观测值rNXYXYN X 22Y 22XNY1、两列变量条件2、等级变量,线性关系的资料3、称名 / 顺序数据

13、4、不用考虑是否正态优点1、条件比积差相关大2、N30,计算简便等斯缺点1、精确度比积差相关差级皮适合用积差相关的不要用等级相关相尔关曼注1、等级评定法条件2、两列变量肯3、K 人 N事/1 人 K 评 N件事0W1( W不表示方向,只表程度)德优点尔 w1、意见一致, W=1等注2、不完全一致 0W1级3、完全不一致 W=0相关1、对偶比较法条件2、两列变量U3、K 人 N事/1 人 K 评 N件事1、完全一致 U=1注2、完全不一致U=-1/K (奇),U=-1/(K-1)(偶)1、等级差数法rR 16D2N N 212、等级序数法rR =34RX RY1NNNN113、有相同等级rRCx

14、2y 2D 22x2y2x2N 3NCx , Cxn( n21)12122N 3NCy ,Cyn( n21)y12121、无相同等级时sRi2WsR21 K 2N 3NiN122、有重复等级时Tn3nWs12123KNN KT128rij2krijUN1K1NK 1相关点 条件二质列应用与量二 条件列应用1、总体服从正态分布X pX q2、一列等距或等比,另一列二分称名变量rpbSt用于评价非类测验题目组成的测验的内部一致性等问题。1、总体服从正态分布X pX q2、一列等距或等比,另一列人为二分变量rb用于测验效度和试题区分度的分析。St1、正态分布(连续)pqpqrbX p X tpySt

15、y四2、人为二分180 ortcosbc分条件部品rtcosad1bcadbc质条件相注关两个真正二分变量1、 0.3 弱相关, 0.6 强相关。adbca b c da c b d2、完全正相关个案在 ad,完全负相关在 bc3、 只表示相关程度,不表示方向。表 9概率概率类型别称直接计算的比值,是真是的概率而不是估计值。事件包含的基本事件数m古典先验P(A)=A基本事件数 n统计后验进行 n 次试验( n 接近无穷),A 出现次数 m与试m)验次数 n 的比值稳定在常数 P 上。P(A)=P(nn性质1、公理系统:( 1)P0,(2)P(必然事件 )=1 ,(3)P(必然不发生) =02、

16、定理:( 1)加法: P(A+B)=P(A)+P(B),(2)乘法: P( AB)=P(A)P(B)概率分布概念概念概率分布是用来描述随机变量取某些值时的概率的数学模型,可以通过统计图表、公式来表示。性质将 100%的可能性在各随机事件上进行分配定义特点例子离散分随机变量只能取有限的或无限但可以数通常用概率分布描述其取值和相应二项分布、泊松分布、布下去的数值。取值的 P超几何分布连续分随机变量可以取连续的数值,用概率密用概率密度函数描述随机变量在一正态分布、指数分布、布度函数来表示。段区间上取值的 P。威尔尼克分布经验分根据观察或实验所获得的数据而编制的反映的是一个样本的概率分布类次数分布或相

17、对频率分布布型理论分根据理论推演出来的随机变量的概率分反映的是总体的概率分布。布布模型。基本随是一个与随机变量的函数相对应的。随机变量机变量的函数仍然是随机变量。抽样分是样本统计量的理论分布,又称随机变布量函数的分布。概率分布表 10 概率分布概率分布正态分布二项分布概也称常态、高斯分布,属于连续随机变量概率分布,又叫贝努利分布,指实验仅有两种不同性质结果的念呈对称型的概率分布。概率分布,属于离散型随机变量的概率分布。特点条件1、形式对称, M、M0、Md三者相同1、任何一次试验恰好有两个结果,成功与失败2、中央点最高, Y值最大2、共有 n 次试验,且 n 是预先给定的任一正整数3、曲线下面

18、积为 13、每次试验各自独立,各次试验之间无相互影响4、正态分布是一族分布。4、某种结果出现的概率在任何一次试验中都是固5、差异两数之间有固定比率。定的。6、曲线下标准差与概率有一定的数量关系。图:性质:1、离散型分布,概率直方图是跃阶式。(1)pq,图片对称; pq 时,图片偏态(2)n,为正态分布。 (二项的极限分布就是正态)2、二项分布的平均数与标准差=np= npq95%1.96 (双侧) 1.645 (单侧)p q, np599%2.58 (双侧) 2.33 (单侧)1、化等级评定为连续数据2、确定测验题目的难易程度问题:步骤:1、综合评价各评价者的结果。1、计算各题目的通过率 p2

19、、比较不同被评者的心理量的差异。2、用 0.5 减通过率得到 p 值,查表求 Z 值(通过条件:率大于 50%,Z 值计为负,反之 Z 为正)应1、被评定的心理量是测量数据3、Z+5,便得到 010 分的难度分数值,进行比较用2、服从正态,只是人为地在评定时分等级。3、在能力分组或等级评定时确定人数步骤:问题 : 解决不同组在能力上的差异等距。1、按各等级被评者的数目求各等级的人数比率。步骤 :2、服从正态,只是人为地在评定时分等级。1、6 个标准差除以组数,得到 Z 分数等距。3、查正态表求 Z,用 Z 代表各等级的测量值。2、对每等级查概率表计算相应的比率 p。4、求各被评者所得评价等级的

20、测量分数的均数。3、比率乘以分组数。表 11 样本分布与样本平均数分布样本分布t 分布F 分布2 分布概念又叫学生分布,是一种随机变量函数的分布。F 分布是由两个卡方分布构造而成的一个新的分布,是常见的样本分布。1、平均数为 01、是正偏态分布,随两个自由度的1、正偏态, n 越小越抖, n 越大,接2、对称的分布,左 - 右+。的增大,趋近正态。近正态。3、变量取值在正负无穷之间。2、F 总为正值,是两个方差之比。2、都是正值。4、理论上,t 时,呈正态分布。3、当分子自由度为 1,分母的自由3、 2 分布的和也是 2 分布特点(1)为正态分布时,方差等于 1。度为任意值时, F 分布与分母

21、自由度4、df 2,=df, =2df(2)n-1 30,接近正态,方差大于相同概率的 t 值(双侧概率)的平5、是连续型分布。1。方相等(3)n-1 30,离散程度大,中间低4、倒数性质: F =1/F (1- )尾巴高。样本平均数分布样本平均数分布方差标准差分布概念1、总体正态,2 已知2、总体非正态,2 已知X =1、n30,为渐进正态分布1、n30,为渐进正态分布X =X sX s22=公式22X=X =nX22nnss2n2n表 12抽样原理及其方法抽样原理及其方法随机化抽样1、 相当大的可能性使样本保持和总体相同的趋势,使样本1、节省人力及费用获得最大的代表性。2、节省时间,提高调

22、查研究的时效性优2、可以预算或控制抽样误差。3、保证研究结果准确性点注: 1、是抽样研究的基本准则,每个个体被抽取的概率相等2、两层含义:( 1)随机抽取样本。(2)随机安排实验条件。概率简单随机抽样等距抽样1、适用范围广1、与简单随机抽样比,更简单易行。优点2、能体现随机化原则2、与简单随机抽样比,代表性更好。3、原理简单缺点1、总体很大,编号几乎不可能1、若总体有周期变化,代表性不如简单随机抽样。2、忽略总体已有信息,降低样本代表性。2、忽视已有信息,降低样本代表性。抽常用抽签发、随机数字法/样分层随机抽样两阶段随机抽样方1、充分利用已有信息。1、简单易行法优点2、与简单随机抽样比,代表性

23、及推论的精确性更高。2、节省经费缺点与简单随机抽样比,它的标准误要大一些。原则层与层之间差异越大越好,层内差异越小越好。/方便抽样判断抽样非概是由调查人员自由、方便的选择被调查者的非随机选是通过某些条件过滤,然后选择某些被调查者参与调率样。查的抽样法。表 13 参数估计参数估计点估计概 用样本的统计量,来估计总体参数。因为样本统计量念 为数轴上一个点,估计结果用点的数值来表示。良好估计指标:1、一致性 : 估计值接近总体参数值。2、无偏性:偏差平均数为0。3、有效性 : 方差越小越有效。4、充分性:是否反映全部数据所反映的总体信息。步骤1、用样本的数据,计算样本的平均数与标准差。2、计算标准误

24、总 3、确定置信水平或显著性水平体 4、根据样本平均数抽样分布,确定统计表。平 5、计算置信区间均 6、解释总体平均数的置信区间数标准差区间估计条件: 1、总体方差已知2、总体为正态分布3、非正态, n30。标X SS2n准差sn 1Z /2s与方条件 1、总体方差未知差2、非正态, n30。X S Sn 1SSn-12nsn 1Z /2s区间估计以一个统计量的区间来估计相应的总体,按照一定的概率要求 , 根据样本统计量来估计总体参数可能落入的数值范围。相关概念:1、置信区间 是指在特定的可靠性(即置信系数)要求下,估计总体参数所落的区间范围,表明区间估计的精确性,区间越小越精确。2、置信水平

25、: 又叫置信系数、置信度、可靠性系数、置信概率,是指被估计的总体参数落在置信区间内的概率,也是进行正确估计的概率。用 1- 表示。3、显著性水平 :估计总体参数落入的区间,可能犯错误的概率。用 表示。Z 检验条件: 1、总体方差已知,总体为正态分布2、总体方差已知,非正态,n30。XXZXnZ:95%1.96 ,99%2.58t 检验条件:总体方差未知,非正态,n 30。( t 查表)XSX tXn-1方差区间估计卡方( 2)分布:2ns22X Xn 1 Sn2 1222n 1 Sn 122n 1 S n 1 222212二总体方差之比区间估计F 分布1222sn111 Fsn1 1F222s

26、n2 122sn2 12若总体方差相等122sn111Fsn11F22sn212sn212表 14假设检验相关概念假设检验相关概念相关概念参数估计和参数假设检验的共同之处都是利用样本信息对总体进行某种推断,且使用的统计量也一样。参数估计: 用样本统计量估计总体参数;假设检验: 指通过样本统计量得出的差异做出一般性结论,判断总体参数之间是否存在差异。包括参数和非参数检验。参数检验: 指进行假设检验时总体的分布形式已知,需要对总体的未知参数进行假设检验。非参数检验: 指进行假设检验时总体的分布形式所知甚少,需要对总体的未知参数进行假设检验。备择假设( H)1也称研究假设、备择假设、对立假设,就是实

27、验概念假设人员希望证实的假设。检验性质是一种有差假设。原理虚无假设 (H0 )叫做无差假设、零假设、原假设。是研究人员为了证实研究假设是真的而利用反证法的假设,用 H0 符号表示。是一种无差假设。表达X-0或X1 - 20或12X- =0或X=1- 2=0或 1= 2注:假设检验的基本思路是概率性质的反证法, 即从研究假设的反面进行假设。接受 H0拒绝 H0型错误两者关系:两类H0 真正确 型错误1、1弃真2、两者不能同时缩小或增大(即此消彼长)错误型错误3、增大 n, 和其他条件不变时, 会减小。4、统计检验力 1- H0 假 型错误正确取伪双侧检验单侧检验单侧概念指只强调差异而不强调方向性

28、的检验。把拒绝性强调某一方向性的检验。把拒绝性概率值置于理论分的概率值置于理论分布的两端或两侧。布的一尾或一侧。双侧1、问题提法不同1、是否显著1、大于小于高于低于检验区别2、假设形式不同2、H0:= 02、H0:= 03、否定域不同3、|Z| Z/23、查 Z 表1、提出原假设和备择假设2、确定适当的检验统计量3、指定检验中的显著性水平步骤4、计算样本统计量的值5、作出统计决策 ( 两种方法 ) :(1) 将检验统计量的值与拒绝规则所指定的临界值相比较,确定是否拒绝原假设;(2) 由步骤 5 的检验统计量计算 p 值, 利用 p 值确定是否拒绝原假设。表 15假设检验 平均数差异检验假设检验

29、 平均数差异检验总体情况检验方法标准误方差已知( n可以为任意值) Z 检验X正态n样本检验值备注X注:Z检验和 Z 检验相同095%1.96s(双) 1.645s (单)ZSEX99%2.58s(双侧) 2.33s (单)与总方差n30Z检验X0t体未知n30t 检验SEX非正n30Z检验/态n30t 检验XSn-1分布方差检验方法已知Z样本正态与样本t (df=n1+n2-样本公式22DXD12SEDXZXn1n2SED X独立DXX1X 2DX12222r 1 2DX相关SED12ZXnSED XSEDX211X1X2sp ()tn1n2SED X齐性1=2未知2)独立n1 s12n2

30、s22s2pn1n1 2t (df=n-1 )不齐性12t 不考虑 是否相等t (df=n-1 )非正已知Z态独立n1=n2两总体方差不一致n1n2相关/独立n1, 、n23/相关0/50独立n1, 、n23未知相关0/50方差齐性检验表 16假设检验 方差与相关系数显著性检验假设检验 方差与相关系数显著性检验样本与总体两样本方差备注2ns21、独立样本注: A1AA2不显著,s大2AA1,AA2 ,显著2F0s小2df=n-1注: df 1 =n1-1 ,df 2=n2-1倒数性质: F =1/F (1- )2、相关SE4s12 s221 r 2n2s12s22tSE相关系数的显著性检积差相关显著性1、=0SE1r 2 r 0n2SEt t 1 显著, t t 1 不显著。1、0注: df=n-2其他相关系数公式W等级S点二列质量二列验SEZ r1n 3Zr ZZSEZr多列品质四格表 17非参数检验非参数检验优点缺点1、一般不涉及总体参数,其假设前提也比参数假设检1、统计效能远不如参数检验方法。验少得多,容易满足。2、对数据的限制较为宽松,只能从中提取一般的信息, 相评价2、适用面较广。对参数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论