心理学考研之心理统计学笔记_第1页
心理学考研之心理统计学笔记_第2页
心理学考研之心理统计学笔记_第3页
心理学考研之心理统计学笔记_第4页
心理学考研之心理统计学笔记_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1. 取样误差:样本统计量与相应的总体参数之间的差距2. 偏态分布:分数堆积在分布的一端,而另一端成为比较尖细的尾端,其与对称分布对应3. 离散型变量:由分离的、不可分割的范畴组成,临近范畴之间没有值存在4. 连续型变量:在任何两个观测值之间都存在无限多个可能值,它可被分割成无限多个组成部分5. 集中量数:集中量数又叫集中趋势,是体现一组数据一般水平的统计量。它能反映频数分布中大量数据向某一点集中的情况。1算数平均数 特点 在一组数据中每个变量与平均数之差的总和等于零 在一组数据中,每一个数都加上一个常数C,所得的平均数为原来的平均数加常数C 在一组数据中,每一个数都乘以一个常数C,所得的平均

2、数为原来的平均数乘以常数C优点:反应灵敏、计算严密、计算简单、简明易解、适合于进一步用代数方法盐酸、较少受抽样变动的影响缺点:易受极端数据的影响、不能在出现模糊数据时计算差异量数:差异量数就是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数。1离差与平均差平均差:次数分布中所有原始数据与平均数绝对离差的平均值2方差与标准差(1)总体的方差和标准差方差:每个数据与该组数据平均数之差乘方后的均值,即离均差平房后的均数作为样本统计量用符号s2表示,作为总体参数用符号2表示,也叫均方。标准差:方差的平方根作为样本统计量用符号s表示,作为总体参数用符号表示。(2)样本的方差和标准

3、差样本的变异性往往比它来自的总体的变异性要小。为了校正样本数据带来的偏差,在计算样本方差时,我们用自由度来矫正样本误差,从而有利于对总体参数更好的无偏差估计: 每一个观测值都加一个相同的常数C之后,计算得到的标准差等于原来的标准差 每一个观测值都乘以一个相同的常数C,所得到的标准差等于原标准差乘以这个常数3变异系数差异系数:一种最常用的相对差异量,为标准差对平均数的百分比 (四)相对量数1 百分位数:在整个分布中,在某一值之下或等于该值的分数的百分比,所对应的分数。百分位数和百分等级是同一操作定义的两端。当我们求累计次数占总体的百分比是,所对应的分数和百分比的值分别为百分位数和百分等级。2 百

4、分等级:常模团体中低于该分数的人所占总体的百分比。百分等级一定要对应分数区间的精确上限。百分等级和百分位数都可以由已知数据用差值法求解。3 标准分数:以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数,也叫Z分数。离平均数有多远,即表示原始分数在平均数以上或以下几个标准差的位置。Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量一组原始分数转换得到的Z分数可正可负,所有原始分数的Z分数之和为零原始数据的Z分数的标准差为1若原始分数呈正态分布,则转换得到的所有Z分数均值为0,标准差为1的标准正态分布可比性不同性质的成绩,一经转换为标准分数,就可在同一背景下比较可加性不同性

5、质的原始数据具有相同的参照点,因此可相加明确性知道了标准分数,利用分布寒暑表就能知道其百分等级稳定性转换成标准分数之后,规定了标准差为1,保证了不同性质分数在总分数中权重一样(五)相关量数相关系数:两列变量间相关程度的数字表现形式。作为样本的统计量用r表示,作为总体参数一般用表示。正相关:两列变量变动方向相同负相关:两列变量中有一列变量变动时,另一列变量呈现出与前一列变量方向相反的变动零相关:两列变量之间没有关系,各自按照自己的规律或无规律变化1积差相关数据要成对出现,即若干个体中每个个体都有两种不同的观测值,并且每队数据与其它对子相互独立两列变量各自总体的分布都是正态的,至少接近正态两个相关

6、的变量是连续变量,也即两列数据都是测量数据两列变量之间的关系应是直线性的(2)公式r也就等于X和Y共同变化的程度除以X和Y各自变化的程度。2等级相关当研究考察的变量为顺序型数据时,若原始数据为等比货等距,则先转化为顺序型数据当研究考察的变量为非线性数据时(2)公式将原始数据转化为顺序型数据,仍然用Pearson相关公式计算即可。3肯德尔等级相关(1)肯德尔W系数也叫肯德尔和谐系数,原始数据资料的获得一般采用等级评定法,即让K个被试对N件实物进行等级评定。其原理是评价者评价的一致性除以最大变异可能性。Ri代表评价对象获得的K个等级之和N代表等级评定的对象的树木K代表等级评定者的数目4点二列相关与

7、二列相关(1)点二列相关适用于一列数据为等距正态变量,另一列为离散型二分变量。是与二分称名变量的一个值对应的连续变量的平均数是与二分称名变量的另一个值对应的连续变量的平均数p与q是二分称名变量两个值各自所占的比率st是连续变量的标准差(2)二列相关适用于两列变量都是正态等距变量,但其中一列变量被人为地分成两类。y为标准正态曲线中p值对应的高度,查正态分布表能得到5相关适用于两个变量都是只有两个点值或只表示某些质的属性。其中a、b、c、d分别为四格表中左上、右上、左下、右下的数据1概率:表明随即时间出现可能性大小的客观指标概率的定义包含以下两种,当观测次数够多时他们是相等的。后验概率:对随机事件

8、进行n次观察,某一事件A出现的次数m与观测次数n的比值在n趋近无穷时所稳定在的常数p先验概率:在满足试验可能结果数有限且每一种结果出现的可能性相等的条件下,随机事件包含的结果数除以结果总数2正态分布:当样本量足够大时,我们会发现生活中许多变量的分布都近似于正态曲线。特点正态曲线的形状就像一口挂钟,呈对称分布,其均值、中数、众数实际上对应于同一个数值大部分的原始分数都集中分布在均值附近,极端值相对而言比较少曲线两端向靠近横轴处不断延伸,但始终不会与横轴向交正态分布曲线转化为z分数后人以z分数与零点对应曲线下面积固定用法依据Z分数求概率,即已知标准分数求面积 从概率求Z分数,即从面积求标准分数值

9、已知概率或Z值,求概率密度,即正态曲线的高3二项分布:对于一个事件有两种可能A和B,但我们对这一事件观察n次,事件A发生的总次数的概率分布就是二项分布 二项分布的均值为 方差公式为 标准差的公式为4抽样原理与抽样方法抽样原理:抽样的基本原则是随机性原则,所谓随机性原则,是指在进行抽样时,总体中每一个个体是否被抽选的概率完全均等。由于随机抽样使每个个体有同等机会被抽取,因而有相当大的可能使样本保持和总体有相同的结构,或者说,具有最大的可能使总体的某些特征在样本中得以发现,从而保证由样本推论总体。抽样方法:简单随机取样法 系统随机取样法 分层随机取样法多段随机取样法5抽样分布 样本分布:样本统计量

10、的分布,是统计推论的重要依据(1)正态分布及渐近正态分布样本统计量为正态分布或者接近正态分布的情况都可根据正态分布的概率进行统计推论。总体分为正态或接近正态,方差已知,样本平均数和方差的分布为正态分布样本平均数分布的平均数和方差与母体的平均数和方差有如下关系:样本的方差及标准差的分布也渐趋于正态分布,其分布的平均数与标准差和总体有如下关系:(2)t分布t分布是一种与方差无关而与自由度有关的分布,很类似正态分布,我们可以将正态分布看作t分布当自由度为正无穷时的特例。总体分布为正态,方差未知时,样本平均数的分布为t分布: 其中(3)2分布2分布的构造是从一个服从正态分布的总体中每次抽去n个随机变量

11、,计算其平方和之后标准化的一个分布。分布曲线下的面积都是1,但伴随着n取值的不同,自由度改变,曲线分布形状不同,而当自由度趋近于正无穷时2分布即为正态分布,因此其于t分布一样都是一族分布,而正态分布都是其中的特例。(4)F分布如果有两个正态分布的总体,我们从其中各自取出两个样本,各自计算出2,则:更多情况下,我们所计算的F两样本取自相同总体,此时可将上式化简为:(二)参数估计当在研究中从样本获得一组数据后,如何通过这组信息,对总体特征进行估计,也就是如何从局部结果推论总体的情况,称为总体参数估计。总体参数估计问题可以分为点估计与区间估计。良好估计量的标准无偏性用多个样本的统计量估计总体参数的估

12、计值,其偏差的平均数为零有效性当总体参数的无偏估计不止一个统计量时,无偏估计变异小者有效性高,变异大者有效性低,即方差越小越好一致性当样本容量无限增大时,估计值应能够越来越接近它所估计的总体参数充分性样本的统计量是否充分地反映了全部n个数据所反映总体的信息点估计:用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计结果也以一个点的数值表示区间估计:根据估计量以一定可靠程度推断总体参数所在的区间范围,这个区间就叫做置信区间,相应的概率成为置信度,这两个量是共通变化的,置信区间越大,置信度越高;区间估计是用数轴上的一段距离表示未知参数可能落入的范围及落入该范围的概率。标准误:样本平均数

13、分布的标准差总体方差未知时用估算的总体方差计算标准误。2总体平均数的估计当总体方差未知时,则使用t分布对应置信度3标准差与方差的区间估计(1)标准差的区间估计(2)方差的区间估计(三)假设检验:统计学中的一种推论过程,通过样本统计量得出的差异作为一般性结论,判断总体参数之间是否存在差异。假设检验的实质是对可置信性的评价,是对一个不确定问题的决策过程,其结果在一定概率上正确的,而不是全部。两类假设:对于任何一种研究而言,其结果无外乎有两种可能,即是否符合我们预期。一般来说证伪一件事情比证实一件事容易,在行为科学的研究中,由于我们无法了解总体中除样本以外的个体情况,因此尝试拒绝虚无假设的方法优于证

14、明备择假设。备则假设:因变量的变化、差异却是是由于自变量的作用,往往是我们对研究结果的预期,用H1表示。虚无假设:实际上什么也没有发生,我们所预计的改变、差异、处理效果都不存在观察到的差异只是随机误差在起作用,用H0表示。小概率原理:小概率事件在一次试验中几乎是不可能发生的两类错误型错误:当虚无假设正确时,我们拒绝了它所犯的错误,也叫错误型错误:当虚无假设是错误的时候,我们没有拒绝所犯的错误,也叫错误两类检验的关系+不一定等于1 在其他条件不变的情况下,与不可能同时减小或增大检验的方向性单侧检验:强调某一方向的检验,显著性的百分等级为双侧检验:只强调差异不强调方向性的检验,显著性百分等级为/2

15、假设检验的步骤 据问题要求,提出虚无假设和备择假设 选择适当的检验统计量确定检验的方向性并规定显著性水平 计算检验统计量的值将统计量的值与临界值对比做出决策2样本与总体平均数差异的检验(1)总体正态分布且方差已知其中和分别为总体的平均数和方差(2)总体正态分布而方差未知其中而为用样本和方估算出的总体方差3两样本平均数差异的检验这是两样本平均数检验的通用公式,所不同的仅在于标准误的计算(1)总体方差已知独立样本相关样本其中r为两组变量之间的相关系数(2)总体方差未知独立样本(方差差异不显著时)相关样本a.相关系数未知:其中d为每一对对应数据之差b.相关系数已知:4方差齐性检验(1)样本方差与总体

16、方差当从正态分布的总体中随机抽取容量为n的样本时,其样本方差与总体方差比值服从2分布:由自由度查2表,依据显著性水平判断(2)两个样本方差之间独立样本其中当两样本自由度相差不大时可用代替查表时相关样本其中5相关系数的显著性检验积差相关a.当=0时:其中b.当0时:先通过查表将r和转化为费舍Zr和Z然后进行Z检验等级相关和肯德尔W系数在总体相关系数为零时:查各自的相关系数表,判定样本相关显著(四)方差分析(1)方差分析的概念方差分析的目的是推断多组资料的总体均数是否相同,也即检验多组数据之间的均数差异是否有统计意义。当我们用多个t检验来完成这一过程时,相当于从t分布中随机抽取多个t值,这样落在临

17、界范围之外的可能大大增加,从而增加了型错误的概率。我们可以把方差分析看作t检验的增强版。(2)方差的可分解性方差分析依据的基本原理就是方差的可加性原则。作为一种统计方法,方差分析把实验数据的总变异分解为若干个不同来源的分量。数据的变异由两部分组成:组内变异:由于实验中一些希望加以控制的非实验因素和一些未被有效控制的未知因素造成的变异,如个体差异、随机误差。组内变异是具体某一个处理水平之内的,因此在对总体变异进行估计的时候不涉及研究的处理效应。组间差异:不仅包括组内变异的误差因素,还包括了是不同组所接受的实验处理不同造成的影响。 如果研究数据的总变异是由处理效应造成的,那么组间变异在总变异中应该

18、占较大比例。表示组间方差,表示实验条件的个数表示组内方差,表示每种实验条件中的被试个数(3)方差分析的基本假定样本必须来自正态分布的总体每次观察得到的几组数据必须彼此独立各实验处理内的方差应彼此无显著差异为了满足这一假定,我们可采用最大F比率法,求出各样本中方差最大值与最小值的比,通过查表判断。(4)方差分析的基本步骤 求平方和 总平方和是所有观测值与总平均数的离差的平方总和 其中表示所有数据的总合,表示总共的数据个数 组间平方和是每组的平均数与总平均数的离差的平方再与该组数据个数的乘积的总和 ,为数据总均值,为每组数据和,为该组数据个数 组内平方和是各被试的数值与组平均数之间的离差的平方总和

19、 (注:推荐用于检验之前的计算,而不是被当作快捷计算的方式) 计算自由度 计算均方 计算F值 查F值表进行F检验并做出判断 陈列方差分析表2完全随机设计的方差分析3随机区组设计的方差分析随机区组设计中同质被试参加所有水平下测试,因此,组间变异不包括个体差异的影响。而每一个水平之内仍然是由不同被试共同完成的,于是我们仍然将总体变异分为组间变异和组内变异,但需要进一步将组内变异分为被试间变异和误差引起的变异。这样,我们就可以在F检验时,将被试间变异从组内变异中去除,使得检验结果更灵敏。总差异组内差异组间差异个体差异随机误差个体误差用表示,而随机误差用表示,它们的和等于组内差异其中而;其中为同一区组

20、的数据之和,或者同一被试在不同处理下的乘积的和让我们回忆一下两个相关样本平均数假设检验,可以发现那里出现的情况和这里的多样本方差分析相仿。也就是说,对于同样的实验数据,当我们把它看作是由独立样本得出或相关样本得出时,就要采用不同的检验方法,从而有可能得出不同的结论。在假定为相关样本的数据得出的显著性差异如果换作背景是独立样本就可能只能接受虚无假设。这实际上是因为相关情况下样本之间差异的减小使得对应检验要使用的统计量变大,检验也就更加灵敏了。4两因素方差分析在两因素实验设计中,研究者同时用两种影响因素作为自变量研究它们对某一因变量的影响,其实验结果比单因素设计更实际。(1)交互作用与主效应主效应

21、:某个自变量的不同水平对因变量所造成的影响的差异交互作用:一个因素对因变量的影响因另一个因素的不同水平而不同 如果两个因素彼此独立,即不管其中一个因素处于哪个水平,另一个因素的不同水平均值间的差异都保持一致,则 不会产生交互作用。(2)统计原理为了看清各因素独立作用和交互作用的影响,我们进一步将组间差异分解:其中与分别表示a因素与b因素的组间平方和,表示交互作用的平方和;(3)F的计算(这里讨论独立样本)其中这里的是假定全体数据只根据a因素分为两组所计算的组间差异其中这里的也同样为假设只根据b因素分组所计算的组间差异其中这里的为总体组间差异减去和得到5事后检验由方差分析只能得到显著差异的结果,

22、事后检验使我们能够比较各组,发现差异具体产生在什么地方。事后检验采用成对比较的方式,每次比较两个组的差异。这里我们只介绍常用的红丝带检验而不是过气的内裤检验。HSD检验法 把要比较的各个平均数从小到大作等级排列 处理条件的数目,自由度查表得到相应显著性的值 计算作为临界值的(当为随机区组时用代替) 把要比较的两个平均数的差与临界值比较,若超过则认为差异显著(五)回归分析1一元线性回归分析(1)基本概念回归分析:通过大量的观测发现变量之间存在的统计规律性,并用一定的数学模型表示变量相关关系的方法 只有一个自变量并且统计量成大体一次函数的线性关系的回归分析叫一元线性回归分析。在一元线性回归中,我们用作为回归方程,代表X与Y的线性关系其中:表示该直线在Y轴的截距 表示该直线的斜率也就是的变化率 为自变量,通常是研究者事先选定的数值 为对应于对变量Y的估计值(2)最小二乘法所谓最小二乘法,就是如果散点图中每一点沿Y轴方向到直线的距离的平方和最小,则认为这条直线的代表性最好,即使用其作为回归方程。这样我们使得最小。其中;2一元线性回归方程的检验(1)方差分析法其中而其 其 其(2)回归系数检验其中而,它的意义是一个统计量,表示以为中心值上下波动的标准差(在知道相关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论