现代心理与教育统计学_第1页
现代心理与教育统计学_第2页
现代心理与教育统计学_第3页
现代心理与教育统计学_第4页
现代心理与教育统计学_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

#2.当标准差相同而平均数不同时,曲线形状相同位置各异.当平均数相同而标准差不同时正态曲线有不同的形状,越大,曲线越是“低调”,越小曲线越是“高窄”。(二)正态分布的特征(选择简答).正态分布的形式是对称的,对称轴是经过平均数的垂线。.正态分布的中央点最高,然后逐渐向两侧下降,曲线先向内弯,后向外弯,两端靠近基线处无限延伸。(拐点在正负一个标准差处)3。正态曲线下的面积为1,故对称轴正态曲线下的面积划分为相等的两部分。4。正态分布是一族分布.标准正态分布均值为0。标准差为1只有一条三正态分布表的编制与使用。标准正态分布函数的数值表:将一般正太分布化为标准正态分布,通过查表可解决正态分布的概率计算问题。(1)正态分布曲线的面积,高度与标准分数。(2)标准正态分布曲线相应内容的求解方法。1.已知2值,求面积p1)求均数(Z=0)与某个Z之间p的值,可直接查正态曲线表例如:求至Z=0~ Z=-1之间的面积2)求任何两个z之间的p例如:求z=1〜z=2之间的面积3)求每个z值以下或以上的面积。例如:z=-0.85以下和z=1.76以上的面积(三)正态分布中的几个常用值.正态分布的特点(它有的标准正态都有).正态分布的形式是对称的,对称轴是经过平均数的垂线.2。正态分布的中央点最高,然后逐渐向两侧下降,曲线先向内弯,后向外弯,两端靠近基线处无限延伸。(拐点在正负一个标准差处)3。正态曲线下的面积为1,故对称轴正态曲线下的面积划分为相等的两部分。4.正态分布是一族分布5。标准正态分布均值为0.标准差为1只有一条标准正态分布是正态分布的一种,平均数为0,标准差为1。区别:正态分布是一族分布,它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。标准正态分布的平均数和标准差都是固定的。联系:标准正态分布是正态分布的一种,具有正态分布的所有特征.所有正态分布都可以通过Z分数公式转换成标准正态分布。第三节二项分布一二项试验与二项分布(一)二项试验(条件)任何一次实验恰好有两个结果,成功与失败.共有n次试验,且n是预先给定的任一正整数.每次试验各自独立,各次实验之间无相互影响某种结果出现的概率在任何一次实验中都是固定的.例如抛硬币实验二项式(二)二项式定理的特点1。项数:二项式的展开式中共有n+1项。2,方次:二项式中,p的方次从n~0为降幂,则q 从0~n为升幂,且每项的p,q方次之和等于n(三)二项式的概率分布及其二项分布曲线。1。二项式的概率分布根据二项式的定理,若在n次实验中,求r次成功的概率分布函数。可由公式求得,上式也可写成二项分布的优点在于它能迅速地确定各种可能结果的概率..二项分布曲线(离散分布)当时,无论多大,二项分布曲线都总是对称的.当时,且当相当小,则图形显偏态。当n相当大时(),二项分布曲线逐渐接近正态分布.二二项分布的平均数和标准差。*二项分布接近正太分布的条件:或平均数标准差第四节正态分布一正态分布及渐进正态分布中心极限定理:总体服从正态分布.总体呈正态,总体方差已知,则样本均数的分布也呈正态根据中心极限定理则有:(1)样本均数的均数等于总体均数,即(2)样本均数的标准差等于总体标准差除以样本容量的平方根.即(标准误)(3)转为标准正态分布.总体呈非正态,总体方差,已知,样本容量足够大(),样本平均数的分布为渐近正态分布(看作正太分布).根据中心极限定理,亦有.(1)样本均数的均数等于总体均数。(2)样本均数的标准差等于总体标准差除以样本容量的平方根.(3)转为标准正态分布二分布1。分布的定义(学生氏分布)分布是由小样本统计量形成的概率分布。2。七分布的应用(1)总体正态,未知,且,样本平均数的分布呈分布。分布的标准误为检验值为2)总体成非正太,未知,则样本均数的分布近似为t分布和渐近正态分布其样本均数的标准误为:检验值或t分布(选择简答)(标准差大于1)(0为均值)t分布是类似正态分布的一种对称分部,他通常要比正太分布平坦和分散.一个特定的分布依赖于称之为自由度()的参数,随着自由度的增大(N〉45)分布也逐渐趋于正态分布。标准正态分布不管n的大小,曲线只有一条,而t分布是一族曲线一个服从正态的整体的平方分布检验值为(二)分布的特点(合成分布)(选择简答)1。分部是一个正偏态分布,越小x平方分布越偏斜。随着参数n的增大,分布趋近于正态分布。2。值都是正值.3。平方分布具有可加性。4。如果大于2,分布的平均数等于,方差等于2(特殊情况)四,F分布(一)F分布F分布是由两个卡方分布构成而成的一个新的分布.若随机变量随机变量的函数的分布规律称为F分布其中参数n1,n2是两个自由度。任意一个自由度不同就是另一个f分布。正如正态分布中均值或方差不同就是另一个正太分布一样(二)F分布的特点(多选).F分布是正偏态分布,随着两个自由度的增大.趋近于正态分布2。F总为正值3。当分子自由度为1,分母的自由度为任意值时,F分布与分母自由度相同概率的t值。(双侧概率)的平方相等,这一点说明当组间自由度为1时,f检验与t检验的结果相同.第七章参数估计第一节点估计、区间估计与标准误一点估计的定义以样本的统计量(数轴上的一个点)作为总体参数的估计值称为点估计。如:用样本平均数作为总体参数的估计值,样本标准差作为总体标准差例如:知样本的语文成绩的平均数是75分,我们便推论这个样本的总体参数(字母)也是75分。二良好估计量的标准1。无偏性:(多选简答)即用多个样本的统计量作为总体参数的估计值,其偏差的平均数为0。例如:用样本平均数作为总体的估计值就是无偏估计,因为无数个样本平均数的平均值既为.如果多个样本的统计量作为总体参数的估计值,其偏差的平均数大于或者小于零,则为偏估计,例如:样本方差就不是无偏估计而是2。有效性当总体参数的无偏估计不止一个统计时,无偏估计变异小的有效性高,反之则有效性低。即样本统计量的方差越小越好。(考虑)(平均数方差最小)例如:判断下列两个平均数的样本哪个有效..一致性当样本容量无限增大时,估计值应能够越来越接近他所估计的总体参数,估计值越来越精确,逐渐趋于真值。如:当.充分性指一个容量为的样本统计量,是否充分的反应了全部个数据所反应总体的信息.例如平均数m就能充分反映各个数据的信息.中数Md和Mo只能反映部分数据信息。三,区间估计与标准误一,区间估计的定义(名词解释)区间估计是一个统计量的区间来估计相应的总体参数,它要求按照一定的概率要求,根据样本统计量来估计总体参数可能落入的数值范围.特点,用数轴上的一段距离来表示未知参数可能落入的范围.例如:当已知样本的平均数是60时可以用区间(55。65)来估计总体参数的范围。二,置信区间与显著性水平。(名词解释选择题)1.置信区间也叫置信间距:是指在特定的可靠性(即置信系数)要求下估计总体参数所落的区间范围。例如:在95%的可靠下,总体的参数落在(90100)5%以下为小概率事件2。置信系数是指被估计的总体参数落在置信区间内的概率,又叫置信水平,置信度.例如:置信系数为95%时是指总体参数落在某个区间时的可靠性为95%,意味着可靠性能提高.3。显著性水平一个置信系数同时反映了在做出一个估计时所犯错误的小概率(),即可靠性为95%时意味着犯错误的概率为5%,可靠性为99%时,意味着犯错误的概率为1%。这种犯错误的小概率也叫做显著性水平,用a表示。1—置信系数=显著性水平。()如:1-95%=5%4。置信系数和置信区间的关系。(选择)观察:100%的可能性你的考试分数在(0,100)分95%的可能性,你的考数分数在(50,90)分置信系数越高,区间越大,估计越模糊。置信系数越小,区间越小,估计越精确。最佳的估计要置信区间适度,又要置信系数较高置信区间长度与显著性水平是反比的关系。(判断谁增大谁减小的问题)三区间估计的原理与标准误1。如何确定估计的区间?回想一下生活中的例子。某个食品包装袋上会告诉你被食品的重量是100+减3克,你们能否猜出这种食品的实际重量的区间是多少?(97.103)我们把3叫做误差在统计学中也是用误差来估计参数区间的长度的,解释总体参数落入这个置信区间的概率水平,这个误差有时候也叫样本统计量的标准差,为了区别总体的标准差,把它叫做标准误(SE)即:误差=样本统计量的标准差二标准误(SE)2。样本分布--—区间估计的原理与依据.第二节总体平均数的估计一.估计总体平均数的步骤.根据实得样本的数据,计算样本的平均数与标准差。2。计算标准误(最关键)3。确定置信水平或显著性水平。4.根据样本平均数抽样分布,确定查何种统计表5.计算置信区间6。解释总体平均数的置信区间。估计标准误1。当总体方差已知时,使用总体标准差来计算标准误。.当总体方差未知时使用样本方差计算标准误。二,总体方差已知时,估计参数正态估计法:一是总体正态时,不论样本容量的大小,样本均数的分布都呈正态分布。二是总体成非正态时,只要样本容量大于30,样本均数的分布呈渐进(近似)正态分布。三,总体方差(字母)未知时,估计参数(字母)t分布估计法1。总体正态,方差(字母)未知,样本容量无论大小都可以采用t分布系法。2.总体呈非正态,方差((字母))未知,若(n30)时,可用t分布法。若(n〈30)时,不能推论.分析:总体分布为正态,总体方差未知,但样本标准差已知,无论样本容量大小,都可以采用t分布估计法。t分布中,在相同置信系数下,t值会随样本容量口和自由度(字母)的变化而不同。为此,根据自由度查“t分布显著性临界值表”,确定t值第三节:标准差和方差的区间估计。(基本不会考)一,标准差的区间估计当n大于30样本标准差的分布渐进正态。标准差分布平均数为标准差分布的标准误为区间估计公式为(公式)1。因为总体未知,用样本标准差估计标准误。二,方差的区间估计从正态分布总体中抽取容量为n的样本.样本方差与总体方差比值为卡方分布,即(公式)和推论其置信区间为:(公式)框架小结参数估计的基本内容:点估计区间估计标准误总体平均数的估计:总体方差已知,对总体平均数的估计。总体方差未知,对总体平均数的估计。标准差异方差的区间估计:标准差的区间估计方差的区间估计二总体方差之间的区间估计.相关系数的区间估计:积差相关系数的区间估计。等级相关系数的区间估计.比率与比率差异的区间估计:比率的区间估计比率差异区间估计第八章假设检验第一节假设检验的原理(名词解释选择简答)在统计学中,通过样本统计量得出的差异做出一般性结论,判断总体参数之间是否存在差异,这种推论过程叫做假设检验。假设检验分为参数检验和非参数检验,前者指的是总体分布已知,需要对总体的未知参数作假设检验,后者指的是总体分布知之甚少,对总体的函数形式和特征进行假设检验假设检验是推论统计中最重要的内容。(差异是由抽样误差导致的还是由于参数间有真正的差异存在)一。备则假设与虚无假设(一)备择假设1。就是实验人员希望证实的假设,也称研究假设.性质:假设两个样本统计(或两个总体参数)之间,又或者是样本统计量与总体参数之间存在真实的差异是一种有差假设,用表示。3。表达方式(二)虚无假设1。研究人员为了证实研究假设是真的而利用概率论的反正法所进行的假设,即从研究假设的反面进行假设。2.性质:虚无假设是假设两个总体参数之间或样本统计量以总体参数之间不存在真正的差异,其现存的表面儿差异是由抽样所造成的误差,是一种无差假设,又称零假设,或原假设用符号表示表达方式(三)备责假设和虚无假设的关系。是想要的结果,但是无法直接验证。只能通过证明,反证的正确与否。结论:找到证据正确与否的依据就是假设检验的关键!假设检验就是为了找一个驳斥的机会.(四)假设检验的依据——--抽样分布理论(五)小概率事件统计学上小概率事件是指在指在一次试验中几乎不可能发生的,如果发生了则该事件被认为是不合理的传统上将不超过0。05的事件当做“小概率事件",有时也定0。01和0.001二,显著性水平1。含义:指为拒绝虚无假设(零假设)而设定的小概率值2。零假设与显著性水平的关系:如果零假设正确的可能性只有5%,我们就排除零假设,还可以把这临界值设置在1%或者0.1%,这种临界概率就称为显著性水平。显然通过,显然通过显著性水平可以判断是否接受零假设..显著性水平与拒绝和接受域因为5%的显著性水平在标准正态分布上对应的Z值加减1.96,所以当检验值落在(-1.96.1。96)时,我们认为零,我们认为零假设有95%是对的,接受它,则该区域为接受域。而当检验值落在(-00.-1。96)或(1。96.+00)时,我们认为零假设只有5%是对的,拒绝它则该区域为拒绝域4。差异显著判断规则(正态检验)虽然我们比较习惯取a=0。05和a=0.01,但也可以取其他的显著性水平直如,0。005和0。001.三,假设检验中的两类错误.(一)定义错误(1型错误)Ho为真时却被拒绝,弃真错误。错误是指虚无假设本身是正确的,但由于抽样的随机性而使检验值落入了拒绝虚无假设的区域,致使我们做出了拒绝虚无假设的结论.错误(11型错误)Ho假时,却被结束,取伪错误.错误是指虚无假设本身不正确,但由于抽样的随机性而使检验值落入了接受虚无假设的区域。致使我们做出了接受虚无假设的结论。说明事物之间没有显著的差异.(二)两类错误的关系(简答)。原因:与是两个前提下的概率。即a是拒绝原假设ho时犯错误的概率,这时前提是ho为真.(字母)是接受原假设ho时犯错误的概率,这时前提ho为伪2。在其他条件不变情况下,和不能同时减小或增大.当减小的时候,一定增大.当增大的时候,一定减小。想要和同时降低,需要改变数据分布,即要增大抽样的样本3。统计检验力三,单车与双侧检验1。双侧检验:只强调差异,不管大小(左右两侧都可以)检验假设为ho-零假设h1-备则假设.单侧检验:强调大小检验假设形式一:ho—零假设h1-备则假设形式二:hoh1四,假设检验的步骤.提出原假设和备则假设(三种)单侧双侧单侧又分为左侧右侧.确定适当地检验统计量(z,t,F)3。指定检验中的显著性水平a。4。利用显著性水平,建立拒绝ho原则.5.计算样本统计量的值6。做出统计决策(两种方法)(1)将检验统计量的值与拒绝规则所指定的临界值相比较,确定是否拒绝原假设.(2)有检验统计量计算p值,利用p值确定是否拒绝原假设。例题8-1某校一个心理班进行比奈智力测验,M=110,班级人数n=50,该测验常模(公式).该班智力水平(字母)(不是这一次检测结果)是否与常模水平有显著差异。解:1。提出零假设和备择假设.备择假设:用H1表示,即研究假设希望证实的假设.(公式)(该班智力水平确实与常模有差异.)(公式)零假设:用ho表示,即虚无假设,原假设,无差异假设(公式)2.确定适当的检测统计量。用于假设,检测问题的统计量称为检验统计量,与参数估计相同,需要考虑.(1)总体是否正态分析(2)大样本还是小样本(3)总体方差已知还是未知。本例中总体正态,样本容量大于等于30,检验统计量为z分布。.指定检验中的显著性水平。显著性水平就是指当假设正确时人们却把它拒绝了的概率和风险。用a表示通常取a=0.05或a=0。01或a=0.001,那么接受原假设时正确的可能性(概率)为95%,99%,99.9%这里取a=0.05,因为是z检验,所以临界值是-1.96.利用显著性水平,建立拒绝ho的规则。5。计算样本统计量的值(公式)6。做出统计决策(公式)所以z落入拒绝区域,推翻ho。接受h1,即该班的智力水平与常模有显著差异.第二节平均数的显著性试验。一检验方法平均数的显著性检验是指检验一个样本平均数与相应总体平均数之差.二条件分析1。确定是双尾检验,还是单尾检验2。明确总体方差(字母)是已知的还是未知的3.分析总体分布是正态的,还是非正态的.4。决定是采用z检验还是t检验,又或是检验。第三节,平均数差异的显著性实验。一.均数之差标准误的基本公式.随机从总体中抽取两个容量为n1和n2的一切可能样本时.两个样本的均速之差(公式)会形成一种抽样分布,两均数之差D在抽样分布上的标准差称两均数之差的标准误。记为(公式),只是根据不同的具体条件。(公式)公式有所不同方差齐性指的是总体方差齐性。两个样本方差一般是不齐性的第九章 方差分析第一节:方差分析的基本原理第二节:完全随机的方差分析第三节:随机区组的方差分析第四节:事后检验(了解)第五节:多因素方差分析初步.一.方差分析的基本原理:综合的检验(F检验t检验的推广版)方差分析:为了探讨一个因变量和一个或多个自变量之间的关系,主要功能在于分析实验数据中的自变量是否对因变量有重要影响。方差分析主要处理两个以上的总体平均数之间的差异检查问题。需要检验的虚无假设就是“任何一对平均数”之间是否有显著性差异,你的是虚无假设为,样本所属的所有总体的平均数都相等.一般把这个假设称为“综合虚无假设”表达方式为方差分析最关键的步骤就是变异的分解。表示总平方和,指试验产生的总变异.表示组间平方和,指不同试验处理而造成的变异.表示组内平方和,个体差异+随机误差,实验误差造成的差异.(误差)组间自由度组内自由度总自由度为个数为限制条件的个数组间均方 (均方=方差)组内均方后两者直接判断差异不显著二方差分析的基本过程与步骤。(简答)(一)求平方和(二)计算自由度(三)计算均方(方差)(四)计算值(五)查F表进行检验并做决断(六)列方差分析表二自由度的分析总自由度为总容量减去1,本例有12个数据,所以:(公式)组间自由度为组数(k)减1,本例有3个组,所以:(公式)组内自由度为总容量减组数减用总自由度减去组间自由度,既有(公式)(三)计算均方均方是平方和除以自由度。组间平方:(公式)组内均分:(公式)(四)计算值(公式)(五)查分布临界值作出判断.(公式)(公式)三方差分析的基本假定(选择)1。总体正态分布2。变异的相互独立性3。总体方差齐性(先做)进行方差分析要求各水平下的样本量相同四方差分析中的方差齐性检验.方差齐性检验就是检验各总体方差是否一致的统计方法。其虚无假设是假设各个总体的方差相等(即无显著差异)或是各个样本方差来自相同的总体,其表达方式即为:(分子自由度)第二节完全随机设计的方差分析。(组间方差分析、被试间方差分析)在这种实验设计中,只有一个实验变量,这个实验变量有多个水平,每个被试只接受一种实验处理。第三节随机区组设计的方差分析每个被试接受所有水平处理区组差异:体现了个体误差区组差异个体误差练习效应疲劳效应第四节事后检验多重比较是进一步分析成对平均数的差异。即我们知道几种实验处理之间是有差异的,现在我们想进一步知道是谁与谁之间是有差异的。检验法(检验法)(一)N-K检验的原理N-K检验室找出每对平均是之间存在的,随机变异,即各对平均数差异的标准误。然后该标准误比较平均数之间的差异,其统计量称为q值.(二)检验的步骤1。把要比较的个平均数从小到大做等级排列以r表示。2。计算统计量(公式)是任意两个平均数的差值。3。计算等级的相差数即(公式)4.找出自由度的df,这里是误差项与自由度即(字母)5。根据r和(字母)和显著性水平0.01和0.05查处比较的临界值与计算的q值比较,做出决策第五节多因素方差分析基本概念(1)因素:自变量水平:自变量的不同水平(2)交互作用:一个实验中有两个或两个以上的自变量,当一个自变量的效果在另一个自变量的每一个水平上不一样时,我们就说存在着自变量的交互作用。主效应:某因素不同水平的平均数差异成为主效应.(有几个自变量就有几个主效应)22完全随机交互作用不明显再看主效应22随机区组交互作用显著再进行简单效应检验第十章卡方检验(简答形式的计算题/计算题)第一节卡方检验的原理第二节配合度检验第三节独立性检验思考:例一,随机抽取60名学生,询问他们在高中是否需要文理分科,赞成分科的39人,反对分科的21人,问他们对分科的意见是否有显著差异。39大于21,所以学校决定不要分科这样做可以吗?例2:例某企业生产三种类型的手机:a类型b类型c类型,在一次市场调查中,公司市场研究小组提出了男女使用者对于三种手机类型偏好是否有差异的问题。(表格)有的人因此用t检验检验两者的差异,这样做行吗。第一节卡方检验的原理(皮尔逊)称名数据的差异问题一,卡方检验的假设(一)分类相互排斥,互不包容.卡方检验中的分类必须相互排斥,这样每一个观测值就会被划分到一个类别和另一个类别之中。(二)观测直相互独立各个被试的观测值之间彼此独立,这是最基本的一个假定,如果一个被试对某一品牌的选择对另一个被试的选择没有影响。(三)期望次数的大小有规定。(理论次数5)为了努力使卡方分布成为卡方值准确的近似估计每一个单元格中的期望次数应该至少在五以上。二卡方检验的类别(一)配合度检验配合度检验主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近,这种卡发检验方法有时也称为无差假说检验。(二)独立性检验独立性检验是用来检验两个或两个以上因素各种分类之间是否有关联或是和是否具有独立性的问题.卡方检验的基本公式(定义公式)实际观察次数理论次数第二节配合度检验配合度检验主要用于检验单一变量(一个因素)的实际观察次数分布与某理论次数是否有差别,由于太检验的内容仅涉及一个因素多项分类的计数资料,故可以说是一种单因素检验。配合度检验的一般问题(一)统计假设基本公式(二)自由度的确定在配合度检验中自由度公式:为分类项数(三)理论次数的计算规则。数据分布以其理论概率为依据,这时理论次数等于总次数乘以某种属性出现的概率。即p每个分类出现的概率理论次数计算一般是根据某种理论,按一定的概率通过样本的实际观察次数计算,某种理论有经验概率,也有理论概率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论