心理学考研-心理统计资料-统计推断的数学基础_第1页
心理学考研-心理统计资料-统计推断的数学基础_第2页
心理学考研-心理统计资料-统计推断的数学基础_第3页
心理学考研-心理统计资料-统计推断的数学基础_第4页
心理学考研-心理统计资料-统计推断的数学基础_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 点这里,看更多心理学资料 2017考研已经拉开序幕,很多考生不知道如何选择适合自己的考研复习资料。中公考研辅导老师为考生准备了【心理学考研知识点讲解和习题】,希望可以助考生一臂之力。同时中公考研特为广大学子推出考研集训营、专业课辅导、精品网课、vip1对1等课程,针对每一个科目要点进行深入的指导分析,欢迎各位考生了解咨询。第七章 统计推断的数学基础【本章综述】本章首先介绍推论统计的数学基础概率论,作为学习推断统计的基础;接着重点阐释几种典型的概率分布;最后会介绍抽样的原理与抽样方法。【考点分布】统计推断的数学基础单选多选简答综合总分2007年637452008年5979122009年46,

2、56, 5762010年6522011年57, 59, 6362012年47, 5175112013年49, 5042014年6522015年49, 514【本章框架】【复习建议】第一,概率的基本性质,掌握按照概率的加法和乘法原则进行计算就可以;第二,概率分布是重中之重,必须掌握各个概率分布的特点;第三,抽样原理需要同学们透彻理解的,熟悉每一种抽样方法的特点。根据历年的考点分布情况可知本章绝对是非常重要的章节。第一节 概率1. 概率表明随机事件出现可能性大小的客观指标。概率的定义有两种,即后验概率和先验概率。 先验概率:实验的每一种基本事件是有限的并且每一个基本事件出现的可能性相等。在这种条件

3、下,如果基本事件的总数为n,事件A包括m个基本事件,则事件A的概率为,这种概率称为先验概率。(这种情况下,直接计算的比值,是真实概率而不是估计值) 后验概率:在对随机事件进行n次观测时,其中某一事件A出现的次数m与观测次数n的比值。当n趋向于无穷大时,这个比值将稳定在一个常数P上,记作。随着观测次数无限增大,计算出的概率估计值越趋近真实的概率值,它由事件A出现的次数决定,因此称为后验概率或统计概率。注意:概率值在0,1之间。概率接近1的事件其发生的可能性较大,而概率接近0的事件其发生的可能性较小。然而,概率等于1的某个事件,并不能被断定为必然事件,只能说它出现的可能性非常大。同样,概率等于0的

4、事件,也不能说它就是不可能事件,只能说它出现的可能性非常小,以至接近0。2. 概率的加法定理:两个互不相容的事件A、B之和的概率,等于两个事件概率之和。(互不相容事件是指在一次实验或调查中,若事件A发生则事件B就一定不发生,否则二者为相容事件)3. 概率的乘法定理:两个独立事件同时出现的概率等于这两个事件概率的乘积。(独立事件指的是一个事件的出现对另一个事件的出现不发生影响)4. 概率分布类型概率分布是指对随机变量取值的概率分布情况用数学方法(函数)进行描述。概率分布依据不同的标准可以分为不同的类型: 离散分布与连续分布(依据随机变量是否连续)离散分布:离散随机变量的概率分布,最常用的离散分布

5、为二项分布,除此之外还有泊松分布和超几何分布等。连续分布:连续随机变量的概率分布,最常用的连续分布为正态分布,除此之外还有负指数分布和威布尔分布等。 经验分布与理论分布(依据分布函数的来源)经验分布:根据实验或观察所获得的数据而编制的次数分布或相对频率分布,它往往是总体的一个样本。理论分布:有两个含义,一是随机变量概率分布的函数,二是按某种数学模型计算出的总体的次数分布。随机变量概率分布的性质由它的特征数来表达,这些特征数主要有期望值,即理论平均数和方差,即理论的标准差的平方。 基本随机变量分布与抽样分布(依据概率分布所描述的数据特征)心理统计中常用的基本随机变量分布有二项分布与正态分布。抽样

6、分布是样本统计量的理论分布。样本统计量有:平均数、两平均数之差、方差、标准差、相关系数、回归系数、百分比率(或概率)等。统计量是基本随机变量的函数,所以抽样分布又称随机变量函数的分布。第二节 概率分布(一) 正态分布1. 正态分布也称常态分布或常态分配,由棣莫弗1733年发现的。高斯、拉普拉斯各自发现正态分布曲线方程,高斯首次提出正态分布曲线,所以有时也称高斯分布。2. 正态分布特征 正态分布曲线函数(密度函数)式中:是圆周率3.14159;是自然对数的底2.71828;X为随机变量取值,负无穷到正无穷大;为理论平均数;为理论方差; y为概率密度,即正态分布的纵坐标。当X=时,。当=1时,中央

7、点的y最高,即y = 0.3989。 正态分布的特征a. 正态分布的形式是对称的(但对称的不一定是正态分布),它的对称轴是经过平均数点的垂线(平均数、中数和众数三者相等),此点处y值最大。左右不同间距的y值不同,各相当间距的面积相等,y值也相等;b. 正态分布的中央点最高,然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯,拐点位于正负1个标准差处,曲线两端向靠近基线处无限延伸,但始终不能与基线相交;c. 正态曲线下的面积为1,由于它在平均数处左右对称,所以过平均数的垂线将正态曲线下的面积划分为相等的两部分,各为0.5(注意:正态分布曲线下各对应的横坐标处与平均数之间的面积可用积分公式计算,

8、这个面积可视为概率,即各横坐标值对应的随机变量值出现的概率);d. 正态分布是一族分布,它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。如果平均数相同,标准差不同,这是标准差大的正态分布曲线形式低阔,而标准差小的正态分布曲线形式高狭。所有正态分布都可以通过Z分数公式转换成标准正态分布,=0,=1。e. 在正态分布曲线下,标准差与概率(面积)有一定的数量关系(详听老师课程内容)。3. 正态分布表的使用:依据Z分数求概率p;根据概率p求Z分数;已知概率p或Z分数求概率密度y。4. 次数分布是否为正态分布的检验方法:皮尔逊偏态量数法;峰度、偏度检验法;累加次数曲线法;卡方检验中的吻合

9、度检验等。5. 正态分布理论在测验中的应用: 化等级评定为测量数据; 确定测验题目的难易度; 在能力分组或等级评定时确定人数; 测验分数的正态化; 标准分数与正态分布相结合应用。(二)二项分布1. 二项分布是由贝努里创始的,又叫贝努里分布,它是指试验仅有两种不同性质结果的概率分布,即各个变量都可归为两个不同性质中的一个,两个观测值是对立的,因而二项分布又可说是两个对立事件的概率分布。如考试中的通过与不通过等。2. 二项试验 任何一次试验恰好有两个结果,成功与失败; 共有n次试验,并且n是预先给定的任一正整数; 每次试验各自独立,各次试验之间无相互影响; 某种结果出现的概率在任何一次试验中都是固

10、定的。3. 设有n次试验,各次试验是彼此独立的,每次试验某事件出现的概率都是p,不出现的概率都是q(等于1-p),则对于某事件出现X次(0,1,2,n)的概率分布为:表示在n次试验中有X次成功,成功的概率为p。X =0,1,2,n为正整数,n和p为二项分布概率函数的两个参数。4. 二项分布的性质 二项分布是离散型分布,概率直方图是跃阶式。因为X为不连续变量,用概率条图表示更合适,用直方图表示只是为了更形象。随着n正大,二项分布接近正态分布; 二项分布的平均数与标准差如果二项分布满足pq, np5 (或pq, np5)时,二项分布接近正态分布。这时二项分布的X变量具有如下的性质:,。5. 二项分

11、布的应用主要解决含有机遇性质的问题(三) 样本平均数的分布中心极限定理:对于任意平均数为,标准差为的总体,样本容量为n的样本平均数分布的平均数为,标准差为。n30或趋于无穷大时,样本平均数的分布趋近于正态分布。注意:在涉及样本统计量的分析时,首先要保证各个样本是独立的,各个样本都服从同样的分布。为了保证这一点,取样方法应该用随机抽样的方法。样本平均数的分布以下是指样本平均数为的分布为正态分布及渐近正态分布的两种情况,凡符合这两种情况的分布,都可以根据正态分布的概率进行统计推论。 总体分布为正态,总体方差已知,样本平均数的分布为正态分布,那么:;为样本平均数分布的平均数;为样本平均数分布的方差,

12、常称之为变异误;为样本平均数分布的标准差,为了与总体的标准差区别开,一般称为标准误或平均数的标准误,也有时用SE表示。 总体分布为非正态,但总体方差已知,这时样本足够大时(n30),其样本平均数的分布为渐近正态分布,那么:样本平均数分布的平均数、标准差和方差与相同。当总体分布为正态,方差未知时,样本平均数的分布为t分布。无限多个样本平均数的平均数就是总体平均数,而平均数分布的标准差与样本本身的标准差有以下关系:(每个样本的标准差不同,故样本平均数分布的标准误也不同,只是的估计值) 当总体分布为非正态而其方差又未知时,若满足n30这一条件,那么样本平均数的分布近似t分布。(四) t分布t分布是统

13、计学者高赛特1908年在以笔名“Student”发表的一篇论文中推导的一种分布,有时也叫学生氏分布,这种分布是一种左右对称、峰态比较高狭,分布形状随样本容量n-1的变化而变化的一族分布。其公式如下:;t分布与无关,而与n-1(自由度)有关,t分布的自由度一般用符号df表示,即n-1。自由度:是指任何变量中可以自由变化的数目,是t分布密度函数中的参数(读nu),它代表t分布中独立随机变量的数目。1. t分布的特点: 平均值为0; 以平均值0左右对称的分布,左侧t为负值,右侧t为正值; 变量取值在; 当样本容量趋于时,t分布为正态分布,方差为1。当n-130以上时,t分布接近正态分布,方差大于1,

14、随着n-1的增大而方差渐趋于1;当n-130时,t分布与正态分布相差较大,随着n-1减少,离散程度越大,分布图的中间变低但尾部变高。2. 当总体分布为正态,方差未知时,样本平均数的分布为t分布。无限多个样本平均数的平均数就是总体平均数,而平均数分布的标准差与样本本身的标准差有以下关系:(每个样本的标准差不同,故样本平均数分布的标准误也不同,只是的估计值)3. 当总体分布为非正态而其方差又未知时,若满足n30这一条件,那么样本平均数的分布近似t分布。(五)c2分布1. c2分布是刻画正态变量二次型的一种重要分布。无限多个n个随机变量平方和或标准分数的平方和的分布,即为c2分布。c2(n)如果正态

15、总体的平均数未知,若用样本平均数作为的估计值时:c2(n-1)2.c2分布的特点: c2分布是一个正偏态分布,随着样本容量n的大小变化,其分布曲线的形状不同,n或n-1越小,分布越偏斜。df很大时,接近正态分布,可见c2分布也是一族分布; c2值都是正值; c2分布具有可加性; 如果df2,这时c2分布的平均数:,方差; c2分布是连续型分布,但有些离散型的分布也近似c2分布。3.c2分布在统计分析中应用于计数数据的假设检验以及样本方差与总体方差差异是否显著的检验等。(六)F分布1.设有两个正态分布的总体,其平均数与方差分别为:、及、,从这两个总体中分别随机抽取容量为n1及n2的样本,每个样本

16、都可计算出c2值,这样可得到无限多个c12与c22,每个c2随机变量各除以对应的自由度df1与df2之比,称为F比率,这无限多个F的分布称作F分布。 因为:,所以:根据上式,我们可理解F比率为样本方差各除以其总体方差的比率。如果令,即从一个总体中抽样,那么。这可以理解为,从一个正态总体中随机抽取容量为n1及n2两样本,其方差的比率分布为F分布,分子和分母的自由度分别为n1-1和n2-1,据此我们可以来检验任意两样本是否来自同一总体。2. F分布的特点: F分布形态是一个正偏态分布,它的分布随着df1与df2的增加而渐趋正态分布; F总为正值; 当分子的自由度为1,分母的自由度为任意值时,F值与

17、分母自由度相同概率的t值(双侧概率)的平方相等。 F 分布的倒数性质:第三节 抽样原理及方法1. 抽样原理抽样的基本原则是随机性原则,因此需要满足两个条件: 每个个体被选取的概率相等; 进行返回取样,以保证每个个体每次被抽取的概率不变。2. 随机抽样的作用: 随机抽样能使每个个体有同等机会被抽取; 随机抽样对于抽样误差可以预算或控制。对于抽样误差的预算,意味着对研究结果的精确度地客观评价,同时也能够按照所要求的精确度来决定样本应该具有多大容量。 3.样本量标准误代表着抽样误差,因而分析样本容量n与标准误SE 的关系可以解释样本容量与抽样误差之间的关系。4. 抽样方法包括概率抽样和非概率抽样两种

18、。概率抽样是根据已知的概率,按照概率论的原理严格随机选取样本,是最理想、最科学的抽样方法。具体包括以下几种: 简单随机取样法(抽签法,随机数字法:适合总体数目较小,个体差异较小时用)缺点:总体很大时使用不方便;常常忽略总体已有信息。 等距取样法(系统抽样或机械抽样:总体数目较大时用)一般来说这种抽样方法样本的代表性比简单随机抽样好些,但是如果总体具有一种周期性变化时,代表性就差了。例外,这种抽样方法也容易忽略已有信息。 分层随机取样法(按各层人数分配比例分配:个体差异较大时用)总的原则是:各层内变异小,层间变异越大越好。它充分利用了总体的已有信息。 多段随机取样法(如三阶段随机取样,总体数目很大时用)相对于简单随机取样来说,这种方法的标准误要大些,但是节省经费。非概率抽样: 方便取样,由调查人员自由、方便地选择被调查对象的非随机选择; 判断取样是通过某些条件过滤,然后选择某些被调查者参与调查的抽样方法。【课后习题演练】1. 在标准正态分布曲线下,正、负1个标准差范围内的面积占曲线下总面积的()A、25.00%   B、34.13%   C、50.00%

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论