统计学第五章概率与概率分布_第1页
统计学第五章概率与概率分布_第2页
统计学第五章概率与概率分布_第3页
统计学第五章概率与概率分布_第4页
统计学第五章概率与概率分布_第5页
已阅读5页,还剩104页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学第五章概率与概率分布第一页,共一百零九页,编辑于2023年,星期三人类探索的无止境前几章只介绍了一些描述一组数据全貌所用统计量的计算方法,实现了对教育研究中实得资料的一般性描述。科学研究的任务不仅仅是描述一组实得资料的情况,更重要的是根据这组资料去推论总体的情况。实例第二页,共一百零九页,编辑于2023年,星期三问题由样本所推论的总体情况是否可靠?推论正确的可能性有多大?犯错误的可能性又有多大?

概率如果知道某一样本在总体中出现的概率大,就可以认为该样本是来自总体,能反映总体的情况,反之,就不能反映总体的情况。

概率分布第三页,共一百零九页,编辑于2023年,星期三第五章概率分布第一节概率与概率分布基础第二节正态分布第三节二项分布第四节抽样分布第四页,共一百零九页,编辑于2023年,星期三教学目的与要求:了解概率的基础知识;掌握正态分布的特点及其应用;掌握二项分布的性质与应用;掌握常见抽样分布的主要特点及性质教学重点与教学难点:重点——正态分布、二项分布和抽样分布;难点——二项分布与抽样分布第五页,共一百零九页,编辑于2023年,星期三第一节概率与概率分布基础一、概率基础后验概率先验概率概率的性质概率的加法和乘法定理小概率事件P<.05P<.01第六页,共一百零九页,编辑于2023年,星期三小概率事件虽然不是不可能事件,但在一次试验中出现的可能性很小,不出现的可能性很大,以至于实际上可以看成是不可能发生的。在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率原理。小概率原理是统计学上进行假设检验(显著性检验)的基本依据。第七页,共一百零九页,编辑于2023年,星期三二、概率分布类型(一)根据随机变量的取值是否具有连续性连续分布——

正态分布

离散分布——

二项分布(二)根据分布的来源经验分布(样本分布)理论分布(总体分布)(三)根据概率分布所描述的数据特征基本随机变量分布抽样分布第八页,共一百零九页,编辑于2023年,星期三第二节正态分布(normaldistribution)正态分布是一种很重要的连续型随机变量的概率分布。心理与教育研究中有许多变量是服从或近似服从正态分布的,如智商、学业成绩、能力、心理健康水平等,许多统计分析方法也都是以正态分布为基础的。因此正态分布无论在理论研究上还是实际应用中,均占有重要的地位。

第九页,共一百零九页,编辑于2023年,星期三德莫佛高斯第十页,共一百零九页,编辑于2023年,星期三

高斯分布第十一页,共一百零九页,编辑于2023年,星期三高斯(Gauss1777-1855)

德国数学家、天文学家和物理学家,他和牛顿、阿基米德,被誉为有史以来的三大数学家。高斯是近代数学奠基者之一,有“数学王子”之称。其祖父是农民,父亲是泥水匠,母亲是一个石匠的女儿。高斯幼时家境贫困,但聪敏异常,表现出超人的数学天才。1795~1798年在格丁根大学学习1798年转入黑尔姆施泰特大学,翌年因证明代数基本定理获博士学位。从1807年起担任格丁根大学教授兼格丁根天文台台长直至逝世。高斯的成就遍及数学的各个领域,在数论、非欧几何、微分几何、超几何级数、复变函数论以及椭圆函数论等方面均有开创性贡献。第十二页,共一百零九页,编辑于2023年,星期三(一)正态分布函数看x=μ和σ=1时的Y值

第十三页,共一百零九页,编辑于2023年,星期三(二)正态分布特征第十四页,共一百零九页,编辑于2023年,星期三正态分布的形式是左右对称的,对称轴是经过平均数的垂线。正态分布的中央点最高,然后逐渐向两侧下降,并无限延伸,但永不与基线相交。正态分布是一族分布。它随随机变量的平均数、标准差的大小而呈不同的分布形态。标准正态分布曲线下的面积为1,标准差与概率间有一定的数量关系。正态曲线下的每一面积可视为概率,其值为每一横坐标值的随机变量出现的概率。

第十五页,共一百零九页,编辑于2023年,星期三第十六页,共一百零九页,编辑于2023年,星期三第十七页,共一百零九页,编辑于2023年,星期三X轴上用标准分Z代替原始分数,则根据标准分的性质,该分布的平均数为0、标准差为1标准正态分布

第十八页,共一百零九页,编辑于2023年,星期三(二)正态分布表的使用

根据Z值求概率P(看P88例3-19)根据概率求Z值(看P87例3-18)根据Z值或概率P查找纵线高度Y值(表在P318)第十九页,共一百零九页,编辑于2023年,星期三根据Z值求概率P表有两种表示,一种是P(0—Z)(方法)

第二十页,共一百零九页,编辑于2023年,星期三一种是P(-∞-Z)教材P318(方法)第二十一页,共一百零九页,编辑于2023年,星期三P(Z—Z)

第二十二页,共一百零九页,编辑于2023年,星期三

第二十三页,共一百零九页,编辑于2023年,星期三课堂练习题

问:若从中随机抽取一人,其智商高于125的可能性有多大?低于95的可能性有多大?第二十四页,共一百零九页,编辑于2023年,星期三例题:如果已知其智商处于总人群中的前5%,问:其智商至少是多少?如果已知其智商处于总人群中的后1%,其智商最高不超过多少?若已知其智商处于中间50%,其智商得分应处在什么范围内?

2.根据概率求Z值第二十五页,共一百零九页,编辑于2023年,星期三几个常用概率值双尾概率值︱Z0.05/2︱=1.96,︱Z0.01/2︱=2.58,这里下标中的0.05和0.01表示的是两端概率之和,斜杠2表示双尾概率。单尾概率值︱Z0.05︱=1.645,︱Z0.01︱=2.33第二十六页,共一百零九页,编辑于2023年,星期三3.根据Z值或概率P查找纵线高度Y值查找方法第二十七页,共一百零九页,编辑于2023年,星期三(三)正态分布在实践中的应用确定录取分数线在能力分组或等级评定时确定人数将能力、品行等的等级评定转化为数量化分数第二十八页,共一百零九页,编辑于2023年,星期三应用实例确定录取分数线

例题:某项职业录取考试,在参加考试的1600人中准备录取200人,考试分数接近正态分布,平均分为74,标准差为11,问录取分数是多少?第二十九页,共一百零九页,编辑于2023年,星期三计算步骤根据参考人数和录取人数确定录取比率;将录取比率视为正态曲线上端(右侧)的面积,找出相应的Z值;根据公式Z=X-/

计算出原始分数XX=+Z第三十页,共一百零九页,编辑于2023年,星期三

在能力分组或等级评定时确定人数例如:假设对100名报考研究生的学生按能力分为甲、乙、丙、丁四个组,问各组应有多少人才能使分组构成等距量尺?第三十一页,共一百零九页,编辑于2023年,星期三计算步骤:将正态分布基线上Z=-3至Z=3之间6个标准差的距离分成相等的几份;根据正态分布表查找各段Z值间的概率;再用各概率乘以学生总人数,即为各等级人数。第三十二页,共一百零九页,编辑于2023年,星期三3.将能力、品行等的等级评定转化为数量化分数

第三十三页,共一百零九页,编辑于2023年,星期三计算步骤:计算各等级人数的概率;求各等级中点所对应的Z值求各等级中点以下(上)的累加概率,并求出其与0.5的差;根据计算出的概率查找相应的Z值,该值就是各等级的数量化分数;第三十四页,共一百零九页,编辑于2023年,星期三练习题某年高考平均分500,标准差100,考分呈正态分布,某考生得到650分。设当年高考录取率为10%,问该生能否被录取?录取分数线:500+1.28*100=628第三十五页,共一百零九页,编辑于2023年,星期三某地区47000人参加高考,物理学平均分为57.08,标准差为18.04。问:(1)成绩在90以上有多少人?(2)成绩在80-90之间有多少人?(3)60分以下有多少人?第三十六页,共一百零九页,编辑于2023年,星期三(1)成绩在90以上有多少人?0.03438,1615.86(2)成绩在80-90之间有多少人?0.06766,3180(3)60分以下有多少人?0.56356,26487第三十七页,共一百零九页,编辑于2023年,星期三第三节二项分布一、定义:重复进行n次二项试验后不同“成功”次数的概率分布称为二项分布。第三十八页,共一百零九页,编辑于2023年,星期三二项试验(又称贝努里试验)任何一次试验恰好有两次试验,成功或失败,或A与非A。共有n次试验,并且n是事先给定的任意一个整数。各次试验相互独立,即各次试验之间无相互影响。任何一次试验中成功或失败的概率保持相同,即成功的概率在第一次为P(A),在第n次实验中也是P(A)。第三十九页,共一百零九页,编辑于2023年,星期三一次试验只有两种可能结果,即“成功”和“失败”(只说明两种结果或状态而已);各次试验中“成功”(失败)的概率相等成功概率:p失败概率:q=1-p各次试验相互独立,互不影响;凡是满足以上条件的试验称为二项试验。第四十页,共一百零九页,编辑于2023年,星期三二项分布函数的得来随机抽查2个婴儿中男婴的概率分布可能结果012次数x121概率P1/42/41/4X=0X=1X=2男女第四十一页,共一百零九页,编辑于2023年,星期三随机抽查3个婴儿中男婴的概率分布

可能结果0123次数x1331概率P1/83/83/81/8男女X=0X=1X=2X=3第四十二页,共一百零九页,编辑于2023年,星期三男女随机抽查的4个婴儿中男孩的概率分布X=0X=1X=2X=3X=4女第四十三页,共一百零九页,编辑于2023年,星期三可能结果01234次数x14641概率p1/164/166/164/161/16第四十四页,共一百零九页,编辑于2023年,星期三二项展开式的通式就是二项分布函数,运用这一函数式可以直接求出在n次二项试验中成功事件恰好出现X次的概率第四十五页,共一百零九页,编辑于2023年,星期三

第四十六页,共一百零九页,编辑于2023年,星期三假设把一个质地均匀的硬币抛掷3次,这时你和朋友打赌:着地时会有2次出现“正面”,赌注为10元。如果这种结果出现了,你的朋友必须给你10元钱。但谁最有可能赢得这10元钱呢?你还是你朋友?第四十七页,共一百零九页,编辑于2023年,星期三二项分布图第四十八页,共一百零九页,编辑于2023年,星期三

二、二项分布的特点二项分布的概率之和等于1。二项分布随n和p的变化而成一簇分布:当P=0.5时,无论n的大小,均为对称分布;当P≠0.5,n较小时为偏态分布,n较大时(np≥5或nq≥5)逼近正态分布。

第四十九页,共一百零九页,编辑于2023年,星期三第五十页,共一百零九页,编辑于2023年,星期三第五十一页,共一百零九页,编辑于2023年,星期三当二项分布接近正态分布时,在二项试验中成功事件出现次数的

1、平均数

2、标准差推导过程见王孝玲《教育统计学》第五十二页,共一百零九页,编辑于2023年,星期三三、在心理与教育研究中的用途二项分布是一种离散型随机变量的概率分布。二项分布在心理与教育研究中,主要用于解决含有机遇性质的问题。所谓机遇问题,是指实验结果可能由猜测而造成的。为了区分是猜测的结果还是真实的结果,就可用二项分布来解决。第五十三页,共一百零九页,编辑于2023年,星期三例题:在一项有关儿童认知发展的研究中,为了考察2岁儿童是否理解“最大”的概念,随机抽取了15名年龄在30-32个月之间的儿童,并分别对他们进行测试。测试的内容是让他们在三个物体中挑选出最大的一个。结果发现15名儿童中有9名能正确作答。问:该研究结果能否表明2岁儿童理解了“最大”的概念或能否排除猜测因素在作答中的作用。P=1/3,q=1-1/3=2/3,np=15*1/3=5μ=np,σ=1.897,若要保证95%,查表Z=1.64,临界次数=8+1.64*1.4=109﹤10,所以,不排除猜测的因素。第五十四页,共一百零九页,编辑于2023年,星期三解法1二项分布法首先假设是猜测的结果,并计算猜测作答正确的概率(利用二项分布函数)。判断是否小概率事件,如果是则表明不是猜测的结果,表明被试理解或掌握了相应的概念或知识。第五十五页,共一百零九页,编辑于2023年,星期三解法2正态分布法先求出二项分布的平均数与标准差而后利用正态分布计算如果要确定猜测作答正确是小概率(5%)事件至少需要正确作答几次(临界次数)。

X=+1.645最后用实际作答正确的次数与其相比较,如果实际作答正确的次数多于与小概率事件对应的临界次数,则排除猜测因素的作用。

第五十六页,共一百零九页,编辑于2023年,星期三例1:一名学生作答2道三择一的选择题,每作答1题正确的概率为1/3,错误的概率为2/3,问该生作答正确1题的概率是多少?例2:一名儿童对10个记忆项目进行再认,每个项目再认正确的概率为1/2,错误的概率为1/2,问该生再认正确6个项目的概率是多少?。例3:设生男孩的概率为p,生女孩的概率为

q=1-p,令X表示随机抽查出生的4个婴儿中“男孩”的个数,求X的概率分布。第五十七页,共一百零九页,编辑于2023年,星期三第四节抽样分布前言

统计学研究问题的方法是从特殊到一般,从部分到全局,即用样本来推断总体。从一个总体中可以抽取出很多很多的样本,而实际中一般只选取一个样本进行研究,所以你所选取的那一个具体的样本只是你随机选中的一个,你完全有可能选中另外的样本。统计学就是用你随机选中的一个样本来推断总体,为了让这种推断有根有椐,我们必须清楚这种随机的规律是什么?而抽样分布理论给出了答案。第五十八页,共一百零九页,编辑于2023年,星期三总体分布样本分布抽样分布下面是某班25名同学的某科成绩,它就是要研究的总体:

1~13号819966985592100846974776610014~25号8410068597160949192957884

第五十九页,共一百零九页,编辑于2023年,星期三

X1X2X3X4X5平均数第一次抽样学8成绩711009910084第二次抽样学号102312151778.8成绩74956610059第三次抽样学号5152211083.8成绩55100999174…………………………………………第六十页,共一百零九页,编辑于2023年,星期三第六十一页,共一百零九页,编辑于2023年,星期三常用的抽样分布

平均数的抽样分布方差的抽样分布

两个样本平均数差的抽样分布两个样本方差比的抽样分布第六十二页,共一百零九页,编辑于2023年,星期三一、样本平均数的抽样分布

一个正态总体中的抽样分布第六十三页,共一百零九页,编辑于2023年,星期三(一)总体正态且方差已知时的样本平均数的抽样分布

…正态分布(Z-distribution)一个正态总体中的抽样分布第六十四页,共一百零九页,编辑于2023年,星期三数据2342(2,2)(2,3)(2,4)3(3,2)(3,3)(3,4)4(4,2)(4,3)(4,4)第六十五页,共一百零九页,编辑于2023年,星期三应用:大样本或总体方差已知时的总体平均数的估计、样本平均数与总体平均数差异的检验随机抽取的一个样本平均数在其抽样分布中的位置为:一个正态总体中的抽样分布第六十六页,共一百零九页,编辑于2023年,星期三(二)总体正态且方差未知时的样本平均数的抽样分布

…t分布(t-distribution)应用:小样本或总体方差未知时的总体平均数的估计、样本平均数与总体平均数差异的检验第六十七页,共一百零九页,编辑于2023年,星期三

第六十八页,共一百零九页,编辑于2023年,星期三t分布的来源:

1900年左右,统计学家开始觉得标准正态分布并不总是用来寻找概率的正确分布。WilliamGosset(高赛特)是在爱尔兰一家啤酒厂工作的一名化学分析技术人员,他也是对此感到怀疑的人之一。于是他决定检验在概率问题中使用标准正态分布是否总是正确的。令人不可思义的是,Gosset以收集犯人的身高和左手中指长度开始了他的探索。他以每4个犯人作为一个样本,共收集了750个不同的样本,并对每一个样本都计算了一个数值。然后他绘制了两个直方图(身高和左手中指长度),想看一看每一个样本的所有的数值的分布是什么样的?他们与标准正态分布有多类似?结果Gosset发现两个直方图形状非常接近,但是与标准正态分布有很大不同。他将这个新分布命名为t分布,计算出的值也叫做t值。由于他的雇主害怕员工泄露酿造啤酒的秘密而禁止员工发表文章,所以Gosset在1908年发表上述研究结果时,使用了假名“学生”。正因为如此,t分布又名学生分布(student’sdistribution)。第六十九页,共一百零九页,编辑于2023年,星期三第七十页,共一百零九页,编辑于2023年,星期三特点:t分布以Y轴为对称轴,呈单峰对称状,且在t=0时,分布密度函数(纵线高度)取值最大。t分布受自由度的制约,每一个自由度都有一条t分布密度曲线。与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平。df越小这种趋势越明显。df越大,t分布越趋近于标准正态分布。当n>30时,t分布接近标准正态分布,当n→∞时,t

分布与标准正态分布完全一致。

第七十一页,共一百零九页,编辑于2023年,星期三自由度(degreeoffreedom):变量值可以自由变化的个数,常缩写为df。X1+X2=10df=1X1X2=4df=0X1与X2之间一个条件也没有df=2df=变量个数-限制条件数t分布中变量取值只受离差之和等于0的限制,故df=n-1第七十二页,共一百零九页,编辑于2023年,星期三t分布表的使用:(附表2P452)按自由度及相应的概率去找到对应的t值

例:t0.05/2(15)其意义是:P(-∞<t<-2.131)=P(2.131<t<+∞)=0.025;P(-∞<t<-2.131)+P(2.131<t<+∞)=0.05。第七十三页,共一百零九页,编辑于2023年,星期三(三)总体呈非正态,方差未知,n>30时,则样本均数的分布呈渐近正态分布

第七十四页,共一百零九页,编辑于2023年,星期三应用:样本方差与总体方差的差异检验、计数数据的假设检验二、样本方差的抽样分布→2分布第七十五页,共一百零九页,编辑于2023年,星期三特点:呈正偏态,随着自由度的增大,2分布趋近于正态分布。2都是正值。第七十六页,共一百零九页,编辑于2023年,星期三2分布表的使用:(附表14,P348)

按自由度及相应的概率去找到对应的2值第七十七页,共一百零九页,编辑于2023年,星期三20.05(7)

=14.1

第七十八页,共一百零九页,编辑于2023年,星期三三、两样本平均数之差的抽样分布第七十九页,共一百零九页,编辑于2023年,星期三两样本的分类根据两样本内个体是否存在一一对应关系独立样本相关样本第八十页,共一百零九页,编辑于2023年,星期三独立样本:两个样本内的个体是随机抽取的,它们之间不存在一一对应关系。例1:为了比较独生子女与非独生子女社会性方面的差异,随机抽取独生子女25人,非独生子女31人,进行社会认知测验。例2:从某大学一年级随机抽取部分学生,其中男生100人,女生80人,研究男生与女生英语成绩有无显著差异。第八十一页,共一百零九页,编辑于2023年,星期三相关样本:两个样本内个体存在一一对应关系。重复测量样本:对同一组被试先后进行两次测量所获得的样本。匹配样本:根据某些基本条件相同的原则,将被试匹配成对,然后将他们随机分配到实验组和控制组接受不同的实验处理所获得的样本。第八十二页,共一百零九页,编辑于2023年,星期三例1:为了揭示小学二年级的两种识字教学法是否有显著差异,根据学生的智力水平、努力程度、识字量多少、家庭辅导力量等条件基本相同的原则,将学生配成10对,然后把每对学生随机地分入实验组和对照组。实验组施以分散识字教学法,而对照组施以集中识字教学法。例2:为考察某一试卷的稳定性,随机选取36名学生先后施测两次,以求两次测验间的相关。第八十三页,共一百零九页,编辑于2023年,星期三两样本容量不相等时,一定不是相关样本,但相等时不一定是相关样本。

第八十四页,共一百零九页,编辑于2023年,星期三(一)总体正态且方差已知时,样本平均数之差的 抽样分布——正态分布平均数:独立样本标准误:相关样本标准误:第八十五页,共一百零九页,编辑于2023年,星期三独立样本Z值计算:相关样本Z值计算:第八十六页,共一百零九页,编辑于2023年,星期三第八十七页,共一百零九页,编辑于2023年,星期三独立样本的标准误:第八十八页,共一百零九页,编辑于2023年,星期三相关样本的标准误:第八十九页,共一百零九页,编辑于2023年,星期三第九十页,共一百零九页,编辑于2023年,星期三(二)总体正态方差未知时,样本平均数之差的抽样分 布平均数:标准误:独立样本大样本第九十一页,共一百零九页,编辑于2023年,星期三小样本方差齐性:第九十二页,共一百零九页,编辑于2023年,星期三方差齐性:

第九十三页,共一百零九页,编辑于2023年,星期三相关样本大样本第九十四页,共一百零九页,编辑于2023年,星期三小样本第九十五页,共一百零九页,编辑于2023年,星期三四、两个样本方差比的抽样分布F分布F分布是以英国统计学家费舍尔(R.AFisher)的姓氏的第一个英文字母命名的概率分布。第九十六页,共一百零九页,编辑于2023年,星期三费舍尔.罗纳德(Feisher.Ronald1890-1962)英国统计学家,出生于英国伦敦附近,在剑桥接受教育,早年在赫德福德郡的罗塞姆斯特德农业研究实验站担任统计员,后入伦敦大学,继皮尔逊后担任优生学和生物统计学教授职位,并在剑桥大学担任遗传学教授。费舍尔是现代最具有创造力的统计学家,为心理学提供了(1)方差分析(2)小样本理论(3)零假设等重要概念。第九十七页,共一百零九页,编辑于2023年,星期三应用:两总体方差齐性(是否相等)检验、方差分析(多个总体的平均数是否相等)第九十八页,共一百零九页,编辑于2023年,星期三特点呈正偏态,随着自由度的增大,F分布趋近于正态分布。F都是正值。F分布表的使用(附表6AP328,双侧,附表6BP332,单侧)按两个自由度及相应的概率去找到对应的F值

第九十九页,共一百零九页,编辑于2023年,星期三第一百页,共一百零九页,编辑于2023年,星期三计算步骤:Ifyouarebeginningwitharawscore,firstconvertittoaZscore.Drawapictureofthenormalcurve,wheretheZscorefallsonit,andshadeintheareaforwhichyouarefindingtheprobability.Findtheexactprobabilityusingthenormalcurvetable.第一百零一页,共一百零九页,编辑于2023年,星期三121.4119.2124.7125.0115.0112.8120.2110.2120.9120.1125.5120.3122.3118.2116.7121.7116.8121.6120.2122.0121.7118.8121.8124.5121.7122.7116.3124.0119.0124.5121.8124.9130.0123.5128.1119.7126.1131.3123.8116.7122.2122.8128.6122.0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论