版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、心理统计学,第三章 概率与分布,2,E-mail: 主讲、制作:符永川,第三章 概率与分布,教学目标 了解有关概率的基本知识 理解常用概率分布的特征 掌握二项分布与正态分布的具体运用 教学内容 第一节 概 率 第二节 二项分布 第三节 正态分布,3,E-mail: 主讲、制作:符永川,在一定的条件下事先可以断定必然会发生某种结果的现象叫确定性现象。,第一节 概率,一、概率 随机现象,确定性现象 随机现象,必然现象 不可能现象,在一定条件下,事先不能断言会出现哪种情况的现象。 对随机现象的一次观测叫做一次随机试验。,在一定条件下必然不会发生的现象,在一定条件下必然会发生的现象,客观现象,4,E-
2、mail: 主讲、制作:符永川,第一节 概率,特点 偶然性:试验结果不能预言 必然性:大量次重复试验下,呈现出统计规律性 对“空中掷一枚硬币”进行观察: 在1.2万次的重复观察中,正面向上有6019次 在2.4万次的重复观察中,正面向上有12012次 规律: “正面向上”和“反面向上”几乎各占一半。,5,E-mail: 主讲、制作:符永川,第一节 概率,(二)事件与概率 1、随机事件:随机现象中出现的各种可能的结果,简称为事件。 在N次重复试验中,事件A发生的次数n与试验总次数N的比值,称为事件A发生的频率,记作FN(A)。,(3.1),6,E-mail: 主讲、制作:符永川,第一节 概率,例
3、3-l 掷一枚硬币,观察“正面向上”的次数。现分次数N=5,N=50,N=500三组进行试验,其中每一组又重复进行了10批,其结果如表3-1所示。,7,E-mail: 主讲、制作:符永川,第一节 概率,我们把随机事件发生的可能性的大小称作随机事件发生的概率,记作P(A)。 频率是事件发生的外在表现 概率体现事件发生的内在实质,频率的稳定性随机事件发生的可能性大小是随机事件本身所固有的,不随人的意志改变的一种客观属性,因此可以对其进行度量。,8,E-mail: 主讲、制作:符永川,第一节 概率,(二)概率 1、统计定义(后验概率),定义:在大量重复的N次试验中,当N无限增大时,事件A发生的频率n
4、/N稳定在一个确定的常数附近,这个数表示事件A发生的概率,记作P(A)。,(3.2),特点:在研究或实验以前,事件的成功或失败事先是无法知道的,9,E-mail: 主讲、制作:符永川,第一节 概率,2、古典定义(先验概率) 定义:若试验由n个有限的基本事件组成,且每次试验中每个基本事件出现是等可能的,有利事件A发生的次数为m,则事件A的概率为:,(3.3),特点:事先知道有关事件出现的事实。,10,E-mail: 主讲、制作:符永川,第一节 概率,同时抛掷2颗骰子,求出现8点的概率,11,E-mail: 主讲、制作:符永川,第一节 概率,共同性质: 必然事件发生的概率为1,即P()=1; 不可
5、能事件的概率为0,即P()=0 事件A发生的概率满足:0P(A)1 逆事件的概率:P( A )=1-P(A),12,E-mail: 主讲、制作:符永川,第一节 概率,(三)概率的两个基本定理 1、加法定理:若A、B是两个互不相容的事件,则A和B至少有一个发生的概率为: P(A+B)=P(A)+P(B) (3.4),对于有限多个相互独立事件的情况: 若A1,A2,An是有限个相互独立的事件, 则A1,A2,An至少有一个发生的概率为: P(A1+A2+An)P(A1)+P(A2)+P(An) (3.5),13,E-mail: 主讲、制作:符永川,第一节 概率,例3-2 掷一个骰子,假定出现的点数
6、是等可能性的,求事件A=出现点数不超过4的概率。 解:因为P(Ai)=1/6(i =l,2,3,4,5,6),且基本事件是相互独立的,由加法定理得 P(A)=P(A1)+P(A2)+P(A3)+P(A4) =1/6+1/6+1/6+1/6 =4/6 例3-3 某一考生对所考知识一无所知,完全凭猜测回答两道是非题,问该生答对一题的概率为多大? 解: P(E)=P(B+C)=P(B)+P(C)=0.25+0.25=0.5,14,E-mail: 主讲、制作:符永川,第一节 概率,2、概率的乘法定理 若A、B是两个相互独立事件,则A和B同时发生的概率P(AB)为: P(AB)=P(A)P(B) (3.
7、6),有限个相互独立事件的情况: A1,A2,An是有限个相互独立事件, 则A1,A2,An同时发生的概率P(A1A2An)为: P(A1 A2 An)=P(A1)P(A2)P(An) (3.7),15,E-mail: 主讲、制作:符永川,第一节 概率,例3-4同时掷两个骰子,掷出12点的概率是多少?掷出11点的概率是多少? 解:出现12点的概率为: 1/61/6 =1/36 出现11点的概率为: 1/61/6+1/61/6 =1/18,16,E-mail: 主讲、制作:符永川,第一节 概率,例3-5 一份有10道四选一多项选择题的试卷,考生完全凭随机猜测得满分的概率有多大? 解:令Ai表示“
8、该生猜对第i题”这一事件,i=1,2,10。事件Ai (i=1,2,10) 互不相容,且P(Ai)=1/4,根据概率的乘法定理,Ai(i=1,2,10)同时发生的概率为: P(A1A2A10)=P(A1)P(A2)P(A10)=(1/4)10 =0.00000094,只有10道四选一的多项选择题, 完全凭猜测答对6道或6道以上的可能性只有0.0193。,17,E-mail: 主讲、制作:符永川,第一节 概率,二、二项分布 (一)排列与组合 1、排列 定义:从n个不同的元素中,任取m个(mn)元素,按一定的顺序排成一列,叫做从n个不同元素中取出m个元素的一个排列。 当mn时,所得排列称为选排列,
9、计做,当n=m时,所得排列称全排列,记作Pn,18,E-mail: 主讲、制作:符永川,第一节 概率,例3-6 用四个数字1,2,3,4可以组成多少个没有重复数字的二位数?多少个没有重复数字的四位数? 解:由公式(3.8)得到没有重复的二位数有,由公式(3.9)得到没有重复的四位数有 P4,= 4*3=12(种),=4*3*2*1=24(种),19,E-mail: 主讲、制作:符永川,第一节 概率,2、组合 定义:从n个不同元素中,任取m个(mn)元素,不管顺序,并成一组,称为从n个不同元素中取出m个元素的一个组合,记作Cmn。,组合的两个性质:,(3.12),(1),(2),20,E-mai
10、l: 主讲、制作:符永川,例3-7: 书架上有5本中文书,3本外文书。某学生从中任取3本,求恰有2本中文书的概率? 解:,第一节 概率,样本空间:,随机事件:恰有2本中文书的概率,=0.54,基本事件:,(二)二项式定理,21,E-mail: 主讲、制作:符永川,第二节 二项分布,一、二项分布的概念 对于随机变量x进行n次独立试验 若(1)每次试验结果只出现对立事件A与A之一;,P(x)=Cnxpxqn-x (3.14),22,E-mail: 主讲、制作:符永川,第二节 二项分布,例3-8 有10道是非题,若考生完全不懂,全凭猜测回答,问分别回答对5题、6题、7题、8题、9题、10题的概率各为
11、多少?至少答对5题的概率又是多少? 解:每次试验只有两个结果,答对记为p,答错为q,则p=q=1/2 猜中5题的概率为 P (x=5)= C510 p5q5 =0.24609 猜中6题的概率为 P(x=6)= C610 p6q4 =0.20508,23,E-mail: 主讲、制作:符永川,第二节 二项分布,猜中7题的概率为 P(x=7)= C710 p7q3 =0.11719 猜中8题的概率为 P(x=8)= C810 p8q2 =0.04395 猜中9题的概率为 P(x=9)= C910 p9q1 =0.00977 猜中10题的概率为 P(x=10)= C1010p10=0.00098 至少
12、猜中5题的概率为 P=C510 p5q5+C610 p6q4+C710 p7q3+C810 p8q2+C910 p9q+C1010 p10 =0.024609+0.20508+0.11719+0.04395+0.00977+0.00098,=0.62306,24,E-mail: 主讲、制作:符永川,第二节 二项分布,例3-9 有一份10道四选一的多项选择题的试卷,若考生对试题完全猜测,问考生完全猜中8题、9题、10题的概率各有多大?至少猜中1道的概率又有多大? 解:四选一的多项选择题,猜中的概率记为p=1/4,猜错的概率记为q=3/4,由公式(4.14)得: 猜中8题的概率为 P(x=8)=
13、C810 p8q2 =0.00039 猜中9题的概率为 P(x=9)= C910 p9q =0.00003 猜中10题的概率为 P(x=10)= C1010 p10=0.0000009,25,E-mail: 主讲、制作:符永川,第二节 二项分布,P(至少答对一题)=1-P(10题全部答错) =1-P(x=0) =1-(3/4)10=0.9437 优点:能简便的决定任何既定的或大于任何既定分数的概率。 从例3-9可知,若学生完全凭猜测答对至少9题的概率为: P(至少9题)= C910(1/4)9(3/4) + C1010(1/4)10 =0.00003+0.000009=0.00003,26,E
14、-mail: 主讲、制作:符永川,第二节 二项分布,二、二项分布的均值、方差与标准差,例如: n =5,p=1/2时,=2.5,2=1.25, =1.12 n=10,p=1/4时,=2.5,2=1.875, =1.37 n=20,p=1/8时,=2.5,2=2.1875,=1.48,27,E-mail: 主讲、制作:符永川,第二节 二项分布,例3-10 一份试卷有100道四选一的单项选择题, (每题1分),考生答对了其中80道,有20道不能回答,因而对这20道作猜测,则猜测得分的范围有大? 解:,=1.94 51.96*1.94=53.8,=5,28,E-mail: 主讲、制作:符永川,第二节
15、 二项分布,三、应用条件 1、每次试验只有两类对立的结果; 2、n次事件相互独立; 3、每次试验某类结果的发生概率是一个常数。 四、二项分布的图形(p71) 1、二项分布图形的形状取决于p和n的大小; 2、当p=0.5时,无论n的大小,均为对称分布; 3、当p或0.5时,n较小时为偏态分布,n较大时为逼近于正态分布。,29,E-mail: 主讲、制作:符永川,图3-8 (p+q)6的概率分布图,第二节 二项分布,30,E-mail: 主讲、制作:符永川,第三节 正态分布,正态分布也称常态分布或常态分配,是连续随机变量概率分布的一种,是在数理统计的理论与实际应用中占有重要地位的一种理论分布。 正
16、态分布由亚伯拉罕德莫弗尔1733年发现。拉普拉斯、高斯对正态分布的研究也作出了贡献,故有时称正态分布为高斯分布。 一、正态分布的性质,31,E-mail: 主讲、制作:符永川,第三节 正态分布,32,E-mail: 主讲、制作:符永川,第三节 正态分布,正态曲线 正态曲线位于 x 轴的上方,以直线 x=为对称轴,为正态分布的均值,它向左向右对称的无限延伸,且以 x 轴为渐近线。 当 x= 时,曲线处于最高点,即当x=时,f()取最大值;x=两点是拐点,当正态曲线由中央向两侧逐渐下降时,到拐点改变了弯曲方向,整条曲线呈现“中间高,两边低”的形状。,33,E-mail: 主讲、制作:符永川,第三节
17、 正态分布,正态曲线与x轴所围成的区域面积为1。 服从正态分布的随机变量x在xl到x2间的变化的概率(xlx2)就是概率Px1xx2为图中阴影部分的面积。 正态分布是由均值和标准差唯一确定的分布。 决定曲线的位置 决定曲线的形状,34,E-mail: 主讲、制作:符永川,第三节 正态分布,二、标准正态分布 当均值=0,标准差=1时的正态分布称为标准正态分布,记作XN(0,1) 标准正态分布的密度函数为,若XN(,2),令,(3.19b),(3.20),则ZN(0,1),35,E-mail: 主讲、制作:符永川,第三节 正态分布,36,E-mail: 主讲、制作:符永川,第三节 正态分布,三、正
18、态分布表(p466)的使用 表示曲线底线即横轴上的位置,用Z表示 纵高Y,即曲线的高度,对于某Z0值纵高Y由(3.19b)式计算。 在均值这点上,Z=0,Y=f(0)=0.3989 图中阴影部分面积,用P表示 P0ZZ0 Z=1 时,P=0.3413;Z=2时,P=0.4772; Z=2.5时,P=0.4938;Z=3时,P=0.4987,37,E-mail: 主讲、制作:符永川,第三节 正态分布,(一)应注意的两个问题 正态分布表只列出Z0所对应的纵高和面积。当Z0,可根据正态曲线的对称性,在正态分布表中查出-Z所对应的面积和纵高即可。 对服从正态分布XN(,2)的变量x,先通过(x-) /
19、化为Z值,即以标准差为单位的离均差后,才能查表。,38,E-mail: 主讲、制作:符永川,第三节 正态分布,(二)使用举例 1、基本使用 例3-11 设x服从正态分布XN(,2),求以下的概率。 (1) P- x + (2) P- 3x +3 (3) P-1.84x +1.84 (4) P- 2.79x +2.79,39,E-mail: 主讲、制作:符永川,第三节 正态分布,解:首先将一般的正态分布化为标准正态分布,再根据正态分布表以及上面两个原则进行计算。,P- x+ =P- x- =P-1(x-)/1 =P-1Z 1 =2P0Z1 =2*0.3413 =0.6826,(2) P- 3x+
20、3 =P-3Z3 =2P0Z3 =2*0.4987=0.9974,40,E-mail: 主讲、制作:符永川,第三节 正态分布,41,E-mail: 主讲、制作:符永川,第三节 正态分布,P-1.84x +1.84 =P-1.84 Z1.84 =2P0 Z1.84 =0.9342 (4) P- 2.79x +2.79 =P-2.79 Z2.79 =2*0.4987 =0.9947,42,E-mail: 主讲、制作:符永川,第三节 正态分布,2、扩展使用 (1)已知Z1和Z2,求PZ1ZZ2,例3-12 随机变量Z服从正态分布,求以下概率 A: (a) P0Z1.96 (b) P-1.96Z 0
21、B: (a) P1Z 1.96 (b) P-1.96Z -1 C: P-1.96Z 1.96 D: PZ 1 .96 E: PZ 1,解:从正态分布表中查得,当Z=1时,Z=1.96时所对应的P值分别为: P0Z1=0.3413 P0Z1.96=0.475,43,E-mail: 主讲、制作:符永川,第三节 正态分布,A: (a) P0Z1.96 =0.475 (b) P-1.96Z 0 = P0Z1.96 =0.475 B: (a) P1Z 1.96 = P0Z1.96 P0Z 1 =0.475-0.3413 =0.1337,44,E-mail: 主讲、制作:符永川,第三节 正态分布,45,E
22、-mail: 主讲、制作:符永川,第三节 正态分布,同理:(b) P-1.96Z -1 = P0Z1.96 P0Z 1 =0.475-0.3413=0.1337 C: P-1.96Z 1.96 = 2P0Z1.96 = 0.95 D: PZ 1 .96 = 0.5-P0Z1.96 =0.5-0.475 =0.025 E: PZ 1 = 0.5+P0Z 1.96 =0.5+0.3413=0.8413,46,E-mail: 主讲、制作:符永川,第三节 正态分布,47,E-mail: 主讲、制作:符永川,第三节 正态分布,(2)由曲线下面积P,求Z值 例3-13 ZN(0,1),已知下列概率,求对应
23、的Z值 A:P0ZZ0=0.49814 B:P-Z0ZZ0=0.7063 C:PZZ0=0.05,解:从正态分布表中第三列找出与概率0.49814相近的值为0.49813,对应的Z2.9 由对称性,,查表第三列中0.3531所对应的Z=1.05,P0ZZ0,=1/2P-Z0ZZ0,=0.7063/2,=0.3531,48,E-mail: 主讲、制作:符永川,第三节 正态分布,49,E-mail: 主讲、制作:符永川,第三节 正态分布, P0ZZ0,查表第三列0.45所对应的Z=1.64 (3)由Z值或面积P,求纵高Y 例3-14,求下列情况下所对应的曲线总高。 Z=3.84 P0ZZ0=0.1
24、3683 解:查正态分布表得 Z=3.84时,,=0.45,=0.5-0.05,=0.5-PZZ0,Y=0.00025,P0ZZ0=0.13683时,,Y=0.37524,50,E-mail: 主讲、制作:符永川,第三节 正态分布,四、正态分布的实际应用 (一)标准分数(Z分数) : 以标准差为单位,反映了一个原始分数在团体中所处的位置。,若仅已知一个待研究总体中的样本,原始分数的标准分数用下式计算:,若已知一个总体,则这个总体中的原始分数的标准分数用下式计算:,(3.21a),(3.21b),51,E-mail: 主讲、制作:符永川,第三节 正态分布,若原始分数服从(或近似服从)正态分布时,
25、标准分数有如下的性质: 由原始分数转换得到的Z分数的平均数为0 由原始分数转换得到的Z分数的标准差为1 当X是以为平均数,2为方差的正态分布总体,则经过转换后得到的标准分数所产生的新总体也为正态,且平均数为0,方差为1,52,E-mail: 主讲、制作:符永川,第三节 正态分布,例3-15 在某年高考的平均分数为500,标准差为100的正态总体中,某考生得到650分,设当年高考录取率为10%,问该生的成绩能否入围? 解:由(3.21)式得到标准分数为 Z=(650-500)/100,查正态分布表 当Z=1.5时,P=0.933,即93.3% 故该生处在录取率10%之内,他的成绩入了围,= 1.
26、5,53,E-mail: 主讲、制作:符永川,第三节 正态分布,例3-16 已知某班期末考试中语文的平均分为80,标准差为10;数学的平均分为70,标准差为15;英语的平均分为85,标准差为12。甲生的语文成绩为85分,数学成绩为82分,英语成绩为90,问该生这三科成绩哪一科最好? 解: Z语=(85-80)/10,=0.5,Z数=(82-70)/15,=0.8,Z英=(90-85)/12,=0.42,数学成绩最好,其次为语文,英语最差。,54,E-mail: 主讲、制作:符永川,第三节 正态分布,标准分数的转化 转换公式为: T=KZ+C (3.22) 要求: K值不应小于原始数据的标准差。
27、防止转换后出现“高分受损,低分受益” C不应小于3K(一般考试中)或4K(在大规模考试中),防止转换后仍有负值,55,E-mail: 主讲、制作:符永川,第三节 正态分布,标准分数的优点 1、各科标准分数的单位是绝对等价的。可将各科标准分数相加求和,比较总分的优劣。 2、标准分数数值大小与正负,可以反映某一总分在团体中的位置。 注意:求总成绩在团体中的位置时,不能直接用三科标准分数的总和,必须分别用他们各科标准分数的平均分,再查表,56,E-mail: 主讲、制作:符永川,第三节 正态分布,(二)确定录取分数线 例3-17 :某市参加数学奥林匹克业余学校入学考试的人数为2800人,只录取学生1
28、50人,该次考试平均分为75,标准差为8。问录取分数线应定为多少? 解:设这次的考试成绩服从xN(75,82) Z=(x-75)/8变换后的ZN(0,1) 招生人数的概率,0.053,57,E-mail: 主讲、制作:符永川,第三节 正态分布,所以 P0ZZ0=0.5-PZZ0=0.5-0.053=0.447 查表得:Z=1.61时,P=0.4463 Z=1.62时,P=0.44738 若要求更精确些的Z值,就可用内插法,x =8Z+75=8*1.6165+75,=88分,=1.6165 故分数线应定为:,58,E-mail: 主讲、制作:符永川,第三节 正态分布,(三)确定在正态分布下特定分数界限内的考生人数 例3-18 某地区某年高考物
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二手车交易协议个人
- 劳动合同解除协议书大全七篇
- 颈动脉斑块病因介绍
- 公司借款的协议书范本10篇
- 单位股东合作的协议书
- 药物中毒性周围神经病病因介绍
- 2023-2024学年天津市五区县重点校联考高三(上)期末语文试卷
- 2023年天津市部分区高考语文二模试卷
- 江苏省盐城市建湖县汉开书院学校2023-2024学年七年级上学期第二次月考道德与法治试题(解析版)-A4
- 食品工厂机械与设备模拟习题与参考答案
- 唐山棋子烧饼推广策划方案
- 网络运维与安全管理培训内容
- 疼痛科护士的自我成长与专业发展路径
- 低碳建筑课件
- 大数据在生命科学中的应用与挑战
- 西餐烹饪职业生涯规划书
- 短缺药培训课件
- 江苏省南京市秦淮区2023-2024学年八年级上学期期末数学试卷
- 脐血流检查培训演示课件
- 《幼儿教育学》案例分析题
- 迈瑞行业竞争分析
评论
0/150
提交评论