




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
125第3章概率、概率分布
与抽样分布3-23.1事件及其概率3.2随机变量及其概率分布3.3常用的抽样方法3.4抽样分布3.5中心极限定理的应用3-3学习目标掌握事件的定义及其概率的计算。熟悉常用的几种离散型和连续型随机变量及其概率分布。了解常用的抽样方法掌握样本均值、比率和方差的抽样分布。熟练运用中心极限定理。3-43.1
事件及其概率3.1.1试验、事件和样本空间3.1.2事件的概率3.1.3概率的性质和运算法则3.1.4条件概率与事件的独立性3.1.5全概公式与逆概公式3.1.1试验、事件和样本空间3-53-61)对试验对象进行一次观察或测量的过程掷一颗骰子,观察其出现的点数从一副52张扑克牌中抽取一张,并观察其结果(纸牌的数字或花色)2)试验的特点可以在相同的条件下重复进行每次试验的可能结果可能不止一个,但试验的所有可能结果在试验之前是确切知道的在试验结束之前,不能确定该次试验的确切结果1.试验3-72.事件1)事件:试验的每一个可能结果(任何样本点集合)掷一颗骰子出现的点数为3用大写字母A,B,C,…表示2)随机事件(randomevent):每次试验可能出现也可能不出现的事件掷一颗骰子可能出现的点数3-83)简单事件:不能被分解成其他事件组合的基本事件抛一枚均匀硬币,“出现正面”和“出现反面”4)必然事件:每次试验一定出现的事件,用表示掷一颗骰子出现的点数小于75)不可能事件:每次试验一定不出现的事件,用表示掷一颗骰子出现的点数大于64-96)事件的关系和运算
事件的关系有:包含和相等;
事件的运算有:和(并),差,交(积),逆。(1)包含:关系式表示“若A出现,则B也出现”(反之则未必),称作“B包含A”,或“A导致B”。
ABBA4-10(3)和(并)::运算式A+B或A∪B读作“A加B”,称作“A与B的和(并)””,表示“A和B至少出现一个个”。对于多多个事件或表表示“诸事件中至至少出现一个个”。BAA+B(2)相等:关系系式A=B表示二事件A和B要么都出现,,要么都不出出现,称作““事件A等于事件B”或“事件A和B等价”。(4)差:运算式式A-B或A\B读作“A减B”,称作“A与B的差”,表示示“事件A出现但B不出现。”4-11A-BAB(5)交(积)::运算式AB或A∩B,称作“A与B的交(或积))”,表示““事件A和B同时出现”。。对于多个事事件表示“诸事件件同同时出现”。。4-12ABAB(6)逆事件:={A不出现},称作A的对立事件或或逆事件。显显然A和互互为对对立事件,它它们之间有下下列关系:,,A∩=Ø。4-13A
A4-14(7)不相容(互互斥):若AB=Ø,即A与B不可能同时出出现,则称A和B不相容。AB3-153.样本空间与样样本点1)样本空间一个试验中所所有结果的集集合,用表示例如:在掷一颗骰子的的试验中,样样本空间表示示为:{1,2,3,4,5,6}在投掷硬币的的试验中,{正面,反面}2)样本点样本空间中每每一个特定的的试验结果用符号表示3.1.2事件的概率3-163-171.定义:概率是对随机机事件发生可可能性大小的的度量.2.事件A的概率是一个个介于0和1之间的一个值值,用以度量量试验完成时时事件A发生的可能性性大小,记记为P(A)3.概率的计算:1)古典概率特征:(1)试验的基本本事件总数是是有限的;(2)每个基本事事件出现的可可能性都相同同。计算方法:2)统计概率当试验的次数数很多时,概概率P(A)可以由所观察察到的事件A发生次数(频数)的比例来逼近近在相同条件下下,重复进行行n次试验,事件件A发生了m次,则事件A发生的概率可可以写为3-183、主观概率率对未来某一一事件,既既不能通过过可能事件件个数来计计算,也不不能根据大大量试验的的频率来估估计,只有有根据经验验、专业知知识、对事事件发生的的众多条件件或影响因因素的分析析等,对其其进行估计计从而作出出相应决策策3-193-203.1.3概率的性质质和运算法法则3-21互斥事件及及其概率(mutuallyexclusiveevents)在试验中,,两个事件件有一个发发生时,另另一个就不不能发生,,则称事件A与事件B是互斥事件,(没有公共样本点点)AB互斥事件的的文氏图(Venndiagram)3-22【例】在一所城市市中随机抽抽取600个家庭,用用以确定拥拥有个人电电脑的家庭庭所占的比比例。定义义如下事件件:A:600个家庭中恰恰好有265个家庭拥有有电脑B:恰好有100个家庭拥有有电脑C:特定户张张三家拥有有电脑说明下列各各对事件是是否为互斥斥事件,并并说明你的的理由(1)A与B(2)A与C(3)B与C3-23解:(1)事件A与B是互斥事件件。因为你你观察到到恰好有有265个家庭拥有有电脑,就就不不可可能恰好有有100个家庭拥有有电脑(2)事件A与C不是是互互斥斥事事件件。。因因为为张张三三也也许许正正是是这这265个家家庭庭之之一一,,因因而而事事件件与与有有可可能能同同时时发发生生(3)事件件B与C不是是互互斥斥事事件件。。理理由由同同(2)3-24【例】同时时抛抛掷掷两两枚枚硬硬币币,,并并考考察察其其结结果果。。恰恰好好有有一一枚枚正正面面朝朝上上的的概概率率是是多多少少??解:用用H表示示正正面面,,T表示示反反面面,,下下标标1和2表示示硬硬币币1和硬硬币币2。该该项项试试验验会会有有4个互互斥斥事事件件之之一一发发生生(1)两枚枚硬硬币币都都正正面面朝朝上上,,记记为为H1H2(2)1号硬硬币币正正面面朝朝上上而而2号硬硬币币反反面面朝朝上上,,记记为为H1T2(3)1号硬硬币币反反面面朝朝上上而而2号硬硬币币正正面面朝朝上上,,记记为为T1H2(4)两枚枚硬硬币币都都是是反反面面朝朝上上,,记记为为T1T23-25由于于每每一一枚枚硬硬币币出出现现正正面面或或出出现现反反面面的的概概率率都都是是1/2,当当抛抛掷掷的的次次数数逐逐渐渐增增大大时时,,上上面面的的4个简简单单事事件件中中每每一一事事件件发发生生的的相相对对频频数数(概率率)将近近似似等等于于1/4。因因为为仅仅当当H1T2或T1H2发生生时时,,才才会会恰恰好好有有一一枚枚硬硬币币朝朝上上的的事事件件发发生生,,而而事事件件H1T2或T1H2又为为互互斥斥事事件件,,两两个个事事件件中中一一个个事事件件发发生生或或者者另另一一个个事事件件发发生生的的概概率率便便是是1/2(1/4+1/4)。因因此此,,抛抛掷掷两两枚枚硬硬币币,,恰恰好好有有一一枚枚出出现现正正面面的的概概率率等等于于H1T2或T1H2发生生的的概概率率,,也也就就是是两两种种事事件件中中每每个个事事件件发发生生的的概概率率之之和和3-26互斥斥事事件件加加法法规规则则1)若若两两个个事事件件A与B互斥斥,,则则事事件件A发生或或事件件B发生的的概率率等于于这两两个事事件各各自的的概率率之和和,即即P(A∪B)=P(A)+P(B)2)事件件A1,A2,…,An两两互互斥,,则有有P(A1∪A2∪…∪An)=P(A1)+P(A2)+…+P(An)3-27解:掷一颗颗骰子子出现现的点点数(1,2,3,4,5,6)共有6个互斥斥事件件,而而且每每个事事件出出现的的概率率都为为1/6,根据互互斥事事件的的加法法规则则,得得【例】抛掷一一颗骰子,,并考考察其其结果果。求求出其其点数数为1点或2点或3点或4点或5点或6点的概概率3-28概率的的性质质(小结)1)非负负性:对任意意事件件A,有P02)规范范性:一个事事件的的概率率是一一个介介于0与1之间的的值,,即对对于任任意事事件A,有0P13)必然然事件件的概概率为为1;不可可能事事件的的概率率为0。即P()=1;P()=04)可加加性:若A与B互斥,,则P(A∪B)=P(A)+P(B)推广到到多个个两两两互斥斥事件件A1,A2,…,An,有P(A1∪A2∪…∪An)=P(A1)+P(A2)+…+P(An)3-29事件的的补及及其概概率事件的的补(complement)事件A不发生生的事事件,,称为为事件件A的补事事件(或称逆逆事件件),记为为A。它是样样本空空间中中所有有不属属于事事件A的样本本点的的集合合AAP(A)=1-P(A)3-30广义加加法公公式广义加加法公公式对任意意两个个随机机事件件A和B,它们们和的的概率率为两两个事事件分分别概概率的的和减减去两两个事事件交交的概概率,,即P(A∪B)=P(A)+P(B)-P(A∩B)两个事事件的的并两个事事件的的交3-31广义加加法公公式(事件的的并或或和)事件A或事件件B发生的的事件件,称称为事事件A与事件件B的并。。它是是由属属于事事件A或事件件B的所有有样本本点的的集合合,记记为A∪B或A+BBAA∪B3-32广义加加法公公式(事件的的交或或积)ABA∩B事件A与事事件件B同时时发发生生的的事事件件,,称称为为事事件件A与事事件件B的交交,,它它是是由由属属于于事事件件A也属属于于事事件件B的所所有有公公共共样样本本点点所所组组成成的的集集合合,,记记为为B∩A或AB3-33解::设A=员工工离离职职是是因因为为对对工工资资不不满满意意B=员工工离离职职是是因因为为对对工工作作不不满满意意依题题意意有有::P(A)=0.40;P(B)=0.30;P(AB)=0.15P(A+B)=P(A)+P(B)-P(AB)=0.40+0.30-0.15=0.55【例】一家家计计算算机机软软件件开开发发公公司司的的人人事事部部门门最最近近做做了了一一项项调调查查,,发发现现在在最最近近两两年年内内离离职职的的公公司司员员工工中中有有40%是因因为为对对工工资资不不满满意意,,有有30%是因因为为对对工工作作不不满满意意,,有有15%是因因为为他他们们对对工工资资和和工工作作都都不不满满意意。。求求两两年年内内离离职职的的员员工工中中,,离离职职原原因因是是因因为为对对工工资资不不满满意意、、或或者者对对工工作作不不满满意意、、或或者者二二者者皆皆有有的的概概率率。。3.1.4条件件概概率率与与事事件件的的独独立立性性3-351.条件件概概率率在事事件件B已经经发发生生的的条条件件下下事事件件A发生生的的概概率率,,称称为为已已知知事事件件B时事事件件A的条条件件概概率率,,记记为为P(A|B)P(B)P(AB)P(A|B)=事件B及其概率P(B)事件AB及其概率P(AB)事件A
事件B一旦事件B发生3-36解::设A=顾客客购购买买食食品品,,B=顾客客购购买买其其他他商商品品依题题意意有有::P(A)=0.80;P(B)=0.60;P(AB)=0.35【例】一家家超超市市所所作作的的一一项项调调查查表表明明,,有有80%的顾顾客客到到超超市市是是来来购购买买食食品品,,60%的人人是是来来购购买买其其他他商商品品,,35%的人人既既购购买买食食品品也也购购买买其其他他商商品品。。求求::(1)已知知某某顾顾客客购购买买食食品品的的条条件件下下,,也也购购买买其其他他商商品品的的概概率率(2)已知知某某顾顾客客购购买买其其他他的的条条件件下下,,也也购购买买食食品品的的概概率率3-37【例】一家家电电脑脑公公司司从从两两个个供供应应商商处处购购买买了了同同一一种种计计算算机机配配件件,,质质量量状状况况如如下下表表所所示示从这这200个配配件件中中任任取取一一个个进进行行检检查查,,求求(1)取出出的的一一个个为为正正品品的的概概率率(2)取出出的的一一个个为为供供应应商商甲甲的的配配件件的的概概率率(3)取出一一个为为供应应商甲甲的正正品的的概率率(4)已知取取出一一个为为供应应商甲甲的配配件,,它是是正品品的概概率甲乙两个供应商提供的配件正品数次品数合计供应商甲
84690供应商乙
1028110合计186142003-38解:设A=取出的的一个个为正正品B=取出的的一个个为供供应商商甲供供应的的配件件(1)(2)(3)(4)3-391)用来来计算算两事事件交交的概概率2)以条条件概概率的的定义义为基基础3)设A,B为两个个事件件,若若P(B)>0,则P(AB)=P(B)P(A|B)或P(AB)=P(A)P(B|A)2.乘法公公式3-40【例】一家报报纸的的发行行部已已知在在某社社区有有75%的住户户订阅阅了该该报纸纸的日日报,,而且且还知知道某某个订订阅日日报的的住户户订阅阅其晚晚报的的概率率为50%。求某某住户户既订订阅日日报又又订阅阅晚报报的概概率解:设A=某住户户订阅阅了日日报B=某住户户订阅阅了晚晚报依题意意有:P(A)=0.75;P(B|A)=0.50P(AB)=P(A)·P(B|A)=0.75××0.5=0.3753-41【例】从一个个装有有3个红球球2个白球球的盒盒子里里摸球球(摸出后后球不不放回回),求连连续两两次摸摸中红红球的的概率率解:设A=第2次摸到到红球球B=第1次摸到到红球球依题意意有:P(B)=3/5;P(A|B)=2/4P(AB)=P(A)·P(B|A)=3/5×2/4=0.33-423.独立事事件1)若P(A|B)=P(A)或P(B|A)=P(B),则称称事件件A与B事件独独立,,或称称独立立事件件2)若两两个事事件相相互独独立,,则这这两个个事件件同时时发生生的概概率等等于它它们各各自发发生的的概率率之积积,即即P(AB)=P(A)·P(B)3)若事事件A1,A2,,An相互独独立,,则P(A1,A2,,An)=P(A1)·P(A2)··P(An)3-43【例】一个旅旅游经经景点点的管管理员员根据据以往往的经经验得得知,,有80%的游客客在古古建筑筑前照照相留留念。。求接接下来来的两两个游游客都都照相相留念念的概概率解:设A=第一个游客客照相留念念B=第二个游客客照相留念念两个游客都都照相留念念是两个事事件的交。。在没有其他信息息的情况下下,我们可可以假定事事件A和事件B是相互立的的,所以有有P(AB)=P(A)·P(B)=0.80×0.80=0.643-44【例】假定我们是是从两个同同样装有3个红球2个白球的盒盒子摸球。。每个盒子子里摸1个。求连续续两次摸中中红球的概概率解:设A=从第一个盒盒子里摸到到红球B=从第二个盒盒子里摸到到红球依题意有:P(A)=3/5;P(B)=3/5P(AB)=P(A)·P(B)=3/5×3/5=0.364-45独立性与互互不相容的的区别:独立性是指指两个事件件的发生互互不影响。。互不相容是是指两个事事件不能同同时发生。。两个不相容容事件一定定是统计相相依的,两两个独立事事件一定是是相容的((除非其中中有一个事事件的概率率为0)。3.1.5全概率公式式与逆概率率公式3-471.全概率公式式B2B5B4B1B3完备事件组组3-48【例】假设在n张彩票中只只有一张中中奖奖券,,那么第二二个人摸到到奖券的概概率是多少少?解:设A=第二个人摸摸到奖券,,B=第一个人摸摸到奖券依题意有:P(B)=1/n;P(B)=(n-1)/nP(A|B)=0P(A|B)=1/n-13-492.逆概率公式式(贝叶斯公式式)P(Bi)是没有加入入其它信息息的概率,,被称为事件件Bi的先验概率率P(Bi|A)被称为事件件Bi的后验概率率B2B5B4B1B33-50【例】某考生回答答一道四选选一的考题题,假设他他知道正确确答案的概概率为1/2,而他不知知道正确答答案时猜对对的概率应应该为1/4。考试结束束后发现他他答对了,,那么他是是知道正确确答案情况况下做对的的概率是多多大呢?解:设A=该考生答对对了,B=该考生知道道正确答案案依题意有:P(B)=1/2;P(B)=1-1/2=1/2P(A|B)=1/4P(A|B)=13.2随机变量及及其概率分分布3.2.1随机变量3.2.2离散型随机机变量的概概率分布3.2.3离散型随机机变量的数数学期望和和方差3.2.4几种常用的的离散型概概率分布3.2.5概率密度函函数与连续续型随机变变量3.2.6常见的连续续型概率分分布3.2.1随机变量4-531.随机变量就就是其取值值带有随机机性的变量量,一般用X、Y、Z等表示。在给定的条条件下,这这种变量取取任何值事事先不能确确定,只能能由随机试试验的结果果来定,并并且随试验验的结果而而变。例如:投投掷两枚硬硬币出现正正面的数量量4-542.随机变量的的种类如果随机变变量的全体体可能取值值能够一一一列举出来来,这样的的随机变量量称作离散散型随机变变量(如掷掷一枚硬币币首次出现现正面向上上所需要的的投掷次数数);如果随机变变量的全体体可能取值值不能一一一列举,其其可能的取取值在数轴轴上是连续续的,则该该变量称为为连续型随随机变量((如可能出出现的测量量误差)。3-55离散型随机机变量的一一些例子试验随机变量可能的取值抽查100个产品一家餐馆营业一天电脑公司一个月的销售销售一辆汽车取到次品的个数顾客数销售量顾客性别0,1,2,…,1000,1,2,…0,1,2,…男性为0,女性为13-56连续型随机机变量的一一些例子试验随机变量可能的取值抽查一批电子元件新建一座住宅楼测量一个产品的长度使用寿命(小时)半年后工程完成的百分比测量误差(cm)X00
X100X03.2.2离散型随机机变量的概概率分布1.离散型随机机变量的分分布离散型随机机变量X的所有可能能取值x1、x2、x3、……、xn和这些值的的概率p(x1)、p(x2)、p(x3)、……、p(xn)就称为离散散型随机变变量的概率率分布。即即:离散型随机机变量概率率分布的性性质变量Xx1x2x3……xn概率Pp(x1)p(x2)p(x3)……p(xn)离散型随机机变量的概概率分布【例】投掷一枚骰骰子,出现现的点数是是个离散型型随机变量量,其概率率分布为X=xi123456P(X=xi)=pi1/61/61/61/61/61/601/6P(x)1x234563-61【例】一部电梯在在一周内发发生故障的的次数X及相应的概概率如下表表故障次数X=xi0123概率P(X=xi)pi0.100.250.35一部电梯一一周发生故故障的次数数及概率分分布(1)确定的值(2)求正好发生生两次故障障的概率(3)求最多发生生两次故障障的概率(4)求故障次数多多于一次的的概率3-62解:(1)由于0.10+0.25+0.35+=1所以,=0.30(2)P(X=2)=0.35(3)P(X2)=0.10+0.25+0.35=0.70(4)P(X1)=0.35+0.30=0.653.2.3离散型随机机变量的数学期望和和方差3-641.离散型随机机变量的数数学期望1)离散型随随机变量X的所有可能能取值xi与其取相对对应的概率率pi乘积之和2)描述离散散型随机变变量取值的的集中程度度3)记为或E(X)4)计算公式式为3-652.离散型随机机变量的方方差1)随机变量量X的每一个取取值与期望望值的离差差平方和的的数学期望望,记为2或D(X)2)描述离散散型随机变变量取值的的分散程度度3)计算公式式为4)方差的平平方根称为为标准差,,记为或D(X)3-66【例】一家电脑配配件供应商商声称,他他所提供的的配件100个中拥有次次品的个数数及概率如如下表次品数X=xi0123概率P(X=xi)pi0.750.120.080.05每100个配件中的的次品数及及概率分布布求该供应商商次品数的的数学期望望和标准差差3.2.4几种常用的的离散型概概率分布3-68常用离散型型概率分布布离散型概率分布二项分布两点分布泊松分布超几何分布3-691.二项分布1)二项分布与与伯努利试验验有关2)伯努利试验验满足下列条条件一次试验只有有两个可能结结果,即“成功”和“失败”“成功”是指我们感兴兴趣的某种特特征一次试验“成成功”的概率率为p,失败的概率率为q=1-p,且概率p对每次试验都都是相同的试验是相互独独立的,并可以重复进行行n次在n次试验中,“成功”的次数对应一一个离散型随随机变量X3-703)重复进行n次试验,出现现“成功”的的次数的概率率分布称为二二项分布,记记为X~B(n,p)4)设X为n次重复试验中中出现成功的的次数,X取x的概率为5)二项分布的的期望与方差差:3-71对于P(X=x)0,x=1,2,……,n,有同样有3-72【例】已知一批产品品的次品率为为4%,从中任意有有放回地抽取5个。求5个产品中:(1)没有次品的概概率是多少??(2)恰好有1个次品的概率率是多少?(3)有3个以下次品的的概率是多少少?3-732.两点分布(0-1分布)随机变量X只取0和1两个可能的值值。两点分布的期期望为p,方差为pq。当n=1时,二项分布布退化为两点点分布:或3-74【例】已知一批产品品的次品率为为p=0.04,合格率为q=1-p=1-0.04=0.96。并指定废品品用1表示,合格品品用0表示。则任取取一件为废品品或合格品这这一离散型随随机变量,其其概率分布为为X=xi01P(X=xi)=pi0.960.040.5011xP(x)3-753.泊松分布1)1837年法国数学家家泊松(D.Poisson,1781—1840)首次提出2)用于描述在在一指定时间间范围内或在在一定的长度度、面积、体体积之内每一一事件出现次次数的分布3)泊松分布的的例子一定时间段内内,某航空公公司接到的订订票电话数一定时间内,,到车站等候候公共汽车的的人数一定路段内,,路面出现大大损坏的次数数一定时间段内内,放射性物物质放射的粒粒子数一匹布上发现现的疵点个数数一定页数的书书刊上出现的的错别字个数数3-76—给定的时间间间隔、长度、、面积、体积内““成功”的平均数e=2.71828x—给定的时间间间隔、长度、、面积、体积内““成功”的次次数4)概率分布函函数X~P()5)泊松分布的的期望和方差差均为3-77【例】假定某航空公公司预订票处处平均每小时时接到42次订票电话,,那么10分钟内恰好接接到6次电话的概率率是多少?解:设X=10分钟内航空公公司预订票处处接到的电话话次数3-78(1)当试验的次次数n很大,成功的的概率p很小时,可用用泊松分布来来近似地计算算二项分布的的概率,即(2)实际应用中,当P0.05,n>20,近似效果良良好6)泊松分布作作为二项分布布的近似3-794.超几何分布1)采用不重复复抽样,各次次试验并不独独立,成功的的概率也互不不相等2)总体元素的的数目N很小,或实验验次数n相对于N来说较大时,,样本中“成功”的次数则服从从超几何概率率分布3)概率分布函函数为4)3-80【例】假定有10支股票,其中中有3支购买后可以以获利,另外外7支购买后将会会亏损。如果果你打算从10支股票中选择择4支购买,但你你并不知道哪哪3支是获利的,,哪7支是亏损的。。求:(1)有3支能获利的股股票都被你选选中的概率有有多大?(2)3支可获利的股股票中有2支被你选中的的概率有多大大?解:设N=10,M=3,n=43.2.5概率密度函数数与连续型随机变变量1.连续型随机变变量的特点1)连续型随机机变量可以取取某一区间或或整个实数轴轴上的任意一一个值2)它取任何一一个特定的值值的概率都等等于03)不能列出每每一个值及其其相应的概率率4)通常研究它它取某一区间间值的概率5)用概率密度度函数的形式式和分布函数数的形式来描描述2.概率密度函数数1)设X为一连续型随随机变量,x为任意实数,,X的概率密度函函数记为f(x),它满足条件件2)f(x)不是概率密度函数f(x)表示X的所有取值x及其频数f(x)值(值,频数)频数f(x)abx在平面直角坐坐标系中画出出f(x)的图形,则对对于任何实数数a<b,P(a<Xb)是该曲线下从从a到b的面积f(x)xab概率是曲线下的面积3.分布函数1)连续型随机机变量的概率率可以用分布布函数F(x)来表示2)分布函数定定义为3)根据分布函数,,P(a<X<b)可以写为4.分布函数与密密度函数的图图示1)密度函数曲曲线下的面积积等于12)分布函数是是曲线下小于于x0的面积f(x)xx0F(x0
)5.连续型随机变变量的数学期期望和方差1)连续型随机机变量的数学学期望2)方差3.2.6常见的连续型型随机变量的概率分布1.正态分布由C.F.高斯(CarlFriedrichGauss,1777—1855)作为描述误差差相对频数分分布的模型而而提出。描述连续型随随机变量的最最重要的分布布。许多现象都可可以由正态分分布来描述。。可用于近似离离散型随机变变量的分布。。例如:二项项分布经典统计推断断的基础。xf(x)(1)概率密度函函数f(x)=随机变量X的频数=正态随机变量量X的均值=正态随机变量量X的方差=3.1415926;e=2.71828x=随机变量的取取值(-<x<)(2)正态分布布函数的性质质图形是关于x=对称的钟形曲曲线,且峰值值在x=处均值和标准差一旦确定,分分布的具体形形式也惟一确确定,不同参参数正态分布布构成一个完完整的“正态态分布族”均值可取实数轴上上的任意数值值,决定正态态曲线的具体体位置;标准准差决定曲线线的“陡峭”或“扁平”程度。越大,正态曲曲线扁平;越小,正态曲曲线越陡峭当X的取值向横轴轴左右两个方方向无限延伸伸时,曲线的的两个尾端也也无限渐近横横轴,理论上上永远不会与与之相交正态随机变量量在特定区间间上的取值概概率由正态曲曲线下的面积积给出,而且且其曲线下的的总面积等于于1和对正态曲线的影影响xf(x)CAB=1/212=1(3)正态分布的的概率概率是曲线下的面积!abxf(x)(4)对称钟形分分布中的3σ法则3σ法则——关于钟形分布布的一个近似似的或经验的的法则:变量值落在[-3σ,+3σ]范围以外的情情况极为少见见。因此通常常将落在区间间[-3σ,+3σ]之外的数据称称为异常数据据或称为离群群点。x99.73%68.27%95.45%切比雪夫定理理对于任意一个个数据集中,,至少有75%的数据位于平平均数2个标准差范围围内。至少有有89%的数据位于平平均数3个标准差范围围内。3-97(5)标准正态分分布a)标准正态分分布的概率密度函函数作变换:b)标准正态分分布的分布函数可将一般形式式的正态分布转化化为标准正态态分布Xms一般正态分布
=1Z标准正态分布(6)标准正态分分布表的使用用a)对于标准正正态分布,即即Z~N(0,1),有P(aZb)baP(|Z|a)2a1b)对于于负的的z,可由(-z)z得到c)对于一般般正态分布布,即X~N(,),有标准化的的例子P(5X6.2)X=5=10一般正态分布6.2
=1Z标准正态分布00.120.0478标准化的的例子P(2.9X7.1)5s
=102.97.1X一般正态分布标准正态分布0
s=1-.21Z.210.1664.0832.0832【例】假定某公公司职员员每周的的加班津津贴服从从均值为为50元、标准准差为10元的正态态分布,,那么全全公司中中有多少少比例的的职员每每周的加加班津贴贴会超过过70元,又有有多少比比例的职职员每周周的加班班津贴在在40元到60元之间呢呢?解:设=50,=10,X~N(50,102)3-1042.均匀分布布1)若随随机变量量X的概率密密度函数数为则称X在[a,b]上服从均均匀分布布,记为为X~U[a,b]2)数学期期望和方方差3-105随机变量量X在某取值值范围[a,b]的任一子子区间[c,d]上取值的的概率为为同样有::3-106【例】某公共汽汽车站从从早上6时起每隔隔15分钟开出出一趟班班车,假假定某乘乘客在6点以后到到达车站站的时刻刻是随机机的,所所以有理理由认为为他等候候乘车的的时间长长度X服从参数数为a=0,b=15的均匀分分布。试试求该乘乘客等候候乘车的的时间长长度少于于5分钟的概概率解:概率密度度函数为为落入区间间[0,15]的任一子子区间[0,d]的概率是是,,等候候乘车的的时间长长度少于于5分钟即有有d=5,因此该该事件发发生的概概率等于于5/15=1/33-1073.指数分布布若随机变变量X的概率密密度函数数为称X服从参数数为的指数数分布,记记为X~E()数学期望望和方差差3-108指数分布布(概率计算算)随机变量量X取小于或或等于某某一特定定值x的概率为为随机变量X落入任一一区间(a,b)的概率为为3-109指数分布布(例题分析析)【例】假定某加加油站在在一辆汽汽车到达达之后等等待下一一辆汽车车到达所所需要的的时间(单位:分分钟)服从参数数为1/5的指数分分布,如如果现在在正好有有一辆汽汽车刚刚刚到站加加油,试试分别求求以下几几个事件件发生的的概率::(1)一辆汽车车到站前前需要等等待5分钟以上上(2)一辆汽车车到站前前需要等等待5~10分钟解:3.3常用的抽抽样方法法大多数的的实际应应用当中中真实的的均值与与方差等等的参数数是未知知的,需需要通过过抽样调调查,用用样本统统计量去去推断人人们所关关心的总总体参数数。简单随机机抽样分层抽样样系统抽样样整群抽样样3-1113.3.1简单随机机抽样从总体N个单位中中随机地地抽取n个单位作作为样本本,使得每一一个总体体单位都都有相同同的机会会(概率)被抽中抽取元素素的具体体方法有有重复抽抽样和不不重复抽抽样特点简单、直直观,在在抽样框框完整时时,可直直接从中中抽取样样本用样本统统计量对对目标量量进行估估计比较较方便局限性当N很大时,,不易构构造抽样样框抽出的单单位很分分散,给给实施调调查增加加了困难难没有利用用其他辅辅助信息息以提高高估计的的效率3-1123.3.2分层抽样样将总体单单位按某某种特征征或某种种规则划划分为不不同的层层,然后后从不同同的层中中独立、、随机地地抽取样样本优点保证样本本的结构构与总体体的结构构比较相相近,从从而提高高估计的的精度组织实施施调查方方便既可以对对总体参参数进行行估计,,也可以以对各层层的目标标量进行行估计3-1133.3.3系统抽样样将总体中中的所有有单位(抽样单位位)按一定顺顺序排列列,在规规定的范范围内随随机地抽抽取一个个单位作作为初始始单位,,然后按按事先规规定好的的规则确确定其他他样本单单位先从数字字1到k之间随机机抽取一一个数字字r作为初始始单位,,以后依依次取r+k,r+2k…等单位优点:操操作简便便,可提提高估计计的精度度缺点:对对估计量量方差的的估计比比较困难难3-1143.3.4整群抽样样将总体中中若干个个单位合合并为组组(群),抽样时直直接抽取取群,然然后对中中选群中中的所有有单位全全部实施施调查特点抽样时只只需群的的抽样框框,可简简化工作作量调查的地地点相对对集中,,节省调调查费用用,方便便调查的的实施缺点是估估计的精精度较差差3.4抽样分布布3.4.1抽样分布布的概念念3.4.2样本均值值抽样分分布的形形式3.4.3样本均值值抽样分分布的特特征3.4.4样本比率率的抽样样分布3.4.5样本方差差的抽样样分布3.4.6两个样本本统计量量的抽样样分布若将样本本指标的的取值分分别记为为其其相应应的概率率记为P1,P2,…Pn,将它们按按顺序排排列起来来,可得得如下概概率分布布表。
…………3.4.1抽样分布布的概念念从总体中中随机地地抽取许许多样本本,所得到的的所有可能能的样本本观测值值及其所所对应的的概率便便是抽样样分布。。因此,,抽样分分布也可可以称为为样本统统计量的的概率分分布。3-117样本统计计量的概概率分布布,是一种理理论分布布在重复选选取容量量为n的样本时时,由该该统计量量的所有有可能取取值形成成的相对对频数分分布随机变量量是样本统计计量样本均值值,样本方差差等结果来自自容量相同同的所有可能样本本提供了样样本统计计量长远远而稳定定的信息息,是进进行推断断的理论论基础,,也是抽抽样推断断科学性性的重要要依据抽样分布布(samplingdistribution)【例5-2】】设一个总总体,含含有4个元素(个体),即总体体单位数数N=4。4个个体分分别为x1=1,x2=2,x3=3,x4=4。总体的均值值、方差及分分布如下总体分布14230.1.2.3均值3.4.2样本均值的抽抽样分布方差现从总体中抽抽取n=2的简单随机样样本,在重复复抽样条件下下,共有42=16个样本。所有有样本的结果果为:3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2的样本(共16个)计算出各样本本的均值,如如下表。并给给出样本均值值的抽样分布布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)5-121x样本均值的抽样分布1.000.10.20.3P(x)1.53.04.03.52.02.5X11.522.533.54p1/162/163/164/163/162/161/16样本均值的分分布与总体分分布的比较=2.5σ2=1.25总体分布14230.1.2.3抽样分布P(x)1.00.1.2.31.53.04.03.52.02.5样本均值抽样样分布的形成成过程3-1233-124样本均值的抽抽样分布3.4.2样本均值抽样样分布的形式式x的分布趋于正正态分布的过过程3-126总体分布正态分布非正态分布大样本小样本正态分布正态分布非正态分布3-127样本均值的数数学期望样本均值的方方差重复抽样不重复抽样当N趋于无穷大或或N很大n很小时,不重重复抽样可以以用重复抽样样公式计算3.4.3样本均值抽样样分布的特征征3-128样本均值的抽抽样分布(总体数学期望望与方差)比较及结论::1.样本均值的均均值(数学期望)等于总体均值值2.样本均值的方方差等于总体体方差的1/nt分布3-129t分布在实际问题中中所有可能的的样本数是难难以一一列举举的,这时可可以通过反复复进行抽样模模拟,记录下下统计量取不不同数值时的的百分比,这这是可以发现现样本均值的的抽样分布服服从与自由度度为(n-1)的t分布3-130t分布t分布是类似正正态分布的一一种对称分布布,它通常要要比正态分布布平坦和分散散。依赖于称称之为自由度度的参数。随随着自由度的的增大,分布布也逐渐趋于于正态分布xt
分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)zt分布与正态态分布的异同同点相同点1,都是均数位位于中间;2,t曲线与正态曲曲线都是关于于μ点对称,形状状相似;3,总面积都是是1.不同点1,t曲线会随n的大小变化而而变化,不是是一条而是多多条;2,随着n的增加,t分布逐渐接近近标准正态分分布,当n=∞时,完全全成为标准正正态分布3-1323-133样本比率的抽抽样分布3-134比率(proportion)3-135在重复选取容容量为n的样本时,由由样本比率的的所有可能取取值形成的相相对频数分布布,称为样本本比率抽样分分布一种理论概率率分布当样本量很大大时(np≥5或n(1-p)≥5),样本比率率的抽样分布布可用正态分分布近似推断总体比率率的理论基础样本比率的抽抽样分布3-136样本比率的数数学期望样本比率的方方差重复抽样不重复抽样样本比率的抽抽样分布(数学期望与方方差)重复抽样不重复抽样【例5-4】从某地区6000名适龄儿童中中用不放回抽抽样方法抽取取400名儿童,其中中有320名儿童入学,,求样本入学学率的标准差差。解:5-1383.4.5样本方差的抽抽样分布在重复选取容容量为n的样本时,由由样本方差的的所有可能取取值形成的相相对频数分布布对于来自正态态总体的简单单随机样本,,则比值的抽样分布服服从自由度为为(n-1)的2分布,即(1)由阿贝(Abbe)于1863年首先给出,,后来由海尔尔墨特(Hermert)和卡·皮尔逊(K·Pearson)分别于1875年和1900年推导出来(2)设,,则(3)令,,则Y服从自由度为为1的2分布,即(4)当总体,,从从中抽取容量量为n的样本,则2分布(1)分布的的变量值始终终为正(2)分布的的形状取决于于其自由度n的大小,通常常为不对称的的正偏分布,,但随着自由由度的增大逐逐渐趋于对称称(4)可加性性:若U和V为两个独立的的服从2分布的随机变变量,U~2(n1),V~2(n2),则U+V这一随机变量量服从自由度度为n1+n2的2分布2分布的性质和和特点c2分布图示选择容量为n的简单随机样本计算样本方差s2计算卡方值2=(n-1)s2/σ2计算出所有的
2值不同容量样本的抽样分布c2n=1n=4n=10n=20ms总体5-1433.4.6两个样本统计计量的抽样分布1)两个总体都都为正态分布布,即,2)两个样本均均值之差的的抽样分分布服从正态态分布,其分分布的数学期期望为两个总总体均值之差差3)方差为各自自的方差之和和1.两个样本均均值之差的的抽样分布布两个样本均均值之差的的抽样分布布
m1s1总体1s2
m
2总体2抽取简单随机样样本容量n1计算x1抽取简单随机样样本容量n2计算x2计算每一对样本的x1-x2所有可能样本的x1-x2m1-m2抽样分布1)两个总体体都服从二二项分布2)分别从两两个总体中中抽取容量量为n1和n2的独立样本本,当两个个样本都为为大样本时时,两个样样本比例之之差的抽样样分布可用用正态分布布来近似3)分布的数数学期望为为4)方差为各各自的方差差之和2.两个样本比比例之差的的抽样分布布3.两个样本方方差比的抽抽样分布1)两个总体都为为正态分布布,即X1~N(μ1,σ12),X2~N(μ2,σ22)2)从两个总体中分分别抽取容容量为n1和n2的独立样本
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 研究课题的申报书
- 人才课题申报书格式要求
- 单位厨房员工合同范本
- 原料协议合同范本
- 厨房和卫生间装修合同范本
- 中医课题立项申报书范文
- 厂房土地出租合同范例
- 研究现状课题申报书范文
- 校级美术课题申报书范文
- 个人店铺装修合同范本
- 【正版授权】 IEC 63310:2025 EN Functional performance criteria for AAL robots used in connected home environment
- 最终版附件1:“跨学科主题学习”教学设计(2025年版)
- (2024)云南省公务员考试《行测》真题及答案解析
- 2022年“正确认识新疆四史”《民族团结铸牢中华民族共同体意识》全文解读
- 静脉治疗护理技术操作标准解读
- MBR系统运行技术手册
- 中国河流湖泊
- 学校中层干部民主测评表(一)
- 军事地形学知识总结
- 云南省普通初中学生成长记录-基本素质发展初一-初三
- 中国农业银行资金证明模板
评论
0/150
提交评论