




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Chapter3 概率与概率分布,大数定律 二项分布 泊松分布 高斯分布 卡方(2)分布 t分布、f分布,内容:,第一节 概率基础知识 第二节 几种常见的理论分布 第三节 统计数的分布,有关概率的一些基本概念 事件、概率、频率 概率的计算 随机变量 定义 离散型随机变量概率分布 连续型随机变量概率分布 大数定理 随机变量的数学期望,第一节 概率基础知识,事件:某些确定条件下,可能出现也可能不出现的现象,也叫随机事件 概率P(A) :描述随机事件发生的可能性大小的数值。 P的大小在0和1之间,越接近于1,说明发生的可能性越大,越接近于0,说明发生的可能性越小。 频数:事件A在n次重复试验中发生了
2、m次,m就是事件A发生的频数。 频率W(A):事件A在n次重复试验中发生了m次,其比值m/n就是事件A发生的频率。当重复试验次数足够大的情况下,频率可以认为是概率。,一、有关概率的一些基本概念,(一)事 件 1. 必然事件(U) 2. 不可能事件(V) 3. 随机性事件 在相同条件下进行大量重复试验时,其试验结果却呈现出某种固有的特定的规律性频率的稳定性,通常称之为随机现象的统计规律性。,(二)概 率(probability),目的:了解各种随机事件发生的可能性大小,揭示这些事件的内在的统计规律性。 定义:能够刻划事件发生可能性大小的数量指标。 特性:事件本身所固有的,不随人的主观意志而改变
3、记号:事件A的概率记为P(A),概率的性质 1)对于任何事件A,有0P(A)1; 2)必然事件的概率为1,即P(U)=1; 3)不可能事件的概率为0,即P(V)=0。,(三)小概率事件实际不可能性原理 随机事件的概率表示了随机事件在一次试验中出现的可能性大小。 若随机事件的概率很小,例如小于0.05、0.01、0.001,称之为小概率事件。,小概率事件虽然不是不可能事件,但在一次试验中出现的可能性很小,不出现的可能性很大 ,以至于实际上可以看成是不可能发生的。 在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理。 小概率事件实际不可能
4、性原理是统计学上进行假设检验(显著性检验)的基本依据。,二、概率的计算,事件的相互关系 和事件 积事件 互斥事件 对立事件 独立事件 完全事件系,互斥事件,对立事件,1、有一批种子,其中二级占5%,一级占10%,其余为三级,问三级种子占多少? 2、若一批玉米种子发芽率为0.9,发芽后能出土的概率为0.8,求这批种子的出苗率?,若要全面了解随机试验,则必须知道随机试验的全部可能结果及各种可能结果发生的概率,即必须知道随机试验的概率分布(probability distribution)。 为了深入研究随机试验 ,先引入随机变量(random variable)的概念。,三、概率分布,离散型随机变
5、量(discrete random variable) 表示试验结果的变量,其可能取值可罗列,且以各种确定的概率取这些不同的值 ; 连续型随机变量(continuous random variable) 表示试验结果的变量x,其可能取值为某范围内的任何数值,且x在其取值范围内的任一区间中取值时,其概率是确定的。,(一)离散型随机变量概率分布 函数表达形式: 表格表达形式:,离散型随机变量的概率分布具有下列性质:,(二)连续随机变量的概率密度,对于连续型随机变量X(-X+)如果存在非负可积函数f(x) ,对任意的x1,x2(x1x2)都有,则称f(x)为X的概率分布密度函数,简称概率密度。,连续
6、型随机变量概率分布的性质: 1、分布密度函数总是大于或等于0,即 f(x)0; 2、,(三) 分布函数 设X为随机变量,x为任意实数,称函数F(x)=P(Xx) 为X的累计分布函数,简称分布函数。 离散型随机变量的分布函数为 连续型随机变量的分布函数为,大数定律概率论中用来阐述大量随机现象平均结果稳定性的一系列定律的总称。 贝努里大数定律:设m是n次重复独立试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则取任意小数0 有 意义:当试验次数n足够大时,有事件A发生的频率收敛于概率。,(四)大数定律,辛钦大数定律: 设独立随机变量序列X1, Xn,且具有相同的数学期望E(Xi)=, 则
7、取任意小数0 ,有即当n足够大时,随机变量序列的平均数收敛于数学期望。,意义:当n很大时,独立同分布的随机变量的平均值 依概率收敛于它的数学期望 。,(五)随机变量的数学期望和方差 数学期望:随机变量所有可能取值的平均水平,记为E(X)或。 离散型随机变量 连续型随机变量的数学期望,其中 PX = xk = pk k=1, 2, 3, .,离散型随机变量,方差的计算,方差计算公式,连续型随机变量,第二节 几种常见的理论分布,二项分布 (Binomial distribution) 泊松分布 (Poissons distribution) 高斯分布 (Gauss distribution),随机
8、变量的概率分布 (probability distribution),离散型变量 (discrete random variable),连续型变量 (continuous random variable),二项分布 泊松分布,正态分布,变 量,一、 二 项 分 布,二项分布的概率的计算方法 二项分布的形状和参数,(一) 贝努利试验及其概率公式 将某随机试验重复进行n次,若各次试验结果互不影响 , 即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这n次试验是独立的。 对于n次独立的试验,如果每次试验结果出现且只出现对立事件A与之一, 在每次试验中出现A的概率是常数p(0p1),因而出现
9、对立事件的概率是1-p=q,则 称 这一串重复的独立试验为n重贝努利试验,简称贝努利试验(Bernoulli trials )。,在n重贝努利试验中,事件 A 可能发生0,1,2,n次,现在我们来求事件 A 恰好发生k(0kn)次的概率Pn(k)。 先取n=4,k=2来讨论。在4次试验中,事件A发生2次的方式有以下 种:,由于试验是独立的,按概率的乘法法则,于是每种出现的概率有:,又由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,在4 次试验中,事件A恰好发生2次的概率为:,P4(2) = P( ) + P( ) + + P( )=,P( )=P( )= P( ) = P(
10、)P( )P( )P( )=,若把上式与二项展开式 相比较就可以发现,在n重贝努利试验中,事件A发生k次的概率恰好等于 展开式中的第k+1项,所以称作二项概率公式 。,因此,在n重贝努利试验中,事件A恰好发生(0kn)次的概率为: k=0,1,2,n,二项分布:在n重贝努里试验中,“成功”(事件A发生)的次数x是一个随机变量,其概率分布为 其中n,p为参数,记为,二项分布的累计函数:,由于(p+q)n=1,所以,性质,二项分布的数学期望 E(x)=np 方差 D(x)=npq 标准差,例如:某种昆虫在某地区的死亡率为40%,即p=0.4,现对这种害虫用一种新药进行治疗试验,每次抽样10头为一组
11、治疗。试问如新药无疗效,则在10头中死3头、2头、1头以及全部愈好的概率为多少? 按照上面的公式进行计算 7头愈好,3头死去的概率为: 8头愈好,2头死去的概率为: 9头愈好,1头死去的概率为: 10头全部愈好的概率为:,P32 例3.6,(二) 二项式分布的形状和参数,对于一个二项式总体: 1. 若p=q,二项式分布呈对称形状。 2. 若pq,n较小,二项式分布则表现偏斜形状。 3. 若n时,即使pq,二项式总体分布的情况也趋于对称形状。 所以二项分布的形状是由n和p两个参数决定的。 如果n相当大或p与q基本接近,二项式分布接近于正态分布,二项分布的图形,二项分布的应用条件: (1)各观察单
12、位 只具有互相对立 的两种结果,如阳性或阴性,生存或死亡等,属于二项分类资料; (2)已知发生某一结果 (如死亡) 的概率为p,其对立结果的概率则为1-p=q,实际中要求p 是从大量观察中获得的比较稳定的数值; (3)n个观察单位的观察结果互相独立,即每个观察单位的观察结果不会影响到其它观察单位的观察结果。,二项分布,泊松分布,p很小,n很大,二、泊松分布(Poisson distribution),罕见事件发生数的分布规律,盒子中装有999个黑棋子,一个白棋子,在一次抽样中,抽中白棋子的概率1/1000。那么在100次放回抽样中,抽中1,2,10个白棋子的概率分别是 2. 放射性物质单位时间
13、内的放射次数 3. 单位体积内粉尘的计数 4. 血细胞或微生物在显微镜下的计数 5. 单位面积内细菌计数 6. 人群中患病率很低的非传染性疾病的患病数,概率分布: 若随机离散变量x只取零和正整数值0,1,2,且其概率分布为 并且 其中=np0; x=0,1,, e=2.7182 是自然对数的底数,则 称 x 服 从 参 数 为 的 泊 松分布(Poissons distribution),记 为 xP()。,泊松分布重要的特征: 1. 平均数和方差相等,都等于常数,即=2=,2. 值愈小分布愈偏倚; 3. 随着的增大,分 布趋于对称。当= 20时分布接近于正态分布;当=50时,可以认为泊松分布
14、呈正态分布。 当20时就可以用正态分布来近似地处理泊松分布的问题。,Poisson分布的可加性,观察某一现象的发生数时,如果它呈Poisson分布,那么把若干个小单位合并为一个大单位后,其总计数亦呈Poisson分布。 若X1P(1), X2P(2), XKP(k) ,那么 X=X1+ X2+ +XK , 则: XP(),【例】 为监测饮用水的污染情况, 现检验某社区每毫升饮用水中细菌数 , 共得400个记录如下: 试分析饮用水中细菌数的分布是否服从泊松分布。 若服从,按泊松分布计算每毫升水中细菌数的概率及理论次数并将频率分布与泊松分布作直观比较。,以 =0.500代替公式中的,得 (k=0,
15、1,2),经计算得每毫升水中平均细菌数 =0.500,方差S2=0.496。两者很接近, 故可认为每毫升水中细菌数服从泊松分布。,可见细菌数的频率分布与=0.5的泊松分布是相当吻合的 , 进一步说明用泊松分布描述单位容积(或面积)中细菌数的分布是适宜的。,注意:泊松分布的应用条件要求n 次试验是相互独立的。 P35 例3.8,泊松分布,正态分布,相当大,二项分布,n相当大或 p与q基本接近,三、正态分布,一种连续型随机变量的概率分布:,则称x服从参数为(-0) 的正态分布,记为x N(, 2)。,(一) 正态分布曲线的特性,1、它是一条对称分布的曲线,且对称轴为x=,即以平均数为对称轴。 2、
16、正态分布曲线的算术平均数、中值、众数三者是相等的,都合于点上。且多数次数分布在平均数附近。 3、随着 和 的不同,呈现一系列曲线而并不是一条曲线。确定它在x轴上的位置,确定它的变异度。不同 和 的总体具有不同的曲线位置和变异度,所以任何一个正态分布曲线,必须在确定了 和 后,才能确定曲线位置和形状。,4、正态分布曲线在x-=1 处有拐点,曲线两尾 向左右延伸,永不接触,所以x时,分布 曲线以x轴为渐近线。 5、正态分布曲线与x轴之间的总面积等于1。 6、正态曲线的任何两个x的定值间的面积或概率 完全以曲线 和 而确定。,下面为几对常见的区间与其相对应的面积或概率的数字:,区间 面积或概率 1
17、0.6827 2 0.9545 3 0.9973 1.960 0.9500 2.576 0.9900,(二)标准正态分布,当正态分布=0且=1时,则称x服从标准正态分布,用f(u)(x=u)表示概率密度函数,即,标准化:若x N(, 2),则可以将其标准化,标准正态分布累积函数F(u):,当aub时:,P38 例3.9、例3.10、例3.11,Poisson分布与正态分布及二项分布的关系,当较小时, Poisson分布呈偏态分布,随着增大,迅速接近正态分布,当 =20时,可以认为近似正态分布。 Poisson分布是二项分布的特例,某现象的发生率p很小,而样本例数n很大时,则二项分布接近于Poi
18、sson分布。 np(应用: Poisson替代二项分布),泊松分布,正态分布,相当大,二项分布,n相当大或 p与q基本接近,p很小,n很大,第三节 统计数的分布,抽样试验与无偏估计 样本平均数的分布 样本平均数差数的分布 分布 分布 分布,例,设有一个N=3的有限总体,其变量值为3,4,5。,总体的平均数、方差和标准差,当以样本容量n=2进行独立放回随机抽样,抽取的所有可能样本数是: Nn=32=9,其平均数、方差和标准差如下表:,样本观察值x,3 3 3 4 4 4 5 5 5,x,6 7 8 7 8 9 8 9 10,3 3.5 4 3.5 4 4.5 4 4.5 5,s,0.000 0
19、.7071 1.4142 0.7071 0.0000 0.7071 1.4142 0.7071 0.0000,36.0 6.0 5.6568 3.0,3 4 5 3 4 5 3 4 5,以自由度(n-1)作分母计算的样本方差s2之均数:,样本标准差S之均数:,各样本均数总和之均数:,以样本容量n作分母计算的样本方差 之均数:,如果所有可能样本的某一统计数的平均数等于该总体的相应参数,则称该统计数为总体参数的无偏估计值(unbiased estimate)。,s2 是2的无偏估计值;,s不是的无偏估计值;,是的无偏估计值;,以n为分母得到的样本方差 不是2的 无偏估计值;,因此,为了得到2的无偏
20、估计值,估算样本方差时,必须以自由度df=n-1而不用n做分母。,抽样结论,二、样本平均数的分布,n=2,f(次数),f(次数),n=4,3.0 3.5 4.0 4.5 5.0,1 2 3 2 1,3 7 12 9 5,9 24.5 48.0 40.5 25.0,3.00 3.25 3.50 3.75 4.00 4.25 4.50 4.75 5.00,9,36,147.0,1 4 10 16 19 16 10 4 1,81,3 13 35 60 76 68 45 19 5,9.00 42.25 122.50 225.00 304.00 289.00 202.50 90.25 25.00,324
21、,1309.50,样本平均数分布基本性质:,样本平均数分布的平均数等于总体平均数,样本平均数分布的方差等于总体方差除以样本容量,标准误,从正态总体N(, 2) 进行抽样,其样本平均数 是具有平均数为 ,方差为 的正态分布记为:,如果被抽样总体不是正态总体,但是具有平均数和方差2 ,当样本容量n不断增大,样本平均数的分布也越来越接近正态分布,且具有平均数,方差 。(中心极限定理),若x的分布不很偏倚,在n20时, 的分布就近似于正态分布了。,中心极限定理告诉我们:不论x变量是连续型还是离散型,也无论x服从何种分布,一般只要n30,就可认为 的分布是正态的。,标 准 误 标准误(平均数抽样总体的标
22、准差) 的大小反映样本平均数 的抽样误差的大小,即精确性的高低 。,从某特定总体抽样 ,因为是一常数 ,所以只有增大样本含量才能降低样本平均数 的抽样误差。,在实际工作中,总体标准差往往是未知的,因而无法求得 。此时,可用样本标准差s估计。于是,以 估计 。,若样本中各观测值为x1,x2,xn,则,记 为 ,称作样本平均数标准误或均数标准误。 样本平均数标准误 是平均数抽样误差的估计值。,注意,样本标准误与样本平均数标准误是既有联系又有区别的两个统计量,上 式已表明了二者的联系。,二者的区别在于:样 本 标 准 误 s 是 反 映 样 本中各 观测值 x1,x2,xn变 异 程 度大小的一个指
23、标,它的大小说明了 对 该 样本代表性的强弱。,样本平均数标准误是样本平均数 的标准差,它是抽样误差的估计值, 其大小说明了样本间变异程度的大小及精确性的高低。,2. 对于小样本资料,常将样本平均数标准误 与样本平均数 配合使用,记为 ,用 以表示 所考察性状或指标的优良性与 抽样误差的大小。,1. 对于大样本资料,常将样本标准误s与样本平均数 配合使用,记为 s,用以说明所考察性状或指标的优良性与稳定性。,注意: 1)以上样本平均数的分布是对有限总体进行独立放回抽样,这样相当于对无限总体进行抽样,此时样本平均数的分布的期望值和方差分别是:,2)若是对有限总体进行独立不放回抽样,当n/N0.1
24、时,此时样本平均数的分布的期望值和方差仍可看做对无限总体抽样的结果;当n/N0.1时,此时样本平均数的分布期望和方差分别是:,对于总体:N(3,4,5),平均值是4,方差是:,当n/N0.1时,此时样本平均数的分布期望和方差分别是:,三、样本平均数差数的分布,n1=3,f(次数),3 4 5 6,1 3 3 1,2 3 4 5 6,1 2 3 2 1,f,8,9,n2=2,4 3 2 1 0 -1 -2 -3,f,1 5 12 18 18 12 5 1,4 15 24 18 0 -12 -10 -3,16 45 48 18 0 12 20 9,72,36,168,方差:,样本均数差数分布的均数:,样本平均数差数分布的基本性质:,样本平均数差数的平均数等于总体平均数的差数,样本平均
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 邯郸市第二十八中学2高三模拟(2)语文试题
- 中国新能源动力电池行业头部企业供应链调研报告
- 第十五课 掌控自己 教学设计 2023-2024学年北师大版(2015) 初中心理健康九年级全一 册
- 骨科常见并发症及护理
- 手形添画(教案)湘美版(2012)美术一年级下册
- 一年级数学上册 6 11~20各数的认识教学设计 新人教版
- 第三单元《音乐与人的情感世界(之一)》-《常回家看看》教学设计 2023-2024学年粤教版初中音乐七年级下册
- 人教部编版语文六年级下册 10 古诗三首 教案
- Module 4 (教学设计)-2024-2025学年外研版(三起)英语四年级上册
- 食品安全大班安全教育
- 管理制度企业安全生产管理制度(范本)
- 手术室护理带教
- 化工厂施工吊装方案
- 浙江省温州市“十五校联合体”2025届高三二诊模拟考试英语试卷含解析2
- DB14∕T 1795-2019 连翘种子标准规范
- 辣条制作工艺
- 外观不良改善报告
- 我是小小志愿者介绍主题班会课件
- 第19课《资本主义国家的新变化》课件-高一下学期统编版(2019)必修中外历史纲要下
- DB34∕T 3221-2018 火灾高危单位消防安全评估规程
- 地震监测设备维护保养手册
评论
0/150
提交评论