




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计分析基础知识【例】孵化一枚种蛋可能结果只有两种,即“孵出小鸡”与“未孵出小鸡”。若用变量x表示试验得两种结果,则可令x=0表示“未孵出小鸡”,x=1表示“孵出小鸡”。【例】测定某品种猪初生重,表示测定结果得变量x所取得值为一个特定范围(a,b),如0、5-1、5kg,x值可以就是这个范围内得任何实数。二、概率分布1、概念:描述随机变量取值得概率得函数。主要有三种函数:(1)概率函数:描述离散型随机变量各可能取值得概率得函数。(2)概率密度函数:描述连续型随机变量取值得概率密度得函数。(3)分布函数:描述随机变量取值小于、等于某值得概率得函数。记作F()=P(X≤)2、分布函数性质:
(1)F()就是x得非减函数(2)F(-∞)=0;F(+∞)=1(3)F()函数至多有可列个间断点,而在其间断点上也就是右连续。
3、大数定律:就是概率论中用来阐述大量随机现象平均结果稳定性得一系列定律得总称。
主要内容:样本容量越大,样本统计数与总体参数之差越小。
(1)贝努里大数定律设m就是n次独立试验中事件A出现得次数,而p就是事件A在每次试验中出现得概率,则对于任意小得正数ε,有如下关系:<ε}=1{limP
(2)辛钦大数定律
设x1,x2,x3,…,xn就是来自同一总体得变量,对于任意小得正数ε,有如下关系:<ε}=1{limP第四节离散分布一、离散型随机变量概率函数p()=P(X=)
例:投掷一枚骰子所得得点数为一随机变量,求该随机变量得概率函数。概率函数得性质:
a)非负性:P(X=xi)=Pi≥0;
b)归一性:
二、概率分布函数三、随机变量得数学期望与方差
1、加权平均数:例:某种玉米得株高数据,求平均株高。株高1、751、761、771、781、791、801、811、821、83百分比2%1%6%3%1%4%2%3%1%株高1、841、851、861、871、881、891、901、911、92百分比15%8%7%11%5%5%10%10%6%=1.75×0.02+1.76×0.01+…+1.92×0.06=1.86F()=P(X≤)2、数学期望:
一个随机变量得所有可能值以其相应得概率函数为权得加权平均数。表示集中程度得参数。设X就是一个离散型随机变量,她可能取得值就是i(i=1,2,…),其概率函数为:p(i)=P(X=i)E(X)=x1p(xi)+x2p(x2)+x3p(x3)+…+xnp(xn)=
3、数学期望得性质:(1)E[g()]=
(2)E[g()+h()]=E[g()]+E[h()]推广:E(X+Y)=E(X)+E(Y)(3)E(k)==kE(kX)=kE(x)(4)E(X-u)=E(X)-u=0(5)E(Xk)=kp(i)
随机变量X得矩,k称为矩得阶。这一类型得矩又称为k阶原点矩。任意点得矩:E[(X-a)k]=表明:随机变量X关于点a得k阶矩。当a=μ=E(X)时,X关于μ得k阶矩称为中心矩。二阶中心矩:
==VarX标准偏差:方差得平方根。бx==
反映了一个随机变量取值得变化程度,反映了概率分布得散布或偏离。四、常见得离散分布1、伯努里(Bernoulli)分布一个只取两个值得随机变量叫伯努里随机变量,其概率分布称为伯努里分布。大家学习辛苦了,还是要坚持继续保持安静μ=E(X)=p
σ2=E(x2)-μ2=p-p2=p(1-p)=pq2、二项分布:(1)二项分布定义:设随机变量x所有可能取得值为零和正整数:0,1,2,…n,且k=0,1,2…n,其中p>0,q>0,p+q=1,则称随机变x服从参数为n和p得二项分布
(binomialdistribution),记为
x-B(n,p)。
(2)性质:
(1)P(X=k)=Pn(k)
(k=0,1,2、、、n)
(2)二项分布得概率之和等于1,即(3)二项分布由n和p两个参数决定:①当p值较小且n不大时,分布就是偏倚得。但随着n得增大,分布逐渐趋于对称。②当p值趋于0、5时,分布趋于对称。③对于固定得n及p,当k增加时,Pn(k)先随之增加并达到其极大值,以后又下降。此外,在n较大,np、nq较接近时,二项分布接近于正态分布;当n→∞时,二项分布得极限分布就是正态分布。二项分布图当n=20时,不同p值得曲线。(4)二项分布概率计算及应用条件【例】纯种白猪与纯种黑猪杂交,根据孟德尔理论,子二代中白猪与黑猪得比率为3:1。求窝产仔10头,有7头白猪得概率。解:n=10,p=3/4=0、75,q=1/4=0、25。设10头仔猪中白色得为x头【例】设在家畜中感染某种疾病得概率为20%,现有两种疫苗,用疫苗A注射了15头家畜后无一感染,用疫苗B注射15头家畜后有1头感染。设各头家畜没有相互传染疾病得可能,问:应该如何评价这两种疫苗?假设疫苗A完全无效,那么注射后得家畜感染得概率仍为20%,则15头家畜中染病头数x=0得概率:
如果疫苗B完全无效,则15头家畜中最多有1头感染得概率为可知,注射A疫苗无效得概率为0、0352,比B疫苗无效得概率0、1671小得多。因此,可以认为A疫苗就是有效得,但不能认为B疫苗也就是有效得。【例】仔猪黄痢病在常规治疗下死亡率为20%,求5头病猪治疗后死亡头数各可能值相应得概率。设5头病猪中死亡头数为x,则x服从二项分布B(5,0、2),其所有可能取值为0,1,…,5,按计算概率,用分布列表示如下:
0123450、32770、40960、20480、05120、00640、0003二项分布得应用条件有三:1、各观察单位只具有互相对立得一种结果。2、已知发生某一结果得概率为p,其对立结果得概率则为1-p=q,要求p就是从大量观察中获得得稳定数值。3、n个观察单位得观察结果互相独立。(5)二项分布得平均数与标准差μ=npσ=【例】求仔猪黄痢病平均死亡猪数及死亡数得标准差。以p=0、2,n=5代入公式得:平均死亡猪数μ=5×0、20=1、0(头)
标准差(头)当试验结果以事件A发生得频率k/n表示时
σp也称为总体百分数标准误,当p未知时,常以样本百分数来估计。此时上式改写为:
Sp称为样本百分数标准误。3、波松分布
波松分布就是一种描述和分析发生在单位空间或时间里得稀有事件得概率分布。样本含量n必须很大。二项分布得一种特殊类型。
(1)波松分布得概率函数若随机变量X(X=k)只取零和正整数值0,1,2,…,且其概率分布为k=0,1,……n,其中λ>0,表示单位区间上发生变换得次数;t表示t个小区间;e就是自然对数得底数,则称X服从参数为λ得波松分布(Poisson,
distribution)记为X-P(λ)。
变成n个二点分布:
p()︽Cnx()x
(1-)n-x
=F(k)=P(X≤k)=(2)波松分布重要得特征:①平均数和方差相等,都等于常数λ,即
μ=σ2=λt=np
②λ就是波松分布所依赖得唯一参数。③λ值愈小分布愈偏倚,随着λ得增大,分布趋于对称。④当λ=20时分布接近于正态分布;当λ=50时,认为波松分布呈正态分布。在实际工作中,当λ≥20时就可以用正态分布来近似地处理波松分布得问题。⑤对于小概率事件,可用波松分布描述其概率分布。⑥二项分布当p<0、1和np<5时,可用波松分布来近似。【例】调查某种猪场闭锁育种群仔猪畸形数,共记录200窝,畸形仔猪数得分布情况如下表所示。试判断畸形仔猪数就是否服从波松分布。畸形仔猪数统计分布样本平均数和方差S2计算结果如下:
=Σfk/n=(120×0+62×1+15×2+2×3+1×4)/200=0、51=0、51,S2=0、52,这两个数就是相当接近得,因此可以认为畸形仔猪数服从波松分布。波松分布若用m表示λ时得曲线(3)波松分布得概率计算大多λ未知,只能从所观察得随机样本中计算出相应得样本平均数作为λ得估计值。【例】中已判断畸形仔猪数服从波松分布,并已算出样本平均数=0、51。将0、51代替公式中得λ得:
(k=0,1,2,…)
因为e0、51=1、6653,所以畸形仔猪数各项得概率为:
P(x=0)=(0、510/0!)/1、6653=0、6005P(x=1)=(0、511/1!)/1、6653=0、3063P(x=2)=(0、512/2!)/1、6653=0、0781P(x=3)=(0、513/3!)/1、6653=0、0133P(x=4)=(0、514/4!)/1、6653=0、0017
把上面各项概率乘以总观察窝数(n=200)即得各项按波松分布得理论窝数。波松分布与相应得频率分布列于下表中。畸形仔猪数得波松分布比较后发现畸形仔猪得频率分布与λ=0、51得波松分布就是吻合得很好得。说明了畸形仔猪数就是服从波松分布得。【例】为监测饮用水得污染情况,现检验某社区每毫升饮用水中细菌数,共得400个记录如下:试分析饮用水中细菌数得分布就是否服从波松分布。若服从,按波松分布计算:细菌数/ml(水)得概率及理论次数,并将頻率分布与波松分布直观比较。
经计算得每毫升水中平均细菌数=0、500,方差S2=0、496。两者很接近,故可认为细菌数/ml(水)服从波松分布。以=0、500代替公式中得λ,得
(k=0,1,2…)
计算结果如下表。细菌数得波松分布可见细菌数得频率分布与λ=0、5得波松分布就是相当吻合得,进一步说明用波松分布描述单位容积(或面积)中细菌数得分布就是适宜得。注意:波松分布得应用条件与二项分布相似。4、超几何分布
一个由N个元素组成得集合,其中M个具有性质E,N-M个没有性质E。若从N个元素中随机抽取n个,具有性质E得就是k个,k为超几何随机变量,她得概率分布称超几何分布。
n个伯努里分布
P(k)=P(X=k)=CMkCN-Mn-k/CNnμ=n、M/Nσ2=[n、M/N、(1-M/N)]例:一碗中盛有15颗珠子,其中10颗红得,5颗白得。从碗中随机取出4颗,并设k=抽得得红珠子得个数。求k得数学期望与方差。(k=0,1,2,3,4)
性质:
当N→∞时,可用二项分布近似代替。也可被波松分布代替。第五节连续分布
一、连续型随机变量密度函数
1
概率密度函数:
如随机变量X得分布函数F()在(-∞,+∞)处处连续并且除有限个或可数个点之外存在着连续得导数
=f(),则称f()为概率密度函数。2、概率密度函数得性质:1)f()≥0;p(1<X<2)=F(2)-F(1)3)4)p(<X<+△)≈f()△连续分布律用概率密度表示,离散型分布律用概率函数P(X=)表示分布函数F()则表示任何型随机变量概率分布律得共同形式。
f()d称为概率单元。二、数学期望与方差E(x)=E[g(x)]=E(k)=kE(kx)=kE(x)E(xk)=σ2=E[(x-u)2]==-u2例:设X就是一个连续随机变量,她得密度函数就是
f(x)=0(x﹤0或x﹥1)
2x(0≤x﹤1)求数学期望和方差。三、重要得连续分布1、均匀分布随机变量X得密度函数在一个区间上等于一个常数,而在区间外等于零。
U(a,b):E(x)=
=σ2=E(x2)-u2=(1)正态分布得概率密度函数若分布函数为
其中μ为平均数,σ2为方差,则称随机变量x服从正态布分
(normaldistribution),记为x-N(μ,σ2)。相应得概率分布函数为
2、正态分布分布密度曲线99、73%68、26%95、45%(2)正态分布得特征1、正态分布密度曲线就是单峰、对称得悬钟形曲线,对称轴为x=μ2、f(x)在x=μ处达到极大,极大值
3、f(x)就是非负函数,以x轴为渐近线,分布从-∞至+∞;
4、曲线在x=μ±σ处各有一个拐点,即曲线在(-∞,μ-σ)和(μ+σ,+∞)区间上就是下凸得,在[μ-σ,μ+σ]区间内就是上凸得;5、正态分布有平均数μ和标准差σ两个参数。μ就是位置参数,σ就是变异度参数。6、分布密度曲线与横轴所夹面积为1,即:
μ就是位置参数,当σ恒定时,μ愈大,则曲线沿x轴愈向右移动;反之,μ愈小,曲线沿x轴愈向左移动。
σ就是变异度参数,当μ恒定时,σ愈大,表示x得取值愈分散,曲线愈“胖”;σ愈小,x得取值愈集中在μ附近,曲线愈“瘦”。μ=0,σ2=1得正态分布称为标准正态分布(standardnormaldistribution)。记作u-N(0,1)。(3)标准正态分布概率密度函数:分布函数:正态分布N(μ,σ2)得随机变量x得标准化变换:
z=(x-μ)/σ(4)正态分布得概率计算1、标准正态分布得概率计算=Φ(u2)-Φ(u1)P(0≤u<u1)=Φ(u1)-0、5
P(u≥u1)=Φ(-u1)
P(|u|≥u1)=2Φ(-u1)
P(|u|<u1)==1-2Φ(-u1)
P(u1≤u<u2)=Φ(u2)-Φ(u1)【例】已知u-N(0,1),试求:
(1)P(u<-1、64)=?(2)P(u≥2、58)=?(3)P(|u|≥2、56)=?(4)P(0、34≤u<1、53)=?
利用公式,查附表得:(1)P(u<-1、64)=0、05050(2)P(u≥2、58)=Φ(-2、58)=0、024940(3)P(|u|≥2、56)=2Φ(-2、56)=2×0、005234=0、010468(4)P(0、34≤u<1、53)=Φ(1、53)-Φ(0、34)=0、93669-0、6331=0、30389关于标准正态分布,以下几种概率应当熟记:
P(-1≤u<1)=0、6826P(-2≤u<2)=0、9545
P(-3≤u<3)=0、9973
P(-1、96≤u<1、96)=0、95P(-2、58≤u<2、58)=0、99标准正态分布得三个常用概率99、73%68、26%95、45%2、一般正态分布得概率计算若随机变量x服从正态分布N(μ,σ2),则x得取值落在任意区间[x1,x2)得概率,记作P(x1≤X<x2),变换u=(x-μ)/σ【例】设X服从μ=30、26,σ2=5、102得正态分布,试求P(21、64≤x<32、98)。令
则u服从标准正态分布,故
=P(-1、69≤u<0、53)=Φ(0、53)-Φ(-1、69)=0、7019-0、04551=0、656410.526.30-=Xu
关于一般正态分布,以下几个概率就是经常用到得。
P(μ-σ≤X<μ+σ)=0、6826
P(μ-2σ≤X<μ+2σ)=0、9545
P(μ-3σ≤X<μ+3σ)=0、9973
P(μ-1、96σ≤X<μ+1、96σ)=0、95
P(μ-2、58σ≤X<μ+2、58σ)=0、99第六节中心极限定理定理:设X1、X2、…、Xn为相互独立同分布得随机变量系列,令则设其分布函数为3个重要得概率分布得关系:(1)二项分布,在n→∞,p→0,且np=λ(较小常数),二项分布趋于波松分布,λ用二项分布得np代之;(2)在n→∞,p→0、5时,二项分布趋于正态分布,正态分布中得μ、σ2用二项分布得np、npq代之。在实际计算中,当p<0、1且n很大时,二项分布可由波松分布近似。(3)当p>0、1且n很大时,二项分布可由正态分布近似。(4)波松分布,当λ→∞时,波松分布以正态分布为极限。在实际计算中,当λ≥20(也有人认为λ≥6)时,用波松分布中得λ代替正态分布中得μ及σ2,即可由后者对前者进行近似计算。
单侧概率与双侧概率生物统计中,把随机变量x落在区间(μ-kσ,μ+kσ)之外得概率称为双侧(两尾)概率,记作α。对应于双侧概率可以求得随机变量x小于μ-kσ或大于μ+kσ得概率,称为单侧概率,记作α/2。如,x落在(μ-1、96σ,μ+1、96σ)之外得双侧概率为0、05,而单侧概率为0、025。即
P(x<μ-1、96σ)=P(x>μ+1、96σ)=0、025x落在(μ-2、58σ,μ+2、58σ)之外得双侧概率为0、01,而单侧概率
P(x<μ-2、58σ)=P(x>μ+2、58σ)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- (高清版)DB12∕T 490.1-2013 社区管理和服务信息化规范 第1部分:总则
- (高清版)DB12∕T 673-2016 营运车辆二级维护企业技术条件
- 退休座谈会感人发言稿
- 医疗机构自查报告8篇
- 2024年证券从业考试深度剖析试题及答案
- 2025年联营合作协议模板
- 考前准备:CPMM考试时间管理技巧及试题及答案
- 2025年两人合伙开店合作协议模板
- 2025年度离婚债务分割与财产清算协议
- 2025年度酒店预订与会议场地租赁合同
- 2024职业性汞中毒诊断标准
- 2024-2030年中国固废垃圾处理行业市场现状供需分析及重点企业投资评估规划分析研究报告
- GB/T 4008-2024锰硅合金
- 2024年个人信用报告(个人简版)样本(带水印-可编辑)
- 社会信用法概论智慧树知到期末考试答案章节答案2024年湘潭大学
- DB32T 4416-2022《高延性纤维增强水泥基复合材料加固砌体结构应用技术规程》
- 集合的交、并、补运算
- 20CS03-1一体化预制泵站选用与安装一
- 互联网空间下的城市网络格局及结构研究
- VAV中央空调系统的深化、施工以及配合调试的方案
- 北京市石景山区第九中学2023-2024学年化学高一下期末联考模拟试题含解析
评论
0/150
提交评论