数学分布泊松分布、二项分布、正态分布、均匀分布、指数分布生存分析贝叶斯概率公式全概率公式讲解_第1页
数学分布泊松分布、二项分布、正态分布、均匀分布、指数分布生存分析贝叶斯概率公式全概率公式讲解_第2页
数学分布泊松分布、二项分布、正态分布、均匀分布、指数分布生存分析贝叶斯概率公式全概率公式讲解_第3页
数学分布泊松分布、二项分布、正态分布、均匀分布、指数分布生存分析贝叶斯概率公式全概率公式讲解_第4页
数学分布泊松分布、二项分布、正态分布、均匀分布、指数分布生存分析贝叶斯概率公式全概率公式讲解_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数学期望:随机变量最基本的数学特征之一。它反映随机变量平均取值的大小。又称期望或均值。它是简单算术平均的一种推广。例如某城市有10万个家庭,没有孩子的家庭有1000个,有一个孩子的家庭有9万个,有两个孩子的家庭有6000个,有3个孩子的家庭有3000个,则此城市中任一个家庭中孩子的数目是一个随机变量,记为X,它可取值0,1,2,3,其中取0的概率为0.01,取1的概率为0.9,取2的概率为0.06,取3的概率为0.03,它的数学期望为0X0.01+1X0.9+2X0.06+3X0.03等于1.11,即此城市一个家庭平均有小孩1.11个,用数学式子表示为:E(X)=1.11o也就是说,我们用数学

2、的方法分析了这个概率性的问题,对于每一个家庭,最有可能它家的孩子为1.11个。可以简单的理解为求一个概率性事件的平均状况各种数学分布的方差是:1、 一个完全符合分布的样本2、 这个样本的方差概率密度的概念是:某种事物发生的概率占总概率(1)的比例,越大就说明密度越大。比如某地某次考试的成绩近似服从均值为80的正态分布,即平均分是80分,由正态分布的图形知x=80时的函数值最大,即随机变量在80附近取值最密集,也即考试成绩在80分左右的人最多。下图为概率密度函数图(F(x)应为f(x),表示概率密度):离散型分布:二项分布、泊松分布连续型分布:指数分布、正态分布、X分布、t分布、F分布IJ)Y抽

3、样分布抽样分布只与自由度,即样本含量(抽样样本含量)有关二项分布(binomialdistribution):例子抛硬币1、重复试验(n个相同试验,每次试验两种结果,每种结果概率恒定伯努利试验)设事件A出现的厩率为心则在门次独立成建中,事件A捺好出现人次的版率先:P(X=k)=Ck(l-7r)nk3、P(X=0),P(X=1),P(X=3),所有可能的概率共同组成了一个分布,即二项分布某毒物的50%致死剂量后5只动物死亡数的二项分布(生5,mCL5)泊松分布(possiondistribution:1、一个单位内(时间、面积、空间)某稀有事件2、此事件发生K次的概率3、P(X=0),P(X=1

4、),P(X=3),.所有可能的概率共同组成了一个分布,即泊松分布Z=3Z=5().20.1412()4三、泊松分布产生的一般条件在自然界和人们的现实生活中,经常要遇到在随机时刻出现的某种事件.我们把在随机时刻相继出现的事件所形成的序列,叫做随机事件流.若事件流具有平稳性、无后效性、普通性,则称该事件流为泊松事件流(泊松流).下面简要解释平稳性、无后效性、普通性.平稳性:在任意时间区间内,事件发生*次依K)的概率只依赖于区间长度而与区间端点无关.无后效性:在不相重叠的时间段内,事件的发生是相互独立的.普通性:如果时间区间充分小,事件出现两次或两次以上的概率可忽略不计.对泊松流,在任意时间间隔(0

5、j)内,事件(如交通事故)出现的次数服从参数为入t的泊松分布.A称为泊松流的强度.二项分布与泊松分布的关系:二、二项分布与泊松分布历史上,泊松分布是作为二项分布的近似,于1837年由法国数学家泊松引入的.在实际中,许多随机现象服从或近似服从泊松分布.近数十年来,泊松分布日益显示其重要性,成为概率论中最重要的几个分布之一.二项分布在事件发生概率很小,重复次数n很大的情况下,其分布近似泊松分布均匀分布(uniformdistribution):分为连续型均匀分布和离散型均匀分布离散型均匀分布:1、 n种可能的结果2、 每个可能的概率相等(1/n)连续型均匀分布:1、 可能的结果是连续的2、 每个可

6、能的概率相等(.一")连续型均匀分布概率密度函数如下图:1 _p-aa§x指数分布(exponentialdistribution):用来表示独立随机事件发生的时间问隔,比如旅客进机场的时间问隔、中文维基百科新条目出现的时间间隔等等。指数分布常用于各种“寿命”分布的近似。1、连续型分布,每个点的概率:3%当0其它其中9>0,则称X服从参数为软指数分布,2、无记忆性。已经使用了s小时的元件,它能再使用t小时的概率,与一个从未使用过的元件使用t小时的概率相同。即它对已经使用过的s小时没有记忆。指数分布的概率密度函数如下图:正态分布(normaldistribution):

7、又称图斯分布1、 描述一个群体的某个指标2、 这个指标是连续的。口为均数3、 每个特定指标在整个群体中都有一个概率(口为标准差)4、 所有指标概率共同组成了一个分布,这个分布就是正态分布正态分布的概率密度函数如下图:中心极限定理:不论总体的分布形式如何(正态或非正态),只要样本(抽样样本)含量n足够大时,样本均数的分布就近似正态分布,且均数与总体均数相等,标准差为(总体标准差)/(n的开方)。中心极限定理使得t分布、F分布和X2分布在抽样样本含量很大时不需要对总体样本是否正态有要求。t分布(studenttdistribution):1、t分布是以0为中心的一簇曲线,每个自由度决定一个曲线2、

8、自由度是一个抽样小样本中的具体观测值的个数(抽样样本含量)-13、总体样本呈正态分布(抽样样本含量较小时,要求总体样本呈正态分布,如果抽样样本含量很大(eg.n>=100),由中心极限定理可知抽样样本均数也近似正态分布,因而“差值”的概率也呈正态分布,而t分布的每一条曲线实际上都是正态分布曲线)4、从一个总体样本中抽取很多个小样本抽样5、每个小样本都有一个均值6、每个小样本的均值与总体样本均值有一个差值,这个差值用t估计全国成年人身高平均值t=匕tjv我们班身高的标准误.替代总体标准差。7、可能有多个小样本的差值估计都是t,t出现的次数占所有小样本的比例可以用一个概率衡量8、所有t值的概

9、率组成一个分布,就是t分布的一个曲线9、另外做一个抽样,每个小样本包含的观测值不同,则形成t分布的另外一个曲线10、自由度越大,则曲线越接近于标准正态分布11、t分布只与自由度相关t分布的概率密度函数如下图(v为自由度):八。=8(标准正态曲线)7-3-2-1X2分布(chisquaredistribution:1、X2分布也是一簇曲线,每个自由度决定一个曲线2、自由度是一个抽样小样本中的具体观测值的个数(抽样样本含量)-12、总体样本呈正态分布(抽样样本含量(n)较小时,要求总体样本呈正态分布)3、从总体样本中抽取n个观测值:Z1,Z2,Z3抽样4、将它们平方后求和,这个和用一个新变量表示,

10、即X2,2二4,/;.(士与5、重复抽样并获得多个X2:X12,X22,X32,X426、可能有多次抽样的X2值相同,同一个X2值的抽样次数占总次数的比例可以用一个概率表示/(/)=27、所有的概率值共同组成一个分布,就是X2分布的一条曲线8、另外做一次,只要从总体中选取观测值数目n不同,得到的就是另外一条曲线10、自由度越大,则曲线越接近于标准正态分布11、X2分布只与自由度相关X2分布的概率密度函数如下图(n在这里为自由度)F分布(F-distribution):1、F分布也是一簇曲线,每对自由度决定一个曲线2、自由度是一个抽样小样本中的具体观测值的个数(抽样样本含量)-12、两总体样本方

11、差比的分布3、总体样本呈正态分布(抽样样本含量(n)较小时,要求总体样本呈正态分布)4、从总体样本中抽取两个样本,两个样中的观测值数目可相同也可不同,分别记为n1和n25、分别计算出X2:X1,X26、构建一个新变量F:7、重复抽取样本,计算多个F值:Fi,F2,F3.8、可能有多次抽样的F值相同,同一个F值的抽样次数占总次数的比例可以用一个概率表示9、所有的概率值共同组成一个分布,就是F分布的一条曲线10、另外做一次,只要从总体中选取观测值数目n不同,得到的就是另外一条曲线10、两个自由度越大,则曲线越接近于标准正态分布11、F分布只与自由度相关F分布的概率密度函数如下图(m,n在这里为自由

12、度)m=10Tn=3【在推估总体平均值时,基于样本平均数的抽样分布】一一t分布【在用样本方差来推估总体方差时,必须知道样本方差的抽样分布】一X2分布【比较两个总体的方差是否相等时,必须知道样本方差的联合抽样分布】一F分布生存分析(survivalanalysis:1、多种影响慢性疾病的因素(不同手术方法、不同药物)2、随访一群患者3、一段时间后统计生存和死亡3、最终给出的结果是一个评价各种因素对生存时间的影响(生存时间、生存率有无差异)生存分析方法-K己口lan-meie过不呈这是一种非参数法,主要用于小样本,适用于能够准确记录事件和删失发生时点的数据。“LifeTables过程也叫寿命表法,适用于样本量大,且不太可能准确记我每个观察对象的死亡或删失发生时间的数据口Cox回归模型分析法用于描述多个变量对生存时间的影响贝叶斯公式(bayesformula):描述两个条件概率之间的关系P(Bi|A)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论