版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
bjlcn@163.com流行病与卫生统计学系Medicalstatistics医学统计学2020/12/191主要内容
数据分布二项分布2020/12/192数据分布对于一组变量值,若以该变量为横轴,数据出现的频数(或频率)为纵轴作图,该数据在坐标系中呈一定的图形,称为数据的分布。2020/12/193数据分布分布是统计方法产生的基础常用的数据分布有正态分布、二项分布、Poisson分布等2020/12/194二项分布(binomialdistribution)二分类资料:观察对象的结局只有相互对立的两种结果。
例如:生存、死亡阳性、阴性发病、不发病治愈、未愈2020/12/195先看一个例子已知:小白鼠接受某种毒物一定剂量时,死亡概率=80%
生存概率=20%每只鼠独立做实验,相互不受影响若每组各用3只小白鼠(甲、乙、丙)
3只小白鼠的存亡方式符合二项分布2020/12/196你认为实验结果将会出现多少种可能的情况?所有可能结果死亡数生存数甲乙丙Xn-X生生生03生生死生死生12死生生生死死死生死21死死生死死死30如果计算生与死的顺序,则共有8种排列方式;如果只计生存与死亡的数目,则只有4种组合方式。2020/12/197概率的乘法法则几个独立事件同时发生的概率,等于各独立事件的概率之积。一个事件发生(的概率)对另一个事件发生(的概率)没有影响,这两个事件就是独立事件。2020/12/198例子甲、乙射击命中目标的概率分别是1/2与1/3,求甲、乙各射击一次,同时命中目标的概率是多少?
已知: A={甲命中目标},则P(A)=1/2
B={乙命中目标},则P(B)=1/3
求A、B同时发生的概率P(AB)?
P(AB)=P(A)*P(B)=1/2*1/3=1/62020/12/199概率的加法法则互不相容事件和的概率等于各事件的概率之和。不可能同时发生的事件是互不相容事件,又称互斥事件。2020/12/1910例子投掷一枚质地均匀的馓子,求“数字4朝上”或“数字6朝上”的概率?
已知: A={数字4朝上},则P(A)=1/6
B={数字6朝上},则P(B)=1/6
求A或者B发生的概率?
P(A+B)=P(A)+P(B)=1/6+1/6=1/32020/12/1911出现每一种可能结果的概率是多少?3只小白鼠均生存的概率
P==0.0083只小白鼠2生1死的概率
P1==0.032
P2==0.032P=0.096
P3==0.0322020/12/1912出现每一种可能结果的概率是多少?3只小白鼠2死1生的概率
P1==0.128
P2==0.128P=0.384
P3==0.1283只小白鼠均死亡的概率
P==0.512
2020/12/1913所有可能结果每种结果的概率死亡数生存数不同死亡数的概率甲乙丙Xn-X生生生0.2×0.2×0.2030.008生生死0.2×0.2×0.8生死生0.2×0.8×0.2120.096死生生0.8×0.2×0.2生死死0.2×0.8×0.8死生死0.8×0.2×0.8210.384死死生0.8×0.8×0.2死死死0.8×0.8×0.8300.51211.000三只小白鼠存亡的排列和组合方式及其概率的计算2020/12/1914二项展开(0.2+0.8)3=0.23+3×0.22×0.8+3×0.2×0.82+0.83生存概率死亡概率
三生二生一死一生二死
三死对应于二项展开式:二项式展开式中的各项对应于各死亡数(X)的概率P(X),二项分布由此得名。
2020/12/1915二项分布的定义二项分布是指在只会产生两种可能结果如“阳性”或“阴性”之一的n次独立重复实验中,当每次试验“阳性”概率保持不变时,出现“阳性”的次数
X=0,1,2,…,n的一种概率分布。2020/12/1916Page17二项分布的定义从阳性率为的总体中随机抽取含量为n的样本,恰有X例阳性的概率为:
则称X服从参数为的二项分布(BinomialDistribution),记为:X~B(n,)。其中参数常常是未知的,而n由实验者确定。2020/12/1917如已知n=3,=0.8,则恰有1例阳性的概率P(1)为:2020/12/1918
例已知某种动物关于某毒物的50%致死剂量(LD50),现有5只这样的动物注射了该剂量,试分别计算死亡动物数X=0,l,2,3,4,5的概率。二项分布的概率2020/12/1919二项分布二项分布的概率2020/12/1920二项分布的性质如果X~B(n,),则:
X的均数:
X的方差:
X的标准差:2020/12/1921二项分布的性质
若均数与标准差不用绝对数而用率表示时
2020/12/1922从阳性率为的总体中随机抽取n个个体,则①最多有k例阳性的概率:
二项分布的累计概率2020/12/1923从阳性率为的总体中随机抽取n个个体,则②最少有k例阳性的概率:二项分布的累计概率其中,X=0,1,2,…,k,…,n。2020/12/1924二项分布的累计概率例据以往经验,用某药治疗小儿上呼吸道感染、支气管炎,有效率为85%,今有5个患者用该药治疗,问:①最多1人有效的概率为多少?②至少3人有效的概率为多少?2020/12/1925本例
=0.85,l-
=0.15,n=5,依题意,最多1人有效的概率为:至少3人有效的概率为:
P(X≥3)=P(3)+P(4)+P(5)则P(X≥3)=0.138178125+0.391504688+0.443705313=0.9733881262020/12/1926三只小白鼠死亡的二项分布(n=3,
=0.8)二项分布的图形2020/12/1927某毒物的50%致死剂量后5只动物死亡数的二项分布(n=5,=0.5)二项分布的图形2020/12/1928二项分布的图形2020/12/1929二项分布的图形当=0.5,分布对称;当
0.5,分布呈偏态;当<0.5时分布呈正偏态;当>0.5时分布呈负偏态;特别是当n值不是很大时,偏离0.5愈远,分布愈偏。随着n的增大,二项分布逐渐逼近正态分布。一般地说,如果n和n(1-)大于5时,常可用正态近似原理处理二项分布问题。2020/12/1930二项分布的应用条件
各观察单位只能有互相对立的一种结果,如阳性或阴性,生存或死亡等。已知发生某一结果(如阴性)的概率不变,其对立结果(如阳性)的概率则为1-。
n次试验在相同条件下进行,且各观察单位的结果互相独立。2020/12/1931率的抽样误差
=0.30101100001
p=0.42020/12/1932率的抽样误差样本号x1x2x3x4x5x6x7x8x9x10Xp1001001010030.32010011100150.53001000000010.14010110000140.45100000010020.26000010011030.37100010100140.48000000101020.29111101001170.710010000000010.1从
=0.3中随机抽样,样本含量为10的10份独立样本的样本率2020/12/1933率的抽样误差从
=0.3中随机抽样,样本含量为10的10000个样本率的频率分布图2020/12/1934率的抽样误差从
=0.3中随机抽样,样本含量为100的10000个样本率的频率分布图2020/12/1935率的抽样分布特点当总体率<0.5时为正偏态;当>0.5时为负偏态,当=0.5时为对称分布。在n较大,且率和(1-)都不太小时即n和n(1-)均大于5,率的抽样分布近似正态分布。2020/12/1936率的标准误样本率的均数样本率的标准差率的标准误2020/12/1937率的可信区间估计=?n,Xp=X/n2020/12/1938n
较大时,可用正态近似法:率的95%的CI:例4.4n=144,p=9.02%,X=13
9.02%±1.96×2.388%=(0.0435,0.1371)
(4.35%,13.71%)
2020/12/1939n
较小时,查表法(直接计算概率法)例4.5n=29,X=1。p=3.4%.
查附表6.1百分率的可信区间
n=29行
X=1列95%可信区间:0.1-17.8(%)2020/12/1940n
较小时,查表法(直接计算概率法)例n=10,X=8。p=80%.
先查n=10,X1=2。p1=20%.
得95%可信区间为:(3%,56%)
从而:
(1-56%,1-3%)=(44%,97%)2020/12/1941率的可信区间的不对称性
p=10% p=30% p=50%n=10 0.3~44.5 6.7~65.2 18.7~81.3n=20 1.2~31.7 11.9~54.3 27.2~72.8n=30 2.1~26.5 14.7~49.4 31.3~68.7 n=40 2.8~23.7 16.6~46.5 33.8~66.2n=50 3.3~21.8 17.9~44.6 35.5~64.5
2020/12/1942率的可信区间的性质只有=0.5时是对称的;n越大,区间越窄;对同一n,越接近0.5,分布越宽,越接近0或1,分布越窄。2020/12/1943样本率与总体率的比较(n
较大时)2020/12/1944样本率与总体率的比较(n
较大时)例7.10=20%,n=306,X=96,p=31.58%H0:=0,老年胃溃疡病患者的胃出血率
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 资金管理与优化实践总结
- 广西河池市环江县2022-2023学年六年级上学期英语期末试卷
- 《演讲中的自我介绍》课件
- 2025年山西省、陕西省、宁夏、青海省八省联考高考地理模拟试卷
- 2023年广西壮族自治区柳州市公开招聘警务辅助人员辅警笔试自考题1卷含答案
- 2024年山西省朔州市公开招聘警务辅助人员辅警笔试自考题2卷含答案
- 《全身麻醉》课件
- 机电部的口号和目标
- 辽宁省本溪市(2024年-2025年小学六年级语文)统编版综合练习((上下)学期)试卷及答案
- 《慢阻肺健康大课堂》课件
- 广西壮族自治区钦州市浦北县2022-2023学年七年级上学期期末英语试题
- 动力学全套课件
- 广东省深圳市2022-2023学年六年级上学期语文期末试卷(含答案)6
- 2022-2023学年北京市海淀区高一(上)期末生物试卷(附答案详解)
- 河南省出版物经营许可证申请登记表
- 细集料筛分试验检测记录表模板
- (完整word版)聘书模板红色
- 广西柳州市名校2024届数学高一上期末统考试题含解析
- 高考浙江卷:2023年6月《政治》考试真题与参考答案
- 第三章海洋民俗生活与海洋信仰
- 神经网络-BP算法-课件
评论
0/150
提交评论