




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 第五章 基本分布 第一节第一节 随机变量及其分布随机变量及其分布一、随机变量一、随机变量random variable) 随机现象,也称不确定现象,指在相同条件下重复试验可随机现象,也称不确定现象,指在相同条件下重复试验可 得到不同结果的现象。得到不同结果的现象。 必然现象,也称确定性现象必然现象,也称确定性现象 随机试验所得到的每一种可能的结果称为随机试验所得到的每一种可能的结果称为 随机事件。数学上可用一个变量,如随机事件。数学上可用一个变量,如X来描来描 述,称为随机变量。述,称为随机变量。 随机变量的每一取值一般都有确定的概率,随机变量的每一取值一般都有确定的概率, 如如P治愈)治愈
2、)=PX=1)=0.60等。因此每一随机变量等。因此每一随机变量 都有一定的概率分布,其分布的类型有两种,即离散型分都有一定的概率分布,其分布的类型有两种,即离散型分布和连续型分布。布和连续型分布。 1 1、离散型随机变量、离散型随机变量 (discrete (discrete random variable)random variable)随机变量X只能取有限个数值X1,X2,Xn或无限个可数数值X1,X2 ,Xn,则X定义为离散型随机变量。当X=Xk ,概率为PXk则有随机变量的概率分布 1)(kXP离散型随机变量的分布函数 :2 2、连续型随机变量、连续型随机变量 (continuous
3、 (continuous random variable)random variable)像某地某年正常成年男子身高这样的随机变量,由于其可能取值不能一一列举出来,而是在实数轴上的某一确定区间内连续分布,称之为连续分布型随机变量,简称连续型随机变量。随机变量X的分布函数Fx为:概率密度函数 f(x):表示随机变量X在取值X附近单位长度内的概率的大小。 为分布函数Fx的导数。所以,对于连续型随机变量来说,要掌握其概率分布规律,其关键是求出其概率密度函数。 Xd xxfXF)()( )(xf第二节第二节 正态分布正态分布正态分布曲线的演变正态分布曲线的演变 频率5-2 a1251291331371
4、411451491531571610.1.2.3.4身高cm)5-2 b这条曲线称为频率曲线,略呈钟型,两侧低,中间高,左右对称,近似于概率分布中的正态分布。频率的总和为1,故正态分布曲线下横轴上的面积也应为1。正态分布的概率密度函数,也称为正态分布曲线方程为: 222)(21)(xexf x正态分布的特性 正态分布只有一个峰值,位于x= 处正态分布以x= 对称轴左右对称正态分布的两个参数 和 决定分布位置和形状 正态分布曲线下面积分布有规律 ),(2Nx对于正态分布常用 xN(,) 标准正态分布标准正态分布与标准化变换: , )标准化变换:令 =0, =1标准正态分布:0,1)xu2/21(
5、 ),2uueu 222)(21)(xexf标准正态分布的应用标准正态分布的应用例53 已知某地2019年120名7岁男童身高 =122.0cm,s=4.7cm,试估计该地7岁男童身高介于118cm和124cm范围内的比例及110名7岁男童介于此范围内的人数。X D=0.6646-0.1989=0.4657=46.57% 7 . 4122xsxxxu 8511. 07 . 41221181u 4255. 07 . 41221242u(u1)=(-0.8511)=0.1989(u2)=(0.4255)=1-(-0.4255)=1-0.3354=0.6646 三、参考值范围定义:绝大多数正常人的解
6、剖,生理,生化各种指标的波动范围,称作为医学参考值范围(medical reference ranges) 。正常人:并非指机体任何器官、组织的形态和机能都正常的人,而是指排除了影响所研究指标的疾病和有关因素的人 步骤和原则步骤和原则抽取足够大例数的正常人作为样本 (n=100)控制测量误差 确定是否需要分组确定参考值范围 决定取双侧还是取单侧 选定合适的百分界限 两种方法:正态分布法和百分位数法正态分布法正态分布法当资料符合正态分布时双侧1正常值范围公式为:单侧上限1正常值范围公式为: sux2/ sux suxu u界值的概念界值的概念 u/2 为标准正态分布下双侧尾部面积为时的u值绝对值
7、)u2为标准正态分布下单侧尾部面积为时的u值绝对值)特别地: u0.05/21.96; u0.01/22.58; u0.05 1.64; u0.01 2.33;百分位数法百分位数法用于任何分布的资料n150)。当资料为偏态分布时,不能用正态分布法,而用百分位数法得到1 正常值范围双侧1正常值范围:P100/2 P 100(1-/2) 单侧1正常值范围上限: P 100 )()(ggP/65. 2212%952386 . 14 . 03 . 295第三节第三节 t t分布分布一、抽样误差和样本均数分布一、抽样误差和样本均数分布抽样误差抽样误差由于抽样引起的总体参数与样本统计量之间的由于抽样引起的
8、总体参数与样本统计量之间的差异叫抽样误差。总体均数与样本均数之间的差异叫抽样误差。总体均数与样本均数之间的差异叫均数抽样误差。差异叫均数抽样误差。样本均数分布和抽样误差大小的估计样本均数分布和抽样误差大小的估计抽样试验抽样试验某市2019年18岁男生身高服从均数=167.7cm,=5.3cm的正态分布;从XN(167.7,5.32)的正态总体中随机抽样,样本含量nj=10,g=100;共抽100次;图图3.1 20193.1 2019年某市年某市1818岁男生身高岁男生身高 N(167.7,5.32)N(167.7,5.32)的抽样示意的抽样示意XjSj=167.7cm=5.3cmX1,X2,
9、X3Xj, 167.41, 2.74165.56, 6.57 168.20, 5.36 :165.69, 5.09100个个Xi样本均数组成一个新的分布特点样本均数组成一个新的分布特点各样本均数未必等于总体均数;各样本均数未必等于总体均数;各样本均数间存在差异;各样本均数间存在差异;样本均数的分布很有规律;样本均数的分布很有规律; ,100个样本均数的均数为个样本均数的均数为167.69cm,而原总体均数为,而原总体均数为167.7cm 样本均数的变异范围较原变量的变异范围大样本均数的变异范围较原变量的变异范围大大缩小;标准差为大缩小;标准差为1.69(5.3); 中心极限定理假设假设 服从正
10、态分布,那么服从正态分布,那么 服从正态服从正态分布;分布; ;假设假设 不服从正态分布,不服从正态分布,n较大则较大则 服服从正态分布;从正态分布; ;n较小,较小, 为非正态分布;为非正态分布;标准误:估计抽样误差大小的指标标准误:估计抽样误差大小的指标标准误标准误(standard error,SE):样本统计量的标准差;样本统计量的标准差;样本均数的标准误样本均数的标准误(standard error of mean,SEM): ;样本均数的标准误的估计值:样本均数的标准误的估计值:例例 20002000年某研究者随机调查某地健康成年年某研究者随机调查某地健康成年男子男子2727人,得
11、到血红蛋白含量的均数为人,得到血红蛋白含量的均数为125g/L125g/L,标准差为,标准差为15g/L15g/L。试估计该样本均。试估计该样本均数的抽样误差。数的抽样误差。均数标准误的含义均数标准误的含义反映均数抽样误差大小的一个指标;反映均数抽样误差大小的一个指标;均数的标准误均数的标准误 与原分布的标准差成与原分布的标准差成 正比,与抽样样本量正比,与抽样样本量n开根号成反比;开根号成反比;欲减少抽样误差,可增加样本量;欲减少抽样误差,可增加样本量;利用均数标准误可以进行总体均数的可信区间的估利用均数标准误可以进行总体均数的可信区间的估计和假设检验。计和假设检验。二、t分布 (tdist
12、ribution)t t分布的由来分布的由来t t分布的图形和特征分布的图形和特征t t界值表界值表 标准正态变换标准正态变换Xu,X0, 1uXXusXXtX,Xt变换变换0t抽抽样样实实验验 t分布的由来分布的由来Xt t分布图形的演变分布图形的演变 FREQUENCY 0 200 t50 MIDPOINT(n=50) - 5 . 0 - 4 . 5 - 4 . 0 - 3 . 5 - 3 . 0 - 2 . 5 - 2 . 0 - 1 . 5 - 1 . 0 - 0 . 5 0 . 0 0 . 5 1 . 0 1 . 5 2 . 0 2 . 5 3 . 0 3 . 5 4 . 0 4 .
13、 5 5 . 0 t分布图形的演变 FREQUENCY 0 200 t3 MIDPOINT (n=3) - 1 2 . 0 - 1 1 . 5 - 1 1 . 0 - 1 0 . 5 - 1 0 . 0 - 9 . 5 - 9 . 0 - 8 . 5 - 8 . 0 - 7 . 5 - 7 . 0 - 6 . 5 - 6 . 0 - 5 . 5 - 5 . 0 - 4 . 5 - 4 . 0 - 3 . 5 - 3 . 0 - 2 . 5 - 2 . 0 - 1 . 5 - 1 . 0 - 0 . 5 0 . 0 0 . 5 1 . 0 1 . 5 2 . 0 2 . 5 3 . 0 3 .
14、5 4 . 0 4 . 5 5 . 0 5 . 5 6 . 0 6 . 5 7 . 0 7 . 5 8 . 0 8 . 5 9 . 0 9 . 5 1 0 . 0 1 0 . 5 1 1 . 0 1 1 . 5 1 2 . 0 t分布图形的特征 f f 图5-3 不 同 自 由 度 下 的t分 布 图 -5 -4 -3 -2 -1 0 1 2 3 4 5 V= V=5 V=1 n单峰分布,以单峰分布,以0为中心,左右对称为中心,左右对称n只有一个参数只有一个参数 (自由度自由度n-1),n越小,则越小,则t值越分散,峰部越值越分散,峰部越n矮而尾部矮而尾部 翘得越高翘得越高n当当逼近逼近时,时
15、, t分布逼分布逼 近近u分布分布t t分布图形下面积具有规律性分布图形下面积具有规律性总面积为总面积为1;任意两区间的面积都可以用积分的方法求出;任意两区间的面积都可以用积分的方法求出;当单双侧确定时,自由度当单双侧确定时,自由度确定时,尾部面积确定时,尾部面积 ()与横轴与横轴t值之间有一一对应的关系;值之间有一一对应的关系;t/2,表示双侧尾部面积为表示双侧尾部面积为,自由度为,自由度为时的时的t界值;界值;t, 表示单侧尾部面积为表示单侧尾部面积为,自由度为,自由度为时的时的t界值;界值;t t界值表的特点界值表的特点表示在单双侧确定时,自由度表示在单双侧确定时,自由度确定时,确定时,
16、t界界值越大,外围面积值越大,外围面积(P)越小;反之亦然;越小;反之亦然;单双侧确定时,外围面积单双侧确定时,外围面积(或或P)确定时,自确定时,自由度由度越大,越大, t界值越小,当界值越小,当 时,时,t=u; t0.05/2,=1.96; t0.01/2,=2.58第四节第四节 二项分布二项分布 (binomial distribution)(binomial distribution)BernoulliBernoulli试验试验以A表示所感兴趣的事件,A事件发生称为“胜利”,不出现称为“失败”。相应的这类试验称作为“成一败型试验或Bernoulli试验。Bernoulli试验满足条件
17、(1每次试验结果只能是两个互斥结果之一A或非A)。(2每次试验的条件不变,每次试验结果A事件发生的概率为常数。(3各次试验独立,即每次试验出现事件A的概率与前面各次试验出现的结果无关。二项分布的概念二项分布的概念n次重复独立试验Bernoulli试验),当每次试验的“阳性概率保持不变时,呈现“阳性的次数k=0,1,2,n的一种概率分布。 ,k=0,1,2, n n为试验例数,k为阳性次数, 为阳性率, n当n和不同时,二项分布的概率是不同的,所n 以说n和是二项分布的两个重要参数。n如果随机变量x服从以n和为参数的二项分布,n 则记作xBn,)。 二项分布的概率计算二项分布的概率计算 恰好有k
18、例阳性数的概率为最多发生k例,即xk的累计概率 为最少发生k例,即xk的累计概率 二项分布概率的递推公式为二项分布的概率计算例题二项分布的概率计算例题例57 据报道,对某药有10%的人有胃肠道反应。为考察某药厂产品质量随机抽取5人服用此药,试求:(13人有反应的概率(2最多2人有反应的概率(3有人有反应的概率二项分布的性质二项分布的性质 2 2、二项分布的正态近似、二项分布的正态近似 (normal (normal approximation) approximation) 0.00 0.08 0.12 n=10 =0.3 0 1 2 3 4 5 6 7 8 9 10 x 0.00 0.04
19、0.08 0 10 20 x 0.00 0.04 0.08 0.16 x 0 10 20 n=20 =0.5 0.12 0.00 0.08 0.16 0.24 0.32 0.40 x 0 1 2 3 4 5 x P(x) n=5 =0.3 P(x) P(x) 0.28 0.24 0.20 0.16 0.04 n=30 =0.3 0.12 P(x) 0.16 概率论中的中心极限定理证明:当n足够大时,且不接近于0也不接近于1时,且 n 和n1 )5,二项分布xB(n,)近似于正态分布 Nn, )。 样本率的分布和正态近似样本率的分布和正态近似 样本率的分布和正态近似样本率的分布和正态近似例59 从阳性率样本率=0.6的总体中随机抽取样本量为16的样本,求样本率p的均数和标准差。样本均数的标准差称为均数的标准误。同样样本率的标准差也称为率的标准误,它描述了样本率抽样误差的大小。 样本率的分布和正态近似样本率的分布和正态近似样本率分布的正态近似 当样本量n较大,总体率不接近于0也不接近1时,且n 和n1 )5, 样本阳性率也近似服从正态分布pN(, )。 事实上,总体率,一般是不知道的,往往用p来估计,用样本率的标准误的估计值 来估计 。 第四节第四节 泊松分布泊松分布poisson poisson distribution dis
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 世界杯相关课件
- 专业工程师职称课件
- 航空公司旅客意外险合同
- 唐山学院《企业电子产品设计与制造》2023-2024学年第二学期期末试卷
- 汕尾市重点中学2025年下学期初三期末检测试题考试英语试题含答案
- 四川成都市成华区重点名校2025届初三3月联合质量检测试题语文试题试卷含解析
- 锦州市古塔区2025届数学五年级第二学期期末达标检测试题含答案
- 江苏省宜兴市丁蜀区渎边联盟2025年初三第二学期学分认定考试英语试题含答案
- 山东省菏泽市开发区2025年数学五下期末统考试题含答案
- 上诉状的课件
- 2025-2030中国硫酸铵行业市场运行分析及竞争格局与投资发展研究报告
- 北京市海淀区2024-2025学年第二学期期中练习暨海淀高三高三一模(海淀一模)(英语试卷+答案 )
- 2025年03月四川天府新区“蓉漂人才荟”事业单位(13人)笔试历年典型考题(历年真题考点)解题思路附带答案详解
- 2025年高考物理压轴题专项训练:用力学三大观点处理多过程运动问题(原卷版)
- 2024年河南轻工职业学院单招职业适应性测试题库必考题
- 中医药行业数字化转型的机遇与挑战
- 工程塑胶材料采购合同(2篇)
- 新污染物环境风险评估:理论与制度构建
- 2025中考英语冲刺-传统文化诗词
- 金融科技学知到智慧树章节测试课后答案2024年秋重庆工商大学
- 2025届北京市朝阳区高三语文一模议论文“说托举”写作导引(5篇范文)
评论
0/150
提交评论