版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、主讲人主讲人 刘欣刘欣流行病与卫生统计学教研室流行病与卫生统计学教研室 第二节第二节 正态分布及应用正态分布及应用 正态曲线以均数为中心,左右对称。正态曲线以均数为中心,左右对称。 正态曲线的高峰位于均数所在处。正态曲线的高峰位于均数所在处。 正态分布具有正态分布具有均值与均值与标准差两个参数。标准差两个参数。 确定正态曲线的中心位置。确定正态曲线的中心位置。越大,曲越大,曲 线沿横轴越向右移动;反之越向左移动。线沿横轴越向右移动;反之越向左移动。 确定曲线的形状。确定曲线的形状。越大,曲线越扁平;越大,曲线越扁平; 越小,曲线越尖峭。一般用越小,曲线越尖峭。一般用N(,2)表示表示 均数为均
2、数为,方差为,方差为2的正态分布。的正态分布。 正态曲线下面积分布有一定规律。正态曲线下面积分布有一定规律。 二、二、 正态分布的特征正态分布的特征(-1 , +1 ): 68.27%(-1.96, +1.96 ):95.00%(-2.58, +2.58 ):99.00% 理论上,正态曲线下理论上,正态曲线下1.961.96和和2.582.58的区间的面积分别各占总面积的的区间的面积分别各占总面积的95%95%及及99%99%。图。图示见下图。示见下图。四、标准正态分布四、标准正态分布 正态分布有两个不固定的参数正态分布有两个不固定的参数与与,为了,为了应用方便,可采取变量变换,使二者都为常数
3、,应用方便,可采取变量变换,使二者都为常数,即即= 0= 0,= 1= 1。其变换为。其变换为: :xu 此变换可把此变换可把N(,2)N(,2)转化为转化为= 0= 0,= 1= 1的的正态分布正态分布N(0,1)N(0,1),称为标准正态分布,称为标准正态分布standard standard normal distributionnormal distribution)。)。 三、正态分布的应用三、正态分布的应用 制定参考值范围制定参考值范围 参考值范围参考值范围reference ranges)reference ranges)又被称为正又被称为正常值范围,是指绝大多数正常人的解剖、生
4、理、生常值范围,是指绝大多数正常人的解剖、生理、生化等各种数据的波动范围。化等各种数据的波动范围。 (一参考值范围的概念(一参考值范围的概念(二参考值范围估计的基本步骤(二参考值范围估计的基本步骤 从正常人的总体中进行随机抽样。从正常人的总体中进行随机抽样。 对选定的正常人进行准确测量。对选定的正常人进行准确测量。 确定取单侧范围还是双侧范围。确定取单侧范围还是双侧范围。 选择适当的百分范围。选择适当的百分范围。 根据资料的分布类型选用恰当的估计方法。根据资料的分布类型选用恰当的估计方法。 (三参考值范围的估计方法(三参考值范围的估计方法 根据资料的分布类型可选择正态分布法或百根据资料的分布类
5、型可选择正态分布法或百分位数法计算参考值范围。分位数法计算参考值范围。 1. 1. 正态分布法正态分布法 适用于正态分布或近似正态适用于正态分布或近似正态分布的资料。计算公式为:分布的资料。计算公式为:SuX 例例 某地调查正常成年男子某地调查正常成年男子144144人的红细胞数人的红细胞数( (近似正近似正态 分 布态 分 布 ) ) , 得 均 数 为, 得 均 数 为 5 5 . 3 25 5 . 3 2 1 0 1 2 / L1 0 1 2 / L , 标 准 差 为, 标 准 差 为0.440.441012/L1012/L。试估计该地成年男子红细胞数的。试估计该地成年男子红细胞数的9
6、5%95%医学医学参考值范围。参考值范围。 因红细胞数过多或过少均为异常,故应求双侧因红细胞数过多或过少均为异常,故应求双侧范围。范围。 资料近似正态分布,用正态分布法计算如下:资料近似正态分布,用正态分布法计算如下:下限为:下限为:)/10(52.5444. 096. 138.551205. 0LSuX上限为:上限为:)/10(24.5644. 096. 138.551205. 0LSuX该地成年男子红细胞数的该地成年男子红细胞数的95%医学参考值范围为医学参考值范围为54.52,56.24)。)。 2. 2. 百分位数法百分位数法 常用于偏态分布资料。以常用于偏态分布资料。以95%95%范
7、围为例,其计算公式为:范围为例,其计算公式为:双侧:双侧:),(5 .975 . 2PP单侧:单侧:5P95P或或 一、均数的抽样误差与标准误 1、均数的抽样误差 样本均数与总体均数之差异或各样本 均数之差异,称为均数的抽样误差。中心极限定理的直观表述见下图中心极限定理的直观表述见下图),(2Nxx总体1Xx2x3x1xi-2xi-1x4xi. . .样本样本1 1n样本样本2 2样本样本j j. . . 2XjX. .X总体总体),(2nNXnn 2、 标准误standard error):反映均数抽样误差大小的指标是样本均数的标准差,简称标准误,记作 或 。xxSnSSx 二、二、t t
8、分分 布布 0图2 t 分布曲线 t t分布曲线形态类似正态分布曲线。分布曲线形态类似正态分布曲线。(一)(一) t t 分布的特征分布的特征 t分布曲线以分布曲线以0为中心,左右对称。为中心,左右对称。 t分布具有一个参数分布具有一个参数(称自由度,称自由度,=n-1)。 越小,曲线越扁平;越小,曲线越扁平;越大,曲线越接近越大,曲线越接近 标准正态分布;当标准正态分布;当 时,时,t 分布趋近于分布趋近于 标准正态分布。标准正态分布。 t分布是一簇曲线。不同分布是一簇曲线。不同的的t分布曲线见图分布曲线见图3。 t分布曲线下面积分布有一定规律。分布曲线下面积分布有一定规律。 = (标准正态
9、曲线)= 4= 1f(t)图3 自由度分别为1、4、的t分布曲线(二)(二) t t 分布曲线下面积分布规律即分布曲线下面积分布规律即t t界值表界值表) t 界值常记为界值常记为 。其中。其中为自由度,为自由度,为概率为概率。其意义为:。其意义为:,t 单侧概率:单侧概率:P(t-t,)=P(t-t,)=或或P(tt,)=P(tt,)= 双侧概率:双侧概率:P(t-t,)+P(tt,)=P(t-t,)+P(tt,)= 对于双侧概率意义的图形直观表达见下图对于双侧概率意义的图形直观表达见下图4 4。,t,t22图4 t 分布曲线下面积分布示意 四、总体均数置信区间估计四、总体均数置信区间估计统
10、计推断统计推断参数估计参数估计假设检验假设检验点估计点估计(point estimation)(point estimation)区间估计区间估计(interval estimation)(interval estimation) 概念:根据样本均数,按给定的概率计算出总体均数概念:根据样本均数,按给定的概率计算出总体均数很可能在的一个数值范围,这个范围称为总体均数很可能在的一个数值范围,这个范围称为总体均数的可信区间的可信区间(confidence interval, CI)。 方法:方法:(1) u分布法分布法(2) t分布法分布法(1 1u u 分布法分布法公式公式应用条件应用条件例题例
11、题(xus x,xu s x) 即xus x)未知,但未知,但n n足够大或足够大或已知已知(2 2t t分布法分布法公式公式应用条件应用条件例题例题(x ts x,xt s x) 即xts x)未知,且未知,且n n较小较小区间估计的准确度:说对的可能性大小,区间估计的准确度:说对的可能性大小, 用用 (1- (1-) ) 来衡量。来衡量。99%99%的可信区间好于的可信区间好于95%95%的可信区间的可信区间n, S n, S 一定时)一定时) 。区间估计的精确度:指区间范围的宽窄,区间估计的精确度:指区间范围的宽窄,范围越宽精确度越差。范围越宽精确度越差。99%99%的可信区间差的可信区
12、间差于于95%95%的可信区间的可信区间n, S n, S 一定时)一定时) 。 四、假设检验的基本思想和步骤四、假设检验的基本思想和步骤 例例 根据大量调查,已知正常成年男子脉搏均数为根据大量调查,已知正常成年男子脉搏均数为7272次次/ /分。某医生在一山区随机抽查了分。某医生在一山区随机抽查了2525名健康成年男子,名健康成年男子,求得其脉搏均数为求得其脉搏均数为74.274.2次次/ /分,标准差为分,标准差为6.06.0次次/ /分。能否分。能否据此认为该山区成年男子脉搏均数高于一般成年男子脉搏据此认为该山区成年男子脉搏均数高于一般成年男子脉搏均数?均数? 在本例中,山区成年男子脉搏
13、均数用在本例中,山区成年男子脉搏均数用山表示山表示,一般成年男子脉搏均数用,一般成年男子脉搏均数用00表示。表示。0=72次次/分分一般总体一般总体山山= ?山区总体山区总体n=25分次分次/0 . 6/2 .74SX 这里这里山与山与00的关系只能有两种:的关系只能有两种: 山山0 山山0山山0山山0 这里根据专业知识这里根据专业知识山山00的关系中只能是的关系中只能是 山山0 0 。造成二种情况的原因有:。造成二种情况的原因有: 山山0 (同一总体)(同一总体) 抽样误差抽样误差 山山0 (不同总体)(不同总体) 本质不同本质不同 假设检验的基本步骤如下:假设检验的基本步骤如下:1 1、建
14、立检验假设和确定检验水准、建立检验假设和确定检验水准 检验假设有两种:检验假设有两种: 检验假设检验假设(hypothesis under test)又称零又称零/原原假设假设(null hypothesis)。用。用H0表示。假定通常表示。假定通常为:某两个或多个总体参数相等,或某为:某两个或多个总体参数相等,或某两个总体参数之差等于两个总体参数之差等于0,或某资料服从某一,或某资料服从某一特定分布正态分布、特定分布正态分布、Poisson分布等。本分布等。本例则为:例则为:H0: 山山0 。 单双侧的选择在检验之前由专业知识确定。单双侧的选择在检验之前由专业知识确定。 备择假设备择假设(a
15、lternative hypothesis)又称对立又称对立假设。用假设。用H1表示。表示。H1与与H0对立。对立。H1的内容可的内容可反映出检验的单双侧。本例为:反映出检验的单双侧。本例为:H1: 山山0 即为单侧检验即为单侧检验(one-sided test)或单尾检验或单尾检验(one-tailed test)。若。若H1: 山山0 则为双侧检验则为双侧检验(two-sided test)或双尾检验或双尾检验(two-tailed test)。 检验水准检验水准(size of a test)是假设检验作判断是假设检验作判断结论的标准,是预先确定的概率值,常常取结论的标准,是预先确定的概
16、率值,常常取小概率事件标准。用小概率事件标准。用表示。也为表示。也为I型错误型错误 的概率大小的概率大小( (详后详后) )。实际工作中,。实际工作中,常取常取0.050.05。2 2、选定检验方法和计算检验统计量、选定检验方法和计算检验统计量 应根据变量或资料的类型、分析的目的、设应根据变量或资料的类型、分析的目的、设计的方案、检验方法的适用条件等选择检验方法。计的方案、检验方法的适用条件等选择检验方法。 检验统计量检验统计量(test statistic)(test statistic)是在是在H0H0假设的条假设的条件件下由统计学家推导出的可由样本指标计算出来用下由统计学家推导出的可由样
17、本指标计算出来用于推断结论的数值。于推断结论的数值。 检验方法常用检验统计量的名称命名。如检验方法常用检验统计量的名称命名。如t t检检验中的验中的t t统计量、统计量、 u u检验中的检验中的u u统计量、统计量、 2 2检验中检验中的的22统计量等。统计量等。3 3、确定、确定P P值和作出推断结论值和作出推断结论 P P值的统计学含义是指从值的统计学含义是指从H0H0规定的总体随机规定的总体随机抽得等于及大于或等于及小于现有样本获得抽得等于及大于或等于及小于现有样本获得的检验统计量的概率。的检验统计量的概率。 通俗地讲,通俗地讲,P P值就代表了值就代表了H0H0成立与否的概率。成立与否
18、的概率。 将将P P值与检验水准值与检验水准进行比较得出推断结进行比较得出推断结论。论。推断结论应包含统计结论和专业结论两部分。推断结论应包含统计结论和专业结论两部分。 若若P P ,则按,则按检验水准拒绝检验水准拒绝H0H0,有,有统计学意义统计结论),可认为统计学意义统计结论),可认为不同或不不同或不等专业结论)。等专业结论)。 若若P P ,则按,则按检验水准尚不拒绝检验水准尚不拒绝H0H0,无,无统计学意义,还不能认为统计学意义,还不能认为不同或不等。不同或不等。 下面通过例下面通过例10.1710.17具体介绍假设检验的过程:具体介绍假设检验的过程:H0: 山山0H1: 山山0单侧,
19、单侧,= 0.05833. 1250 . 6722 .7400nSXSXtX =24 =24,查单侧,查单侧t,= t0.05,24=1.711t,= t0.05,24=1.711,今,今求得求得 t =1.833 t =1.8331.7111.711, P P0.050.05,按,按=0.05=0.05水准拒水准拒绝绝 H0 H0,有统计学意义。可认为该山区成年男子脉,有统计学意义。可认为该山区成年男子脉 搏数高于一般成年男子脉搏数。搏数高于一般成年男子脉搏数。 上述例题属于单样本上述例题属于单样本t t检验,其假设检验检验,其假设检验的推断结果是依据的推断结果是依据t t分布的原理作出的。为了理解分布的原理作出的。为了理解其推断过程的原理,通过直观的示意图见附图其推断过程的原理,通过直观的示意图见附图表达上述例题假设检验的过程。表达上述例题假设检验的过程。)(t=24H0: 山山0单侧单侧t,= t0.05,24t,= t0.05,24=0.051.711接受域接受域山山0拒绝域拒绝域山山0t=1.833P=0.05 第四节第四节 t 检验和检验和u 检验检验 t t 检验检验(t-test,(t-test,亦称亦称Students t-test)St
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 节约减排保护环境倡议书
- 宴会厅音响系统设计与效果评估
- 医疗安全教育与小学德育的融合路径
- 2024版资料管理劳动合同3篇
- 2024版股权转让合同详解:含股权比例调整与收购条款
- 2024聘用副总经理职位设置与薪酬福利体系合同3篇
- 二零二五年度股权转让与稀释条款详解合同2篇
- 2024汽车销售应收账款质押担保与汽车行业创新发展合同3篇
- 2024石材加工企业融资租赁及风险管理合作协议3篇
- 二零二五年度矿产资源采购合同规范2篇
- 弹性模量自动生成记录
- 老年痴呆患者安全护理
- 管理制度医疗器械质量管理制度
- 颅脑损伤的高压氧治疗
- 公司章程模板五篇
- 汽车行走的艺术学习通超星期末考试答案章节答案2024年
- 2025届山东省菏泽市部分重点学校高一上数学期末统考模拟试题含解析
- 2025届云南省昆明市禄劝县第一中学数学高二上期末复习检测试题含解析
- 机械工程师招聘笔试题及解答
- 2023年基础会计学课后习题及参考答案
- 2024年时事新闻及点评【六篇】
评论
0/150
提交评论