《医学统计学全科》演示PPT_第1页
《医学统计学全科》演示PPT_第2页
《医学统计学全科》演示PPT_第3页
《医学统计学全科》演示PPT_第4页
《医学统计学全科》演示PPT_第5页
已阅读5页,还剩118页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医学统计学医学统计学闫世艳2011-4-18绪 论 为什么医学科为什么医学科研工作离不开研工作离不开统计学?统计学?什么是医学统计学?o运用概率论、数理统计学的原理运用概率论、数理统计学的原理与方法,研究医学领域中与方法,研究医学领域中随机现象有关数据的搜集、整理、分析有关数据的搜集、整理、分析与推断,进而阐明其与推断,进而阐明其客观规律性的一门应用科学。的一门应用科学。医学统计学的研究对象o 随机现象(事件)随机现象(事件)-变异变异 o 必然现象(事件)必然现象(事件)o “若无变异,无需统计若无变异,无需统计”医学研究的基本流程o 研究设计:专业设计、统计设计研究设计:专业设计、统计设计

2、o 研究实施研究实施收集资料收集资料o 整理资料整理资料o 分析资料分析资料o 结论结论统计学在医学科研中的地位o 统计学是工具,是为医学科研服务的;需要与临床统计学是工具,是为医学科研服务的;需要与临床专家相互协作。专家相互协作。o 没有好的研究设计,再好的统计方法都无济于事。没有好的研究设计,再好的统计方法都无济于事。o 统计学是在搜集、整理、分析和解释大量数据的过统计学是在搜集、整理、分析和解释大量数据的过程中完成使命的。程中完成使命的。 o “研究结束之后,再找统计学家,相当于进行尸体研究结束之后,再找统计学家,相当于进行尸体解剖,他能告诉你的只能是试验失败的原因解剖,他能告诉你的只能

3、是试验失败的原因”RA,Fisher统计学的基本概念o 同质与变异同质与变异o 总体与样本总体与样本o 概率与频率概率与频率o 变量变量o 个体个体o 误差误差同质与变异o 同质:研究事物现象存在的共性,是统计学同质:研究事物现象存在的共性,是统计学的基础。的基础。o 同质:观察单位间被研究指标的影响因素相同质:观察单位间被研究指标的影响因素相同。同。o 变异:同质总体中,不同个体间的差异。变异:同质总体中,不同个体间的差异。总体与样本o 个体:观察单位,统计研究中的最基本单位。个体:观察单位,统计研究中的最基本单位。o 总体:根据研究目的确定的同质个体构成总总体:根据研究目的确定的同质个体构

4、成总体体n 有限总体:有时间、空间、人群范围的限制有限总体:有时间、空间、人群范围的限制n 无限总体:无时间、空间的限制无限总体:无时间、空间的限制1. 样本:从总体中样本:从总体中随机随机抽取的部分个体,构成抽取的部分个体,构成样本。样本。概率与频率o 频率:在相同条件下,重复频率:在相同条件下,重复n次试验,某随机事件次试验,某随机事件A发生的次数发生的次数X与与n次试验的比值,即为该事件发生次试验的比值,即为该事件发生的频率。的频率。oBuffon 4040次硬币次硬币 2048次正面次正面 频率:频率:0.5069o 概率:某随机事件发生可能性大小的度量。用概率:某随机事件发生可能性大

5、小的度量。用P表表示。上述试验,当示。上述试验,当n逐渐增大时,频率始终在一个逐渐增大时,频率始终在一个常数左右微小波动,这个常数就是概率。常数左右微小波动,这个常数就是概率。o 扔硬币的试验中,出现正面的概率为扔硬币的试验中,出现正面的概率为0.50.o 小概率事件,小概率事件,P0.05 参数与统计量o 参数:反映总体的统计指标参数:反映总体的统计指标o 统计量:反映样本的统计指标统计量:反映样本的统计指标变量(variable)与资料(data)o 观察或测量的个体(或观察单位)的某项特观察或测量的个体(或观察单位)的某项特征,称为变量。征,称为变量。o 如某地如某地7岁儿童的身高、体重

6、等。岁儿童的身高、体重等。o 变量值构成资料。如,一组病人的血压值变量值构成资料。如,一组病人的血压值资料类型o 计量资料:表现为具体的数值、有度量衡单计量资料:表现为具体的数值、有度量衡单位,如血压、血糖等。位,如血压、血糖等。百分率资料:减分率百分率资料:减分率o 计数资料:观察指标是定性的,如阴性、阳计数资料:观察指标是定性的,如阴性、阳性,有病、无病等。二分类、多分类性,有病、无病等。二分类、多分类o 等级资料:尿糖检测结果的等级资料:尿糖检测结果的+ + + + +、治疗、治疗效果:痊愈、显效、有效、无效等效果:痊愈、显效、有效、无效等o 不同的资料类型可以相互转化不同的资料类型可以

7、相互转化o 不同的资料类型有不同的统计分析方法不同的资料类型有不同的统计分析方法描述性统计描述性统计 (一)(一)统计处理o 统计描述:统计描述: 描述样本特征:列表、图示、数字描述样本特征:列表、图示、数字o 统计推断:统计推断:计量资料分布特征和描述指标o 集中趋势:平均水平集中趋势:平均水平 算术均数、几何均数和中位数算术均数、几何均数和中位数o 离散趋势:变异性离散趋势:变异性 极差、四分位数间距、方差、标准差、变异极差、四分位数间距、方差、标准差、变异系数系数集中趋势指标-均数meano 算术均数:简称均数,用以描述一组服从正算术均数:简称均数,用以描述一组服从正态分布或近似正态分布

8、资料的平均水平。态分布或近似正态分布资料的平均水平。o 总体均数总体均数 ,样本均数,样本均数o 离均差总和离均差总和o 离均差平方和离均差平方和x几何均数G(geometric mean)o 用于对数正态分布的资料。即原变量值分布用于对数正态分布的资料。即原变量值分布不对称,但经对数转换后,近似或服从正态不对称,但经对数转换后,近似或服从正态分布的资料。分布的资料。o 血清学平均抗体效价血清学平均抗体效价中位数M(median)o 位置指标位置指标o 中位数:一组资料按大小顺序排列后,中间中位数:一组资料按大小顺序排列后,中间位置上的观测值。位置上的观测值。 1 2 3 4 5 6 7 1

9、2 3 4 5 6-median=3.5百分位数(percentile,Px)o 位置指标位置指标o 一组资料从小到大排序后,一组资料从小到大排序后,x%的观测值比的观测值比Px小,(小,(100-x)%的观测值比的观测值比Px大,则这个大,则这个位置点的数值,即为第位置点的数值,即为第x百分位数百分位数Px。o 第第5百分位数百分位数P5:有:有5%的观测值比的观测值比P5小,有小,有95%的观测值比的观测值比P5大。大。o 中位数即第中位数即第50百分位数。百分位数。o 用于偏态分布的资料。用于偏态分布的资料。离散趋势的指标-极差Ro 极差或全距极差或全距range:最大值与最小值之差。:

10、最大值与最小值之差。o 只考虑最大值和最小值,没有考虑所有的变只考虑最大值和最小值,没有考虑所有的变量。量。四分位数间距Qo 第第25百分位数百分位数P25 ,第,第50百分位数百分位数P50,第第75百分位数百分位数P75,将所有的数据分为四份。将所有的数据分为四份。o P75- P25即为四分位数间距。即为四分位数间距。o 考虑了较多的变量信息,但信息利用仍不充考虑了较多的变量信息,但信息利用仍不充分。分。方差varianceo 方差方差:总体方差总体方差 ,样本方差,样本方差S2o 离均差平方和的平均值即为方差。离均差平方和的平均值即为方差。 2221()(1)niixxSn标准差SD/

11、STD(standard deviation)o 方差开方即为标准差方差开方即为标准差o 求方差后,量纲为原量纲的平方。求方差后,量纲为原量纲的平方。o 为使量纲恢复到原量纲,将方差开方,即为为使量纲恢复到原量纲,将方差开方,即为标准差。标准差。o 总体标准差总体标准差 ,样本标准差,样本标准差S变异系数CVo 用于比较不同量纲的变量的变异程度。用于比较不同量纲的变量的变异程度。o 无量纲无量纲100%SCVx小结o 上述指标都是用于计量资料的统计描述上述指标都是用于计量资料的统计描述o 除变异系数外,均有量纲除变异系数外,均有量纲o 变异性指标中,指标值越大,说明数据变异越大变异性指标中,指

12、标值越大,说明数据变异越大o 分布类型不同,适用的描述指标不同。分布类型不同,适用的描述指标不同。o 正态分布常用正态分布常用o 偏态分布常用中位数偏态分布常用中位数M和最小值、最大值或四分和最小值、最大值或四分位数间距。位数间距。 如:年龄中位数为如:年龄中位数为33.5岁,最小年龄岁,最小年龄3岁,最大年岁,最大年龄龄55岁。岁。xs计数资料的统计描述o 绝对数:实际观察所得绝对数:实际观察所得o 相对数:率、构成比、相对比相对数:率、构成比、相对比例题:2005年某市五地区糖尿病患病情况地区编号调查人数患病人数患病率(%)构成比(%)患病率相对比(%)(1)(2)(3)(4)(5)(6)

13、A97776857.0121.52-B114106325.5419.8679.03C121816985.7321.9281.74D103915415.2117.0074.32E105116275.9719.7085.16合计5427031835.87100.00-率(rate)o 说明在一定条件下,某现象发生的说明在一定条件下,某现象发生的频率或强度频率或强度。o K:比例基数,常用百分率(:比例基数,常用百分率(%)、千分率、)、千分率、万分率、十万分率等。万分率、十万分率等。o 使结果中保留使结果中保留1-2位小数;位小数;o 根据习惯用法根据习惯用法K实际发生某现象的观察单位数率可能发生

14、该现象的观察单位总数常用的率o 发病率、患病率、死亡率、病死率等;发病率、患病率、死亡率、病死率等;o 发病率发病率(incidence rate):一定期间内、一定人:一定期间内、一定人群中,某病群中,某病新病例新病例出现的频率。出现的频率。o 描述疾病的发生频率。描述疾病的发生频率。 k一定期间内某人群中某病新病例数发病率同时期可能发生该病的人口总数常用的率o 患病率(患病率(prevalence rate):现患率,某特定):现患率,某特定时间内总人口中,时间内总人口中,现患有某病的人(包括新和现患有某病的人(包括新和旧病例)旧病例)所占的比例。所占的比例。o 常用于表示病程较长的慢性病

15、的发生或流行情常用于表示病程较长的慢性病的发生或流行情况。况。o 与发病率和病程有关。与发病率和病程有关。k某一时点一定人群中现患某病新旧病例数患病率该时点的人口数常用的率o 死亡率(死亡率(mortality rate):一定期间内,):一定期间内,一定人群中,死于某病(或死于所有原因)一定人群中,死于某病(或死于所有原因)的频率。的频率。o 是测量人群死亡危险最常用的指标。是测量人群死亡危险最常用的指标。k某期间内(因某病)死亡总数死亡率同期平均人口数常用的率o 病死率病死率(fatality rate):表示一定时期内(通常:表示一定时期内(通常为为1年),年),患某病的全部病人患某病的

16、全部病人中因中因该病死亡者该病死亡者的比例。的比例。o 用于表示确诊疾病的死亡概率,可表明疾病的用于表示确诊疾病的死亡概率,可表明疾病的严重程度,也可反映医疗水平和诊断能力。多严重程度,也可反映医疗水平和诊断能力。多用于急性传染病,较少用于慢性病。用于急性传染病,较少用于慢性病。k某时期内因某病死亡总数病死率同期患某病的病人数常用的率o在临床实际中,要注意区分上在临床实际中,要注意区分上述四种常用率指标的含义,不述四种常用率指标的含义,不要混淆。要混淆。构成比(proportion)o 说明某一事物的内部各组成部分所占的比重说明某一事物的内部各组成部分所占的比重或分布。或分布。o 常用来表示疾

17、病或死亡发生的分布情况,不常用来表示疾病或死亡发生的分布情况,不能表示其发生频率或严重程度。能表示其发生频率或严重程度。100%事物内部某一组成部分的观察单位数构成比事物内部各组成部分观察单位总数比(ratio)o 又称相对比,表示两个有关的指标之比,可用又称相对比,表示两个有关的指标之比,可用倍数或百分数表示。倍数或百分数表示。o 甲乙两个指标可以是绝对数、相对数等;甲乙两个指标可以是绝对数、相对数等;o 性质可以相同,也可以不同。性质可以相同,也可以不同。o 如果计算时,分子大于分母,结果用倍数表示;如果计算时,分子大于分母,结果用倍数表示;反之,结果用百分数表示。反之,结果用百分数表示。

18、甲指标比乙指标注意事项o 分母不宜过小:分母不宜过小:o 正确区分率与构成比的意义:正确区分率与构成比的意义:o 正确计算总率:即合计率或平均率。应将各正确计算总率:即合计率或平均率。应将各组实际发生某现象的观察单位数之和,除以组实际发生某现象的观察单位数之和,除以各组可能发生该现象的观察单位数之和,再各组可能发生该现象的观察单位数之和,再乘以比例基数乘以比例基数K。注意事项o 比较相对数指标时,注意资料的可比性:比较相对数指标时,注意资料的可比性:n随机化:随机抽样原则;随机化:随机抽样原则;n观察对象同质、研究方法相同、观察时间相等观察对象同质、研究方法相同、观察时间相等以及其他影响因素相

19、同或接近;以及其他影响因素相同或接近;1. 观察对象的内部构成是否相同:即与比较指标观察对象的内部构成是否相同:即与比较指标有关的影响因素在比较组间是否均衡。内部构有关的影响因素在比较组间是否均衡。内部构成不同时,需分层分析或进行标化。成不同时,需分层分析或进行标化。注意事项o 样本率(或构成比)的比较,要做假设检验:样本率(或构成比)的比较,要做假设检验:样本率或构成比存在抽样误差,相互比较时样本率或构成比存在抽样误差,相互比较时需要进行假设检验。需要进行假设检验。正态分布o 一种一种连续型随机变量连续型随机变量常见而重要的分布。常见而重要的分布。o 高斯分布:最初由德国数学家和天文学家德高

20、斯分布:最初由德国数学家和天文学家德.莫阿弗尔于莫阿弗尔于1733年提出。但高斯将其迅速应年提出。但高斯将其迅速应用到天文学中,并对其性质进行了进一步的用到天文学中,并对其性质进行了进一步的研究,因此又称为高斯分布。研究,因此又称为高斯分布。正态分布o 是自然界中最常见、最重要的一种连续型分是自然界中最常见、最重要的一种连续型分布,是许多统计分析方法的基础。布,是许多统计分析方法的基础。o 医学中很多数据都近似服从正态分布。医学中很多数据都近似服从正态分布。频数分布当样本量无限增大以及横 轴上的组距无限减小时,直方图外缘就变成一条光 滑的曲线,这条概率密度曲线所描述的分布就近似于正态分布。正态

21、分布o 是两个常数,分别为圆周率(是两个常数,分别为圆周率(3.14159)和自然对数的底(近似于和自然对数的底(近似于2.71828)o 是正态分布的两个参数,其中是正态分布的两个参数,其中 为为x的总的总体均数,体均数, 是是x的总体方差。的总体方差。o 和和 可以完全决定一个正态分布的形状,可以完全决定一个正态分布的形状,因此,对于一个正态分布,可记为因此,对于一个正态分布,可记为221()( )exp22xf xe22( ,)xN 正态分布的特征1、单峰分布,、单峰分布,以以x= 为中心,左右完全对称,为中心,左右完全对称,正态曲线以正态曲线以x轴为渐近线,两端与轴为渐近线,两端与x轴

22、永不相轴永不相交。交。2、在、在x= 处有最大值,即此时曲线最高。处有最大值,即此时曲线最高。3、有两个参数:、有两个参数:位置参数位置参数 ,决定正态曲线在,决定正态曲线在x轴上的位置;形状参数轴上的位置;形状参数 ,决定正态曲线,决定正态曲线的分布形状。的分布形状。正态分布的特征o 在在不变的情况下,函数曲线形状不变,若不变的情况下,函数曲线形状不变,若变大时,曲线位置向右移;若变大时,曲线位置向右移;若变小时,曲变小时,曲线位置向左移。线位置向左移。o 在在不变的情况下,函数曲线位置不变,若不变的情况下,函数曲线位置不变,若变大时,曲线形状变的越来越变大时,曲线形状变的越来越“胖胖”和和

23、“矮矮”;若;若变小时,曲线形状变的越来越变小时,曲线形状变的越来越“瘦瘦”和和“高高”。 正态分布的特征 0 f(x) max 1 2 N(1 ,2)、N(2 ,2) =0.5 0 f(x) =1 =2 N(,0.52)、N(,12)、N(,22) 正态分布的特征正态分布的特征4、曲线下的总面积为、曲线下的总面积为1或或100%。所有正态曲。所有正态曲线,在线,在 左右的任意个标准差范围内面积相左右的任意个标准差范围内面积相同同曲线下面积2121( )2xxF xedx1221()()()P xxxF xF x正态分布曲线下的面积68.27%1.64590.00%1.9695.00%2.58

24、99.00%正态分布的应用o 许多医学现象服从正态分布或近似正态分布,许多医学现象服从正态分布或近似正态分布,可制定医学参考值范围;可制定医学参考值范围;o 偏态分布的资料可转换为正态分布或近似正偏态分布的资料可转换为正态分布或近似正态分布,然后按照正态分布的规律进行处理;态分布,然后按照正态分布的规律进行处理;o 正态分布是许多统计分析方法的理论基础;正态分布是许多统计分析方法的理论基础;标准正态分布o 对于任意一个正态分布,均可转换为均数为对于任意一个正态分布,均可转换为均数为0,标准差为,标准差为1的标准正态分布。的标准正态分布。o 标准化变换:标准化变换:o u变换或变换或Z变换变换o

25、 u或或Z叫标准化离差,实际就是用标准差叫标准化离差,实际就是用标准差 作单位来度量离均差的大小。作单位来度量离均差的大小。xu标准正态分布22()21( )2xf xe221( )2uue标准正态分布(0,1)uN标准正态分布o 纵坐标从纵坐标从移到移到u所对应区域的面积为上图红所对应区域的面积为上图红色区域面积的大小,这样一个区域的面积我们色区域面积的大小,这样一个区域的面积我们用用(u)表示,可通过查标准正态分布曲线面积表示,可通过查标准正态分布曲线面积分布表得到分布表得到(u)的大小。的大小。o u值查表所对应的面积是区间值查表所对应的面积是区间(-,u)所对应的所对应的面积,即面积,

26、即(u)。o 若若u=-1.96,那么,那么(-1.96)则表示从则表示从移到移到1.96所对应区域的面积,通过查标准正态分布所对应区域的面积,通过查标准正态分布曲线面积分布表得到曲线面积分布表得到(-1.96)=0.025标准正态分布曲线下的面积68.27%1.64590.00%1.9695.00%2.5899.00%168.27%1.64590.00%1.9695.00%2.5899.00%医学参考值范围的确定o 正常值范围:按一定概率所确定的数据波动正常值范围:按一定概率所确定的数据波动范围。范围。o 计算方法:正态分布法、百分位数法计算方法:正态分布法、百分位数法医学参考值范围的确定o

27、 选择足够数量的正常人作为参照样本选择足够数量的正常人作为参照样本o 对选定的参照样本进行准确地测定对选定的参照样本进行准确地测定o 单双侧范围的确定单双侧范围的确定o 选择适当的百分范围选择适当的百分范围正态分布法o 正态性检验正态性检验o 计算均数、标准差计算均数、标准差o 计算参考值范围计算参考值范围o 双侧:双侧: 单侧:单侧: 或或 o 90%、95%、99%参考值范围参考值范围 o 95%参考值范围:参考值范围: o 单双侧的确定,要依据专业知识单双侧的确定,要依据专业知识2xusxu sxu s1.96xs制定医学参考值范围的注意事项制定医学参考值范围的注意事项o 研究对象:研究

28、对象: “正常人正常人” 同同 质质 足够例数足够例数-有代表性有代表性o 控制误差:系统误差控制误差:系统误差 随机误差随机误差o 单双侧界值:专业知识单双侧界值:专业知识o 适当的百分界值:假阳性(误诊)、假阴性适当的百分界值:假阳性(误诊)、假阴性(漏诊)(漏诊)医学参考值范围的含义医学参考值范围的含义o 95%的参考值范围:的参考值范围:95%的变量值的波动范的变量值的波动范围;围;95%的变量值在这个范围内的变量值在这个范围内o 不可理解为:在参考值范围内的均为健康人,不可理解为:在参考值范围内的均为健康人,在参考值范围外的均不健康。在参考值范围外的均不健康。 统计推断统计推断基本概

29、念o 总体:根据研究目的确定的同质个体构成总体:根据研究目的确定的同质个体构成 总体。总体。o 样本:从总体中随机抽取的部分个体,构样本:从总体中随机抽取的部分个体,构 成样本。成样本。o 抽样研究:从总体中随机抽取部分观察对象抽样研究:从总体中随机抽取部分观察对象进行研究,进行研究,通过样本信息来推断总体特征通过样本信息来推断总体特征的的研究方法。研究方法。抽样误差o 由于抽样所导致的误差。由于抽样所导致的误差。某地区7岁男童的身高110cm样本1100例105cm样本2100例100cm样本3100例120cm由于随机抽样而引由于随机抽样而引起的来自同一总体起的来自同一总体的样本均数之间以

30、的样本均数之间以及样本均数与相应及样本均数与相应的总体均数之间的的总体均数之间的差异,称之为均数差异,称之为均数的的抽样误差抽样误差。标准误o 标准差标准差 :反映个体差异,反映变量值的变异:反映个体差异,反映变量值的变异程度。程度。o 标准误标准误 :样本均数的标准差,用以反映抽样:样本均数的标准差,用以反映抽样误差的大小。误差的大小。o 与总体标准差成正比,与样本含量的平方根成与总体标准差成正比,与样本含量的平方根成反比。反比。o 一定时,一定时,n越大,标准误就越小,越大,标准误就越小, n越小,标越小,标准误就越大。准误就越大。o 影响抽样误差的主要因素是样本含量。影响抽样误差的主要因

31、素是样本含量。x/xn标准误o 作为总体参数,通常是未知的,在实际工作为总体参数,通常是未知的,在实际工作中常用样本标准差作中常用样本标准差S来估计。所以:来估计。所以: 作为作为标准误的估计值标准误的估计值。 /xSsn中心极限定理o 样本均数的抽样分布特点:样本均数的抽样分布特点:o从正态总体从正态总体 中随机抽取例数为中随机抽取例数为n的样本,的样本,其样本均数的分布服从正态分布其样本均数的分布服从正态分布 ;1. 从非正态总体中抽样,当从非正态总体中抽样,当n足够大时,样本均足够大时,样本均数的抽样分布近似服从正态分布数的抽样分布近似服从正态分布2( ,)N 2( ,)Nn2( ,)N

32、n标准误的应用o 反映样本统计量变异程度的指标,常用来反反映样本统计量变异程度的指标,常用来反映抽样误差的大小。映抽样误差的大小。o 用于计算总体均数的可信区间。用于计算总体均数的可信区间。o 进行假设检验所必需的重要统计量。进行假设检验所必需的重要统计量。t分布o 正态分布通过标准化转换可转换为标准正态分正态分布通过标准化转换可转换为标准正态分布。布。o 中心极限定理:样本均数的分布服从正态分布。中心极限定理:样本均数的分布服从正态分布。o u转换:转换: xu2( ,)xxN xxut分布o 在实际工作中,在实际工作中, 是未知的,用是未知的,用 来代替。因此,来代替。因此,o 标准误估计

33、值代替了理论标准误,因此,此时标准误估计值代替了理论标准误,因此,此时转化后的分布不再符合标准正态分布,而服从转化后的分布不再符合标准正态分布,而服从t分布。分布。o 自由度自由度o t分布与自由度有关。不同的自由度对应不同的分布与自由度有关。不同的自由度对应不同的t分布曲线。分布曲线。xxS/xxxtSSn1n1nt分布的特征o 以以0为中心,左右对称的为中心,左右对称的单峰分布。单峰分布。o t分布曲线是一簇曲线,分布曲线是一簇曲线,其形态变化与自由度的大其形态变化与自由度的大小有关。自由度越小,小有关。自由度越小,t值越分散,曲线越低平;值越分散,曲线越低平;自由度逐渐增大时,则自由度逐

34、渐增大时,则t分布逐渐逼近正态分布分布逐渐逼近正态分布(标准正态分布)。当(标准正态分布)。当 o 时时,t分布即为分布即为u分布。分布。o t分布曲线的峰值较低,分布曲线的峰值较低,而尾部曲线较高,说明远而尾部曲线较高,说明远侧侧t值的个数较多,自由值的个数较多,自由度越小,这种情况越明显。度越小,这种情况越明显。 t分布的特征o t分布曲线下面积的分布规律分布曲线下面积的分布规律 由于由于t分布曲线是一组曲线,故分布曲线是一组曲线,故t分布曲线下面分布曲线下面积为积为95%和和99%界值不是一个常量,随着自界值不是一个常量,随着自由度的变化,由度的变化,95%或或99%面积的界值发生变面积

35、的界值发生变化,当化,当 时,时,95%和和99%面积对应的界值面积对应的界值趋近于趋近于u值。值。 总体均数的估计o 参数估计:点估计、区间估计参数估计:点估计、区间估计o 点估计:样本统计量直接作为总体参数估计点估计:样本统计量直接作为总体参数估计值值o 区间估计:可信区间或置信区间区间估计:可信区间或置信区间CI。用已知。用已知的样本统计量和标准误确定一个有概率意义的样本统计量和标准误确定一个有概率意义的区间,该区间有较大可信度包含总体参数。的区间,该区间有较大可信度包含总体参数。o 可信度:可信度:1- 。95%、99%可信区间的含义o 如果能进行重复抽样试验,平均有如果能进行重复抽样

36、试验,平均有1- 的可信的可信区间包含了总体参数。区间包含了总体参数。o 有有1- 的可能性包含了总体均数。的可能性包含了总体均数。假设检验的基本思想o 小概率反证法,即先小概率反证法,即先建立一个关于样本所建立一个关于样本所属总体的假设,考察属总体的假设,考察在假设成立条件下随在假设成立条件下随机样本的特征信息是机样本的特征信息是否属小概率事件,若否属小概率事件,若为小概率事件,则怀为小概率事件,则怀疑假设成立有悖于该疑假设成立有悖于该样本所提供特征信息,样本所提供特征信息,因此拒绝假设。因此拒绝假设。A疗效=B疗效A药65%B药80%?假设检验A有效率=B有效率A药65%B药80%抽样误差

37、抽样误差A有效率A药65%B药80%不同总体不同总体B有效率假设检验抽样误差抽样误差不同总体不同总体0=72.1次/分74.3次/分74.3次/分0=72.1次/分=在=0的前提下,计算从这个总体中进行随机抽样,得到目前这样结果的概率有多大,然后与事先确定的检验水准0.05比较,得出结论。假设检验的步骤1o 建立检验假设和确定检验水准:建立检验假设和确定检验水准:o 无效假设无效假设H0: =0,即山区成年男子与一,即山区成年男子与一般成年男子的脉搏总体均数相同,或来自同般成年男子的脉搏总体均数相同,或来自同一总体。一总体。o 备择假设备择假设H1 :有单双侧之分。:有单双侧之分。o 双侧双侧H1 : 0o 单侧单侧H1 : 0或或0 =9.3cm =0.05(单侧检验)(单侧检验)o 计算检验统计量:计算检验统计量:o 9.39759.31.0257/0.3293/ 12x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论