![人群健康研究的统计学方法(预防医学课件)_第1页](http://file4.renrendoc.com/view14/M06/2F/19/wKhkGWer_XCARr26AAEAi1Fy_6U351.jpg)
![人群健康研究的统计学方法(预防医学课件)_第2页](http://file4.renrendoc.com/view14/M06/2F/19/wKhkGWer_XCARr26AAEAi1Fy_6U3512.jpg)
![人群健康研究的统计学方法(预防医学课件)_第3页](http://file4.renrendoc.com/view14/M06/2F/19/wKhkGWer_XCARr26AAEAi1Fy_6U3513.jpg)
![人群健康研究的统计学方法(预防医学课件)_第4页](http://file4.renrendoc.com/view14/M06/2F/19/wKhkGWer_XCARr26AAEAi1Fy_6U3514.jpg)
![人群健康研究的统计学方法(预防医学课件)_第5页](http://file4.renrendoc.com/view14/M06/2F/19/wKhkGWer_XCARr26AAEAi1Fy_6U3515.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学概述统计学(statistics)是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。(一)同质与变异同质(homogeneity)是指被研究指标的影响因素相同变异(variable)是同质基础上的各观察单位(亦称为个体)之间的差异(二)总体与样本总体(population)是指根据研究目的确定的同质观察单位的全体样本(sample)从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合(三)变量与变量值总体(population)是指根据研究目的确定的同质观察单位的全体样本(sample)从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合(四)参数与统计量参数(parameter)是指总体的统计指标。习惯上用希腊字母表示总体参数统计量(statistic)是指样本的统计指标。习惯上用拉丁字母表示统计量(五)误差1.系统误差(systematicerror):测量结果又倾向性。查明原因,可以避免。2.随机测量误差(randomerrorofmeasurement):测量结果没有倾向性。不可避免。3.抽样误差(samplingerror):由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。变异是绝对的,抽样误差不可避免。(六)概率概率(probability)是描述某随机事件发生可能性大小的量值,常用符号P表示。随机事件的概率在0~1之间,即0≤P≤1。小概率事件:P≤0.05或P≤0.01的事件。统计学上,认为小概率事件在一次抽样中几乎不可能发生。(一)数值变量资料数值变量资料(measurementdata)亦称定量资料(quantitativedata)或计量资料(numericalvariabledata)(二)分类变量资料分类变量资料(categoricalvariabledata)又称定性资料(qualitativedata)1.无序分类(unorderedcategories)2.有序分类(orderedcategories)资料类型的划分是根据研究目的确定的,而统计分析方法的选用,则与资料类型密切相关。在资料的分析过程中,根据有关专业理论和实际需要,各类资料间可以互相转化,以满足不同统计分析方法的要求。(一)统计设计:第一步,最关键的环节(二)收集资料:经常性资料和一时性资料(三)整理资料:查漏补缺,系统化、条理化(四)分析资料1.统计描述2.统计推断第二节统计表和统计图(一)统计表的结构和制表要求
1.统计表主要有标题、标目(包括横标目、纵标目)、线条、数字和备注五部分构成。2.编制统计表主要的要求是表的中心内容要突出,一张表表达一个中心问题为宜。统计表的基本框架:
表序
标题
横标目名称
纵标目名称
横标目
数字
合计
(一)统计表的种类1.简单表
简单表:指被研究对象只按单一特征或标志分组的表格。
表10-1某地某年咽舒康治疗急性咽喉炎疗效比较
组别
例数
有效数
有效率(%)
试验组
107
93
86.9
对照组
108
84
77.8
(一)统计表的种类2.复合表
Ø
复合表:指被研究对象按两个(或两个以上)特征分组的表格。如表3-2,将被研究对象按年龄和性别两个特征结合起来分组,故称为组合表。
表10
-
2某地某年不同年龄、性别的儿童青少年意外损伤情况
男
女
年龄(岁)
调查人数
损伤人数
损伤率(%)
调查人数
损伤人数
损伤率(%)
3.5~
447
66
14.77
424
29
6.84
6.5~
1215
92
7.57
1239
53
4.28
9.5~
1180
122
10.34
1070
80
7.48
12.5~
1217
150
12.33
1136
66
5.81
15.8~18.5
622
65
10.45
582
20
3.44
合计
4681
495
10.57
4451
248
5.57
(一)统计表的类型与选择1.资料是连续性的,其目的是用线段升降表达事物的动态变化趋势,选择普通线图;2.表示变量分布的频数表资料,其目的是用直方的面积表达各组段的频数或频率分布情况,宜选择直方图;3.资料是相互独立的,其目的是用直条的长短比较数值的大小,选择直条图;(一)统计表的类型与选择4.事物内部各部分的百分构成比资料,其目的是用面积大小表达各部分所占的比重大小,则应选择圆图;5.双变量连续性资料,其目的是用点的密集程度和趋势表达两个变量的相互关系,选择散点图;6.资料是连续性的,其目的是比较两组或多组资料的集中趋势和离散趋势,宜选择箱式图。(二)制图通则1.根据资料性质和分析目的正确选用适当的统计图。2.要有标题,简明扼要地说明统计图资料的时间、地点和主要内容,一般放在图下方。3.绘制有坐标轴的图形时,纵横两轴应有标目并注明单位。一般将两轴的相交点即原点初定为0。纵横轴比例一般以5∶7或7∶5为宜。4.在同一张图内比较不同事物时,须用不同线条或颜色来表示,并附图例加以说明。(三)常用统计图及其绘制方法1.直条图(bargraph)
直条图是以等宽直条(柱)的长短来表示各指标数值的大小。适用于指标为各自独立的分类资料。(三)常用统计图及其绘制方法2.构成图(constituentratiochart)
它是以图形的面积大小表示事物内部各组成部分所占比重或比例。适用于按性质分类、能计算构成比的资料。构成图可分为圆形图和百分条图。图10-3复方猪胆囊治疗单纯型老年气管炎近期疗效比较图10-4复方猪胆囊治疗老年性气管炎近期疗效比较(三)常用统计图及其绘制方法3.线图(linegraph):用线段的升降来表示某事物(某现象)随时间或条件而变化的趋势。适用于连续性资料。线图某市城市和郊县1989-1998年糖尿病死亡率死亡率(1/10万)某市城市和郊县10年间糖尿病死亡情况(1/十万)
1989199019911992199319941995199619971998年度城市死亡率郊县死亡率
4.454.774.655.645.786.867.457.738.9110.592.122.462.893.563.874.124.284.595.326.22表2-13某市1949~1957年15岁以下儿童结核病和白喉死亡率(1/10万)年份
结核病死亡率百喉死亡率194919501951195219531954195519561957150.2148.0141.0130.0110.498.272.668.054.820.116.614.011.810.76.53.92.41.3线图表2-13某市1949~1957年15岁以下儿童结核病和白喉死亡率(1/10万)年份
结核病死亡率百喉死亡率194919501951195219531954195519561957150.2148.0141.0130.0110.498.272.668.054.820.116.614.011.810.76.53.92.41.3半对数线图(三)常用统计图及其绘制方法4.直方图(histogram)直方图又称频数分布图,是以各矩形的面积表示各组段的频数,各矩形面积的总和为总频数,适用于表示连续性资料的频数分布。图10-6某市某年150名3岁女孩身高频数分布
(三)常用统计图及其绘制方法
5.散点图(scatterdiagram)散点图是用点的密集程度和变化趋势来表示两种现象间的相关关系。适用于双变量资料,均具有连续性变化的特征。
图10-715名8岁男孩身高与坐高散点图(三)常用统计图及其绘制方法6.箱式图(boxplot)用于比较两组或多组资料的集中趋势和离散趋势,箱式图的中间横线表示中位数,箱子的长度表示四分位数间距,两端分别是P75和P25,箱式图最外面两端连线表示最大值和最小值。
图10-8抑肿瘤药不同剂量与对照组用药后小白鼠肿瘤重量的比较第三节数值变量资料的统计分析1.频数表的编制编制频数表步骤流程图(一)频数分布2.频数分布表的用途(1)揭示数值变量频数分布的类型和特征(2)作为陈述资料的形式(3)便于发现一些特大或特小的可疑值(4)便于进一步的统计分析3.数值变量资料频数分布的类型和特征401.算术均数(mean)样本均数:总体均数:(1)应用:对称分布资料,尤其是正态分布资料。(2)计算直接法加权法(二)集中趋势指标412.几何均数(geometricmean):(1)应用:等比数列资料;对数正态分布资料(2)
计算:直接法加权法423.中位数(median)(1)概念:将一组观察值从小到大按顺序排列,位次具中的观察值就是中位数。(2)应用:偏态分布;分布一端或两端无确定数据;资料的分布情况不清楚。(3)计算:直接法
频数表法离散趋势即个体值之间的变异程度,数据越分散,变异程度越高。极差四分位数间距方差标准差变异系数(三)离散趋势指标441.全距(R)全距也称极差,是一组观察值中最大值与最小值之差。反映个体变异的范围。全距大,说明离散程度大;反之,说明离散程度小。缺点:(1)除了最大值和最小值外,不能反映组内其他数据的离散程度。(2)样本含量悬殊时不宜比较其全距。(3)即使样本含量不变,全距的抽样误差亦较大,即不够稳定。452.四分位数间距(Q)上四分位数(P75)与下四分位数(P25)之差Q=P75-
P25四分位数间距可看成中间一半变量值的全距。它与全距类似,数值越大,说明变异程度越大;反之,说明变异度越小。用四分位数间距作为说明个体差异的指标,比全距稳定,但仍然未考虑到每个观察值的离散程度。应用:与中位数结合用于说明偏态分布资料的特征。463.方差全面地考虑每个变量值的离散程度。离均差:总和为零离均差平方和:除了与变异度有关外,还与变量值的个数有关。取其均数,即为方差。474.标准差(standarddeviation)总体方差开平方,就是总体标准差。标准差越大,说明个体的变异就越大,则平均数的代表性就越差。计算:直接法:加权法:48标准差的应用(1)用于描述正态分布数值变量资料的离散程度。(2)结合均数描述正态分布的特征,估计参考值范围。(3)用于计算变异系数。(4)用于计算标准误。495.变异系数(coefficientofvariation)即标准差与均数之比用百分数表示。变异系数是相对数,没有单位。变异系数愈小,说明一组变量值的变异程度愈小;反之,变异系数愈大,说明变异程度大。应用:(1)
比较度量衡单位不同的多组资料的变异度。(2)
比较均数相差较大的几组资料的变异度。变异指标小结501.极差较粗,适合于任何分布。2.标准差与均数的单位相同,最常用,适合于近似正态分布。3.变异系数主要用于单位不同或均数相差悬殊资料4.平均指标和变异指标分别反映资料的不同特征,常配套使用如正态分布:均数、标准差;偏态分布:中位数、四分位数间距511.正态分布的特征(1)正态曲线在横轴上方均数处最高。(2)正态分布以均数为中心,左右对称。(3)正态分布有两个参数,即均数和标准差。均数是位置参数,标准差是变异度参数。(4)正态曲线下的面积分布有一定规律。(四)正态分布与医学参考值范围μμ-σμ+σμ-1.96σμ+1.96σμ-2.58σμ+2.58σ68.27%95.00%99.00%医学参考值:大多数正常人某指标的波动范围。“正常人”不是指完全健康的人,而是没有患有影响研究指标疾病或有关因素的同质人群。制订参考值范围的步骤(1)明确研究总体,从“正常人”总体中抽样(2)统一测定方法以控制测量误差。(3)判断是否需要分组(如性别、年龄)确定。(4)根据专业知识决定单侧还是双侧。(5)确定适当的百分范围。(6)根据资料的分布类型选定适当的方法进行范围估计。方法双侧界值单侧上限单侧下限正态分布法百分位数法两种方法计算95%参考值范围(一)均数的抽样误差与标准误概念:样本统计量的标准差叫做标准误。意义:是描述均数抽样误差大小的统计指标。是样本均数的标准差,反映含量相同的样本均数的离散趋势或变异程度。同类性质的资料,均数的标准误越大,说明样本均数的变异程度越大,样本均数围绕总体均数分布越分散,样本均数与总体均数越远离,因此,用样本均数推论总体均数的可靠性越小,抽样误差越大。二、数值变量资料的统计推断抽样误差数值变量资料标准误均数标准误的用途1.可用来衡量样本均数的可靠性,反映抽样误差的大小。标准误越小,说明样本均数间的离散程度越小,用样本均数估计总体均数越可靠,反之亦然。2.可用来估计总体均数的可信区间。3.可用于均数的假设检验。(二)t分布t分布特征:1.单峰分布,以0为中心左右对称。2.
t分布是一簇曲线,其形状受自由度ν的影响。t界值
统计学家已将各种自由度对应的t分布曲线下的尾部面积(概率)的百分界值编制成t界值表。由于t分布是以0为中心的对称分布,故表中只列出正值,所以查表时,不管t值正负只用绝对值。表右上角插图中阴影部分,表示tα/2,ν以外尾部面积占总面积的百分数,即概率P。随着自由度的增大,t界值逐渐减小,当自由度无穷大时,双侧t0.05=1.96,单侧t0.05,=1.645,即为u分布的界值。(三)总体均数的估计点估计数值变量资料:→区间估计参数估计的方法(数值变量资料)总体均数95%可信区间σ已知σ未知,且样本量较小σ未知,且样本量较大(四)假设检验的意义和基本步骤基本步骤1.建立假设:注意单侧还是双侧2.确定检验水准3.选定检验方法,计算统计量4.确定概率P值,作出推断结论对资料性质的要求(数值变量资料)各样本是相互独立的随机样本各样本都来自正态分布的总体各个总体方差齐1.样本均数与总体均数比较(1)小样本均数与总体均数比较(2)大样本均数与总体均数比较(3)已知总体标准差时2.配对数值变量资料的比较(1)两小样本均数的比较(2)两大样本均数的比较68假设检验应注意的问题1.资料必须合乎随机化抽样的原则2.选用的假设检验方法应符合其应用条件3.实际差别大小与统计意义的区别4.判断不能绝对化5.单双侧检验的选择69假设检验中的两类错误Ⅰ型错误(第Ⅰ类错误):拒绝了实际上成立的H0,这类“弃真”的错误称为Ⅰ型错误,其大小用α表示。Ⅱ型错误(第Ⅱ类错误):不拒绝实际上不成立的H0,这类“取伪”的错误称为Ⅱ型错误,其概率大小用β表示。β值的大小在进行假设检验时一般并不知道。第四节分类变量资料的统计分析一、分类变量资料的统计描述(一)常用的相对数指标率构成比相对比
率(rate)称为频率指标或强度指标,它说明某现象发生的频率程度或强度。2、构成比
构成比(constituentratio)称为构成指标,它反映事物内部各组成部分所占整体的比重或分布。3、相对比
相对比(relativeratio)也称比,是A、B两个有关联的指标之比。说明A是B的若干倍或百分之几。(二)应用相对数的注意事项1.计算相对数时分母不宜过小2.资料分析时不能以构成比代替率3.注意资料的可比性4.正确计算平均率5.样本率或构成比的比较应做假设检验二、分类变量资料的统计推断(一)率的抽样误差和标准误率的抽样误差与标准误(理论值)(估计值)1.正态近似法:当样本含量n足够大,样本率P或1-P均不太小时,样本率的分布近似正态分布。总体率95%的可信区间:2.查表法:当n较小,如〈50,特别是P接近于0或1时,按二项分布原理估计总体率的可信区间。(三)卡方检验基本思想:检验实际频数和理论频数的吻合程度。T≥5,且n≥40:直接使用基本公式或专用公式1≤T<5,且n≥40:用连续性校正检验T<1或n<40:用精确概率法1.四格表资料的卡方检验基本公式处理有效无效1ab2cd
甲法乙法+-+ab-cd2.配对四格表资料的卡方检验要求:不能有1/5以上的格子理论频数小于5,或者不能有任意一个格子的理论频数小于1。3.行列表资料的卡方检验统计表和统计图(一)统计表的结构和制表要求
1.统计表主要有标题、标目(包括横标目、纵标目)、线条、数字和备注五部分构成。2.编制统计表主要的要求是表的中心内容要突出,一张表表达一个中心问题为宜。统计表的基本框架:
表序
标题
横标目名称
纵标目名称
横标目
数字
合计
(一)统计表的种类1.简单表
简单表:指被研究对象只按单一特征或标志分组的表格。
表10-1某地某年咽舒康治疗急性咽喉炎疗效比较
组别
例数
有效数
有效率(%)
试验组
107
93
86.9
对照组
108
84
77.8
(一)统计表的种类2.复合表
Ø
复合表:指被研究对象按两个(或两个以上)特征分组的表格。如表3-2,将被研究对象按年龄和性别两个特征结合起来分组,故称为组合表。
表10
-
2某地某年不同年龄、性别的儿童青少年意外损伤情况
男
女
年龄(岁)
调查人数
损伤人数
损伤率(%)
调查人数
损伤人数
损伤率(%)
3.5~
447
66
14.77
424
29
6.84
6.5~
1215
92
7.57
1239
53
4.28
9.5~
1180
122
10.34
1070
80
7.48
12.5~
1217
150
12.33
1136
66
5.81
15.8~18.5
622
65
10.45
582
20
3.44
合计
4681
495
10.57
4451
248
5.57
(一)统计表的类型与选择1.资料是连续性的,其目的是用线段升降表达事物的动态变化趋势,选择普通线图;2.表示变量分布的频数表资料,其目的是用直方的面积表达各组段的频数或频率分布情况,宜选择直方图;3.资料是相互独立的,其目的是用直条的长短比较数值的大小,选择直条图;(一)统计表的类型与选择4.事物内部各部分的百分构成比资料,其目的是用面积大小表达各部分所占的比重大小,则应选择圆图;5.双变量连续性资料,其目的是用点的密集程度和趋势表达两个变量的相互关系,选择散点图;6.资料是连续性的,其目的是比较两组或多组资料的集中趋势和离散趋势,宜选择箱式图。(二)制图通则1.根据资料性质和分析目的正确选用适当的统计图。2.要有标题,简明扼要地说明统计图资料的时间、地点和主要内容,一般放在图下方。3.绘制有坐标轴的图形时,纵横两轴应有标目并注明单位。一般将两轴的相交点即原点初定为0。纵横轴比例一般以5∶7或7∶5为宜。4.在同一张图内比较不同事物时,须用不同线条或颜色来表示,并附图例加以说明。(三)常用统计图及其绘制方法1.直条图(bargraph)
直条图是以等宽直条(柱)的长短来表示各指标数值的大小。适用于指标为各自独立的分类资料。(三)常用统计图及其绘制方法2.构成图(constituentratiochart)
它是以图形的面积大小表示事物内部各组成部分所占比重或比例。适用于按性质分类、能计算构成比的资料。构成图可分为圆形图和百分条图。图10-3复方猪胆囊治疗单纯型老年气管炎近期疗效比较图10-4复方猪胆囊治疗老年性气管炎近期疗效比较(三)常用统计图及其绘制方法3.线图(linegraph):用线段的升降来表示某事物(某现象)随时间或条件而变化的趋势。适用于连续性资料。线图某市城市和郊县1989-1998年糖尿病死亡率死亡率(1/10万)某市城市和郊县10年间糖尿病死亡情况(1/十万)
1989199019911992199319941995199619971998年度城市死亡率郊县死亡率
4.454.774.655.645.786.867.457.738.9110.592.122.462.893.563.874.124.284.595.326.22表2-13某市1949~1957年15岁以下儿童结核病和白喉死亡率(1/10万)年份
结核病死亡率百喉死亡率194919501951195219531954195519561957150.2148.0141.0130.0110.498.272.668.054.820.116.614.011.810.76.53.92.41.3线图表2-13某市1949~1957年15岁以下儿童结核病和白喉死亡率(1/10万)年份
结核病死亡率百喉死亡率194919501951195219531954195519561957150.2148.0141.0130.0110.498.272.668.054.820.116.614.011.810.76.53.92.41.3半对数线图(三)常用统计图及其绘制方法4.直方图(histogram)直方图又称频数分布图,是以各矩形的面积表示各组段的频数,各矩形面积的总和为总频数,适用于表示连续性资料的频数分布。图10-6某市某年150名3岁女孩身高频数分布
(三)常用统计图及其绘制方法
5.散点图(scatterdiagram)散点图是用点的密集程度和变化趋势来表示两种现象间的相关关系。适用于双变量资料,均具有连续性变化的特征。
图10-715名8岁男孩身高与坐高散点图(三)常用统计图及其绘制方法6.箱式图(boxplot)用于比较两组或多组资料的集中趋势和离散趋势,箱式图的中间横线表示中位数,箱子的长度表示四分位数间距,两端分别是P75和P25,箱式图最外面两端连线表示最大值和最小值。数值变量资料的统计分析1.频数表的编制编制频数表步骤流程图(一)频数分布2.频数分布表的用途(1)揭示数值变量频数分布的类型和特征(2)作为陈述资料的形式(3)便于发现一些特大或特小的可疑值(4)便于进一步的统计分析3.数值变量资料频数分布的类型和特征1131.算术均数(mean)样本均数:总体均数:(1)应用:对称分布资料,尤其是正态分布资料。(2)计算直接法加权法(二)集中趋势指标1142.几何均数(geometricmean):(1)应用:等比数列资料;对数正态分布资料(2)
计算:直接法加权法1153.中位数(median)(1)概念:将一组观察值从小到大按顺序排列,位次具中的观察值就是中位数。(2)应用:偏态分布;分布一端或两端无确定数据;资料的分布情况不清楚。(3)计算:直接法
频数表法离散趋势即个体值之间的变异程度,数据越分散,变异程度越高。极差四分位数间距方差标准差变异系数(三)离散趋势指标1171.全距(R)全距也称极差,是一组观察值中最大值与最小值之差。反映个体变异的范围。全距大,说明离散程度大;反之,说明离散程度小。缺点:(1)除了最大值和最小值外,不能反映组内其他数据的离散程度。(2)样本含量悬殊时不宜比较其全距。(3)即使样本含量不变,全距的抽样误差亦较大,即不够稳定。1182.四分位数间距(Q)上四分位数(P75)与下四分位数(P25)之差Q=P75-
P25四分位数间距可看成中间一半变量值的全距。它与全距类似,数值越大,说明变异程度越大;反之,说明变异度越小。用四分位数间距作为说明个体差异的指标,比全距稳定,但仍然未考虑到每个观察值的离散程度。应用:与中位数结合用于说明偏态分布资料的特征。1193.方差全面地考虑每个变量值的离散程度。离均差:总和为零离均差平方和:除了与变异度有关外,还与变量值的个数有关。取其均数,即为方差。1204.标准差(standarddeviation)总体方差开平方,就是总体标准差。标准差越大,说明个体的变异就越大,则平均数的代表性就越差。计算:直接法:加权法:121标准差的应用(1)用于描述正态分布数值变量资料的离散程度。(2)结合均数描述正态分布的特征,估计参考值范围。(3)用于计算变异系数。(4)用于计算标准误。1225.变异系数(coefficientofvariation)即标准差与均数之比用百分数表示。变异系数是相对数,没有单位。变异系数愈小,说明一组变量值的变异程度愈小;反之,变异系数愈大,说明变异程度大。应用:(1)
比较度量衡单位不同的多组资料的变异度。(2)
比较均数相差较大的几组资料的变异度。变异指标小结1231.极差较粗,适合于任何分布。2.标准差与均数的单位相同,最常用,适合于近似正态分布。3.变异系数主要用于单位不同或均数相差悬殊资料4.平均指标和变异指标分别反映资料的不同特征,常配套使用如正态分布:均数、标准差;偏态分布:中位数、四分位数间距1241.正态分布的特征(1)正态曲线在横轴上方均数处最高。(2)正态分布以均数为中心,左右对称。(3)正态分布有两个参数,即均数和标准差。均数是位置参数,标准差是变异度参数。(4)正态曲线下的面积分布有一定规律。(四)正态分布与医学参考值范围μμ-σμ+σμ-1.96σμ+1.96σμ-2.58σμ+2.58σ68.27%95.00%99.00%医学参考值:大多数正常人某指标的波动范围。“正常人”不是指完全健康的人,而是没有患有影响研究指标疾病或有关因素的同质人群。制订参考值范围的步骤(1)明确研究总体,从“正常人”总体中抽样(2)统一测定方法以控制测量误差。(3)判断是否需要分组(如性别、年龄)确定。(4)根据专业知识决定单侧还是双侧。(5)确定适当的百分范围。(6)根据资料的分布类型选定适当的方法进行范围估计。方法双侧界值单侧上限单侧下限正态分布法百分位数法两种方法计算95%参考值范围(一)均数的抽样误差与标准误概念:样本统计量的标准差叫做标准误。意义:是描述均数抽样误差大小的统计指标。是样本均数的标准差,反映含量相同的样本均数的离散趋势或变异程度。同类性质的资料,均数的标准误越大,说明样本均数的变异程度越大,样本均数围绕总体均数分布越分散,样本均数与总体均数越远离,因此,用样本均数推论总体均数的可靠性越小,抽样误差越大。二、数值变量资料的统计推断抽样误差数值变量资料标准误均数标准误的用途1.可用来衡量样本均数的可靠性,反映抽样误差的大小。标准误越小,说明样本均数间的离散程度越小,用样本均数估计总体均数越可靠,反之亦然。2.可用来估计总体均数的可信区间。3.可用于均数的假设检验。(二)t
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 社团更名申请书
- 撤诉申请书范文
- 残疾人家庭申请书
- 2025年度快递行业无人机配送服务合同范本
- 2025年度新能源汽车产业债转股合作项目协议书正本
- 加入医院工会申请书
- 现代企业如何通过优化移office设备来提高工作效率和维护成本分析
- 电子竞技行业的市场细分与消费者行为研究
- 2025年度智能电网分布式能源合同
- 四年级教学计划集锦(33篇)
- 2025年电力铁塔市场分析现状
- GB 12158-2024防止静电事故通用要求
- 《教育强国建设规划纲要(2024-2035年)》全文
- 山东省滨州市2024-2025学年高二上学期期末地理试题( 含答案)
- 体育老师篮球说课
- 化学-江苏省苏州市2024-2025学年2025届高三第一学期学业期末质量阳光指标调研卷试题和答案
- 蛋鸡生产饲养养殖培训课件
- 运用PDCA降低住院患者跌倒-坠床发生率
- 海底捞员工手册
- 2024CSCO小细胞肺癌诊疗指南解读
- 立春气象与生活影响模板
评论
0/150
提交评论