




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十章数值变量资料的统计描述公共卫生学院大理学院2011级护理学本科教学2024/11/11第10章-数值变量资料的统计描述第一节数值变量资料的统计描述
数值变量资料进行统计描述需要根据资料的分布类型选择合适的统计指标,因此首先要通过频数分布表或分布图了解资料的分布特征。一、频数分布表及其制作
2024/11/12第10章-数值变量资料的统计描述例10.1某地区2002年55~58岁健康成人的空腹血糖(mmol/L)测定值如下,试编制频数表和观察频数分布情况。5.175.564.864.874.745.245.514.464.964.824.905.305.225.584.484.804.64.025.165.364.344.244.644.274.254.444.464.624.874.344.905.254.774.855.074.164.664.704.203.954.094.644.335.214.614.985.244.604.254.785.003.604.114.614.084.784.264.444.384.44.794.764.924.604.785.034.354.184.684.654.574.274.994.214.894.714.724.414.384.064.794.964.834.454.514.274.504.315.055.595.085.163.744.365.364.645.094.574.464.564.395.244.614.214.964.344.454.864.504.904.454.494.424.684.565.384.344.464.164.984.294.834.273.683.853.864.564.564.555.165.155.162024/11/13第10章-数值变量资料的统计描述频数表的编制步骤:(1)求极差(range):即最大值与最小值之差,又称为全距。
R=5.59–3.60=1.99(mol/L)(2)确定组数、组段和组距:根据研究目的和样本含量n确定分组组数。相邻两组段下限值之差称组距,组距=极差/组数,为方便计,组距为极差的十分之一,再略加调整。
1.99/10=0.199≈0.2
(mol/L)(3)列出组段:第一组段的下限必须包含最小值,最后一个组段上限必须大于或等于最大值。3.6~3.8~……5.2~5.4~5.6(4)列表划记:用划记法将所有数据归纳到各组段,得到各组段的频数。2024/11/14第10章-数值变量资料的统计描述表10-1某地区2002年55~58岁健康成人的空腹血糖(mmol/L)测定值的频数分布表血糖(mol/L)组段组中值(xi)频数(f)累计频数(Σf)频率(%)累计频率(%)3.60~3.70332.272.273.80~3.90362.274.554.00~4.108146.0610.614.20~4.30233717.4228.034.40~4.50246118.1846.214.60~4.70258618.9465.154.80~4.902010615.1580.305.00~5.10121189.0989.395.20~5.30101287.5896.97
5.40~5.605.5041323.03100.00合计132100.002024/11/15第10章-数值变量资料的统计描述血糖(mol/L)人数图10-1某地区2002年55~58岁健康成人的空腹血糖(mmol/L)
测定值的频数分布图二、频数分布图2024/11/16第10章-数值变量资料的统计描述三、频数表和频数分布图的应用1.观察有无可疑值2.便于进一步计算指标并进行统计分析3.揭示分布的类型(对称分布、偏态分布)4.揭示分布的特征2024/11/17第10章-数值变量资料的统计描述二.描述集中趋势的指标统计上使用平均数(average)这一指标体系来描述一组变量值的集中趋势或平均水平。常用的平均数有:算术均数(均数)(mean)几何均数(geometricmean)中位数(median)百分位数(percentile)
2024/11/18第10章-数值变量资料的统计描述一、算术均数算术均数:简称均数(mean)定义:是一组变量值之和除以变量值个数所得的商。均数适用于资料呈正态分布(或近似正态或对称分布)资料。总体均数:μ
样本均数:x2024/11/19第10章-数值变量资料的统计描述1、计算方法(1)直接计算法公式:例10.2
有9名健康成人的空腹胆固醇测定值(mol/L)为:5.61,3.96,3.67,4.99,4.24,5.06,5.20,4.79,5.93求算术平均数。x=(5.61+3.96+3.67+4.99+4.24+5.06+5.20+4.79)/9=4.83(mol/L)2024/11/110第10章-数值变量资料的统计描述例10.1某地区2002年55~58岁健康成人的空腹血糖(mmol/L)测定值如下,试编制频数表和观察频数分布情况。5.175.564.864.874.745.245.514.464.964.824.905.305.225.584.484.804.64.025.165.364.344.244.644.274.254.444.464.624.874.344.905.254.774.855.074.164.664.704.23.954.094.644.335.214.614.985.244.604.254.785.003.604.114.614.084.784.264.444.384.44.794.764.924.604.785.034.354.184.684.654.574.274.994.214.894.714.724.414.384.064.794.964.834.454.514.274.504.315.055.595.085.163.744.365.364.645.094.574.464.564.395.244.614.214.964.344.454.864.504.904.454.494.424.684.565.384.344.464.164.984.294.834.273.683.853.864.564.564.555.165.155.16x=(5.17+5.56+……+5.15+5.16)/132=4.648(mol/L)2024/11/111第10章-数值变量资料的统计描述(2)加权法(利用频数表)公式:k:频数表的组段数
f:频数
:组中值,其中i=1,2,……k。2024/11/112第10章-数值变量资料的统计描述表10-1某地区2002年55~58岁健康成人的空腹血糖(mmol/L)测定值的频数分布表血糖(mol/L)组段频数()组中值()
3.60~33.7011.1041.073.80~33.9011.7045.634.00~84.1032.80134.484.20~234.3098.90425.274.40~244.50108.00486.004.60~254.70117.50552.254.80~204.9098.00480.205.00~125.1061.20312.125.20~105.3053.00280.90
5.40~5.6045.5022.00121.00合计132614.202878.92x=614.2/132=4.653(mol/L)2024/11/113第10章-数值变量资料的统计描述二、几何均数(geometricmean)定义:用G表示,是将n个观察值x的乘积再开n次方的方根(或各观察值x对数值均值的反对数)。其适用条件是:①当一组观察值为非对称分布且其差距较大时,用均数表示其平均水平会受少数特大或特小值影响;②数值按大小顺序排列后,各观察值呈倍数关系或近似倍数关系。
2024/11/114第10章-数值变量资料的统计描述几何均数计算公式:几何均数:变量对数值的算术均数的反对数。
计算几何均数的观察值应大于零
2024/11/115第10章-数值变量资料的统计描述例10.3
有7份血清的抗体效价分别为1:2,1:4,1:8,1:16,1:32,1:64,1:128,求平均抗体效价。2024/11/116第10章-数值变量资料的统计描述(2)加权法(当观察例数多时采用)
公式:2024/11/117第10章-数值变量资料的统计描述例10.4有60人的血清抗体效价,分别为:7人1:5,11人1:10,22人1:20,12人1:40,8人1:80,求平均抗体效价。50人的血清平均抗体效价为1:20.705。2024/11/118第10章-数值变量资料的统计描述计算几何均数应该注意的事项变量值中不能有0或负数,因为0和负数不能取对数。不能同时有正有负。若全部是负值,计算时可先把负号去掉,得出结果后,再加上负号。2024/11/119第10章-数值变量资料的统计描述三、
中位数与百分位数(一)中位数(median)
定义:用符号M表示,中位数是把一组观察值,按大小顺序排列,位置居中的数值(n为奇数)或位置居中的两个数值的均值(n为偶数)。其适用情况有:①当资料呈明显的偏态分布;②资料一端或两端无确定数值(如大于或小于某数值);③资料的分布情况不清楚。
2024/11/120第10章-数值变量资料的统计描述计算公式:n为奇数时n为偶数时2024/11/121第10章-数值变量资料的统计描述例10.57名正常人的血压(舒张压)
测定值(mmHg)为:72,75,76,77,81,82,86,求中位数。从小到大排列:72,75,76,77,81,82,86若又观察了一个人的血压,为87(mmHg),此时M=(77+81)/2=79(mmHg)2024/11/122第10章-数值变量资料的统计描述频数表资料的中位数(P157公式8.5)下限值L上限值Ui;fm中位数M2024/11/123第10章-数值变量资料的统计描述例10.1频数表中位数的计算血糖(mol/L)组段组中值()频数(f)累计频数(Σf)频率(%)累计频率(%)3.60~3.70332.272.273.80~3.90362.274.554.00~4.108146.0610.614.20~4.30233717.4228.034.40~4.50246118.1846.214.60~4.70258618.9465.154.80~4.902010615.1580.305.00~5.10121189.0989.395.20~5.30101287.5896.97
5.40~5.605.5041323.03100.00合计132(Σfi)100.004.60+(0.20/25)*[132/2-61]=4.642024/11/124第10章-数值变量资料的统计描述
百分位数示意图(二)百分位数(percentile)把一组数据从小到大排列,分成100等份,各等份含1%的观察值,分割界限上的数值就是百分位数。中位数是第50百分位数,用P50表示。2024/11/125第10章-数值变量资料的统计描述Trunc()取整函数
设有X个原始数据从小到大排列,第X百分位数的计算公式为:1.直接计算法当为带有小数位时:当为整数时:2024/11/126第10章-数值变量资料的统计描述例对某医院细菌性痢疾治愈者的住院天数统计,120名患者的住院天数从小到大排列如下,试求第5百分位数和第99百分位数。,为整数:患者编号:住院天数:(1)n=120,2024/11/127第10章-数值变量资料的统计描述带有小数
(2)故取整trunc(118.8)=1182024/11/128第10章-数值变量资料的统计描述2.频数表法
公式:
2024/11/129第10章-数值变量资料的统计描述当时,公式(8.5)即为中位数的计算公式:2024/11/130第10章-数值变量资料的统计描述
例10.1试分别求例10.1频数表的第25、第75百分位数。P25=4.20+0.20x[(132x25%-14)/23]=4.365P75=4.80+0.20x[(132x75%-86)/20]=4.930血糖(mol/L)组段组中值(xi)频数(f)累计频数(Σf)频率(%)累计频率(%)3.60~3.70332.272.273.80~3.90362.274.554.00~4.108146.0610.614.20~4.30233717.4228.034.40~4.50246118.1846.214.60~4.70258618.9465.154.80~4.902010615.1580.305.00~5.10121189.0989.395.20~5.30101287.5896.97
5.40~5.605.5041323.03100.00合计132(Σfi)100.002024/11/131第10章-数值变量资料的统计描述三种平均数的特点算术均数:通常被认为是最佳集中趋势的度量值。如果资料观察值含有少数极端数值(相对的说特大或特小值)或资料呈偏态分布,算术均数就变得不稳定而失去代表性。
正态分布几何均数一般只适宜于等比级数资料。对于这类资料,用几何均数反映集中趋势比算术均数或中位数更合适。中位数不受其前后其他数值(特别是极端值)的影响。但如果数据呈明显不同且差异很大,这时中位数可能不适宜作为集中趋势的度量值了。
偏态分布2024/11/132第10章-数值变量资料的统计描述反映集中趋势的指标(平均数),表示一组观察值的平均水及集中特性,并可作为总体的一个代表值加以应用。但是它没有表达其所代表的总体中各个个体之间的差异。统计学中把个体间的差异称为变异性(variation)。所谓变异性是指在同质条件下的观察单位,其同一标志的数据间的差异性。用以描述一组数值变量资料观察值之间参差不齐的程度,即离散程度或变异度的指标,称为离散指标或变异指标。三描述离散趋势的描述2024/11/133第10章-数值变量资料的统计描述盘编号甲乙丙15605205102540510505350050050044604904955440480490合计250025002500均数500500500例10.6:设甲、乙、丙三人,采每人的耳垂血,然后作红细胞计数,每人数5个计数盘,得结果如下(万/mm3)甲乙丙2024/11/134第10章-数值变量资料的统计描述常用统计指标:全距(range)四分位数间距(quartileinterval)方差和标准差(variance&standarddeviation)变异系数(CVcoefficientofvariation)2024/11/135第10章-数值变量资料的统计描述全距,用R表示:即一组变量值最大值与最小值之差,亦称极差。对于书中例8.1数据,有简单,但仅利用了两端点值,稳定性差。一、全距(Range)R=5.59–3.60=1.99(mol/L)R越大,变异度越大;R越小,变异度越小。2024/11/136第10章-数值变量资料的统计描述二、四分位数间距(quartilerange)
四分位数间距,用Q表示,若将一组资料分为四等份,上四分位数和下四分位数之差就是Q:
Q=下四分位数:上四分位数:比全距稳定;可用于一端或两端无确切数值的偏态资料。未考虑每一个观察值。2024/11/137第10章-数值变量资料的统计描述全距和四分位数间距都未全面考虑观察值的变异情况,为了克服该缺点,需计算总体中每个观察值x与总体均数
的差值(x-
),称为离均差。由于∑(x-
)=0,不能反映变异的大小,而用离均差平方和∑(x-
)2(sumofdeviationfrommean)反映。同时还要考虑到观察值个数N的影响,用其均数,即得到总体的方差,用
2表示。公式为:三、方差与标准差2024/11/138第10章-数值变量资料的统计描述
1.
方差(variance)是离均差平方和的均数,反映一组数据的平均离散水平。由于在实际工作中,往往得到的样本资料,总体均数
是未知的,所以只能用样本均数作为
的估计值,即用
代替
,用样本例数n代替N。但按公式计算的结果通常比实际的
低。所以用n-1来代替n进行校正。得到样本方差
离均差平方和SS总体方差样本方差自由度2024/11/139第10章-数值变量资料的统计描述2.标准差(standarddeviation)方差可以比较全面地反映变量值的变异情况,但其方差的单位是原单位的平方,故引入标准差的概念。标准差:将方差开平方,恢复成原度量单位,得到总体的标准差
和样本标准差S。2024/11/140第10章-数值变量资料的统计描述样本标准差用表示,其度量单位与均数一致,所以最常用。离均差平方和SS3.总体标准差用σ表示公式:公式:2024/11/141第10章-数值变量资料的统计描述
标准差的公式还可以写成:利用频数表计算标准差的公式为:2024/11/142第10章-数值变量资料的统计描述例
对以下数据:75,76,72,69,66,72,57,68,71,72,用直接法计算标准差。2024/11/143第10章-数值变量资料的统计描述血糖(mol/L)组段频数()组中值()
3.60~33.7011.1041.073.80~33.9011.7045.634.00~84.1032.80134.484.20~234.3098.90425.274.40~244.50108.00486.004.60~254.70117.50552.254.80~204.9098.00480.205.00~125.1061.20312.125.20~105.3053.00280.90
5.40~5.6045.5022.00121.00合计132614.202878.92例10-利用表10-2中的数据和频数表法计算标准差。2024/11/144第10章-数值变量资料的统计描述四、变异系数变异系数(coefficientofvariation,CV)常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度。2024/11/145第10章-数值变量资料的统计描述例10.7:某地7岁男孩身高的均数为123.10cm,标准差为4.71cm;体重均数为22.29kg,标准差为2.26kg,比较其变异度?
2024/11/146第10章-数值变量资料的统计描述小结:正态分布偏态分布集中趋势算术平均数(几何平均数)中位数离散趋势标准差、变异系数四分位间距2024/11/147第10章-数值变量资料的统计描述第二节正态分布和参考值范围2024/11/148第10章-数值变量资料的统计描述一、正态分布的概念和特征当X服从正态分布记作X~N(μ,σ2)其中μ为总体均数,σ2为总体方差2024/11/149第10章-数值变量资料的统计描述二、标准正态分布用N(0,1)表示,即u值的均数为0,标准差为1。
标准正态变换
2024/11/150第10章-数值变量资料的统计描述正态分布标准正态分布2024/11/151第10章-数值变量资料的统计描述正态分布的特征⑤正态分布的面积分布有一定的规律性,总面积=1。①正态分布是一单峰分布,高峰位置在均数X=
处;总体中位数亦为。②正态分布以均数为中心,左右完全对称;③正态分布取决于两个参数,即均数与标准差(
与
),标准正态分布的均数和标准差分别为0和1;
为位置参数,
为形态参数;④有些指标不服从正态分布,但通过适当的变换后服从正态分布;2024/11/152第10章-数值变量资料的统计描述2024/11/153第10章-数值变量资料的统计描述正态曲线下面积的分布规律(累积)分布函数:2024/11/154第10章-数值变量资料的统计描述图
正态曲线面积分布示意图
2024/11/155第10章-数值变量资料的统计描述正态分布的应用估计频数分布制定参考值范围质量控制统计分析方法的基础第10章-数值变量资料的统计描述估计频数分布Z=(2500-3200)/350=-2查附表一得:φ(-2)=0.0288第10章-数值变量资料的统计描述医学参考值是指正常人的各种生理、生化数据,组织或排泄物中各种成分的含量。正常人测定值的波动范围,称为参考值范围。参考值范围在诊断方面可用于划分正常或异常。参考值范围(referenceranges)2024/11/158第10章-数值变量资料的统计描述1、正态分布法2、百分位数法计算医学参考值范围的常用方法:2024/11/159第10章-数值变量资料的统计描述公式(正态分布):双侧参考值范围:X±uS单侧参考值范围:>X-uS(下限值)或<X+uS(上限值)其中X为均数,S为标准差,u值可由附表1(249)查。2024/11/160第10章-数值变量资料的统计描述例:10利用例1某地55~58岁健康成人的血糖值,求95%的参考值范围。正态分布法x=4.653,S=0.401双侧95%的参考值范围:
x±1.96S=4.653±1.96*0.401=(3.87~5.44)某地55~58岁健康成人的血糖值95%的参考值范围为3.87~5.44(mol/L)2024/11/161第10章-数值变量资料的统计描述一、抽样误差和标准误
第三节均数的抽样误差与总体均数的估计第10章-数值变量资料的统计描述
例如,从总体均数μ为4.83×/L、标准差
为
0.52×/L的正态分布总体N(4.83,0.522)中,随机抽取10人为一个样本(n=10),并计算该样本的均数、标准差。如此重复抽取100次(g=100),可得到100份样本,可得到100对均数和标准差S。正态总体μ=4.83σ=0.521.4.58,0.382.4.90,0.453.4.76,0.49┆99.4.87,0.59100.4.79,0.39S第10章-数值变量资料的统计描述
抽样误差
samplingerror:由于抽样而引起的差异。产生的基本条件为:抽样及个体变异。第10章-数值变量资料的统计描述图
随机抽样所得100个样本均数的分布第10章-数值变量资料的统计描述标准误(standarderror,SE)概念:样本均数的标准差,可用于衡量抽样误差的大小。σ未知σ已知第10章-数值变量资料的统计描述计算了100个样本的标准差S,由此可计算样本的标准误大小。第10章-数值变量资料的统计描述100个样本均数的抽样分布特点:②100个样本均数中,各样本均数间存在差异,但各样本均数在总体均数周围波动。③样本均数的分布曲线为中间高,两边低,左右对称,近似服从正态分布。①第10章-数值变量资料的统计描述标准误的特点:
当样本例数n一定时,标准误与标准差呈正比;当标准差一定时,标准误与样本含量n的平方根呈反比。通过增加样本含量n来降低抽样误差。第10章-数值变量资料的统计描述n=5n=103个抽样实验结果图示第10章-数值变量资料的统计描述标准误的用途衡量抽样误差的大小;估计总体均数的置信区间;用于假设检验。第10章-数值变量资料的统计描述标准误与标准差的区别与联系区别:
标准误标准差定义反映抽样误差反映个体变异用途总体均数可信区间医学参考值范围进行统计学检验计算标准误、CV联系:当n一定时标准差大,标准误也大第10章-数值变量资料的统计描述抽样实验小结
样本的均数围绕总体均数上下波动。均数的标准差即标准误样本均数的标准误(StandardError)
计算公式为:样本标准差/
从正态总体N(μ,σ2)中抽取样本,获得均数的分布仍近似呈正态分布N(μ,σ2/n)。第10章-数值变量资料的统计描述二、
t分布(t-distribution)随机变量XN(m,s2)标准正态分布N(0,12)u变换第10章-数值变量资料的统计描述均数标准正态分布N(0,12)Studentt分布自由度:n-1第10章-数值变量资料的统计描述图
不同自由度下的t分布图第10章-数值变量资料的统计描述t分布的特征
①以0为中心,左右对称的单峰分布;②t分布曲线是一簇曲线,其形态变化与自由度的大小有关。自由度越小,则t值越分散,曲线越低平;自由度逐渐增大时,t分布逐渐逼近u分布(标准正态分布);当趋于∞时,t分布即为u分布。第10章-数值变量资料的统计描述附表2t界值表
第10章-数值变量资料的统计描述参数的估计点估计:由样本统计量直接估计总体参数区间估计:在一定置信度(Confidencelevel)下,估计总体参数可能存在的范围二、参数估计第10章-数值变量资料的统计描述估计正确的概率(1
)称为可信度或置信度(confidencelevel),常取95%或99%。置信区间(confidenceinterval,CI)是根据一定的置信度估计得到的区间。总体均数的95%置信区间的涵义是指:从理论上来说,做100次抽样,可算得100个置信区间,平均有95个置信区间包括总体均数,只有5个置信区间不包括总体均数。(一)置信区间的有关概念第10章-数值变量资料的统计描述(二)总体均数置信区间的计算s未知,且n较小,按t分布s已知,或s未知但n足够大,按u分布第10章-数值变量资料的统计描述第10章-数值变量资料的统计描述第10章-数值变量资料的统计描述u0.05/2=1.962.σ未知但n较大时,按u分布计算总体均数的可信区间。双侧1-α可信区间为:3.σ已知时,总体均数双侧1-α可信区间为:u0.05/2=1.96=第10章-数值变量资料的统计描述(一)假设检验的基本思想—利用反证法的思想假设检验的基本思想和步骤
利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。当P小于或等于预先规定的概率值α,就是小概率事件。根据小概率事件的原理:小概率事件在一次抽样中发生的可能性很小,如果他发生了,则有理由怀疑原假设H0,认为其对立面H1成立,该结论可能犯大小为α的错误。第10章-数值变量资料的统计描述例
某地抽样调查了26名男性管理人员的空腹血糖,均数为4.84mol/L,标准差为0.85mol/L。已知大量调查的一般健康成年男性空腹静脉血糖的均数为4.70mol/L。试问能否认为该地健康男性管理人员的空腹血糖的均值与一般正常健康成年男性的的均值不同?第10章-数值变量资料的统计描述差异的原因:
(1)由于抽样误差造成的.(实际上,但由于抽样误差不能很好代表)(2)该地男性管理人员的空腹血糖与一般健康成年男性空腹静脉血糖()
第10章-数值变量资料的统计描述
假设检验的目的就是判断差异的原因:
求出由抽样误差造成此差异的可能性(概率P)有多大!若P
较大(P>0.05),认为是由于抽样误差造成的。原因(1),实际上若P
较小(P≤0.05),认为不是由于抽样误差造成的。原因(2),实际上>第10章-数值变量资料的统计描述(二)假设检验的基本步骤1.建立假设,确定检验水准2.选定检验统计方法,计算检验统计量3.确定P值,作出推断结论第10章-数值变量资料的统计描述1、建立假设,确定检验水准H0:(无效假设)µ=µ0H1:(备择假设)µ>µ0
(
µ≠µ0)检验水准的意义及确定单、双侧检验的选择:(1)根据专业知识事先不知道会出现什么结果双侧事先知道只能出现某种结果单侧(2)问题的提法*通常用双侧(除非有充足的理由选用单侧之外,一般选用保守的双侧较稳妥)第10章-数值变量资料的统计描述2、选定检验方法,计算检验统计量3、确定P值,作出推断结论P值:在H0成立的情况下,获得比现有统计量更极端的概率。第10章-数值变量资料的统计描述
(推断的结论=统计结论+专业结论)
P>0.05,按检验水准,不拒绝H0,差异无统计学意义(差异无显著性),还不能认为……不同或不等。
P≤0.05
,按检验水准,拒绝H0,接受H1,差异有统计学意义(差异有显著性)
,可以认为……不同或不等。
P≤0.01,按检验水准,拒绝H0,接受H1,差异有高度统计学意义(差异有高度显著性)
,可以认为……不同或不等。第10章-数值变量资料的统计描述
确定P值:(用求出的t值与查表查出的t
值比较)查t
值表:
(t
越大,P
越小)(1)求出t=1.833,P>0.05(2)求出t=4.18,
P<0.01(3)求出t=2.96,0.01<P<0.05(简写为P<0.05)(4)求出t=3.25,P=0.01Pt0.050.013.2502.2621.833P>0.054.18P<0.01P<0.052.96第10章-数值变量资料的统计描述第三节t检验和u检验t检验应用条件:
①当n<100时,要求样本取自正态分布的总体,总体标准差未知;②两小样本均数比较时,要求两样本总体方差相等(σ12=σ22)。第10章-数值变量资料的统计描述一、样本均数与总体均数比较的t检验(即:样本均数代表的未知总体均数µ和已知总体均数µ0的比较)第10章-数值变量资料的统计描述例已知一般无肝肾疾患的健康人群尿素氮均值为4.882(mol/L)。16名脂肪肝患者的尿素氮(mol/L)的测定值为5.74,5.75,4.26,6.24,5.36,8.68,6.47,5.24,4.13,11.8,5.57,5.61,4.37,4.59,5.18,6.96。问脂肪肝患者尿素氮测定值的均数是否高于健康人?第10章-数值变量资料的统计描述(1)建立假设、确定检验水准H0:µ=µ0即脂肪肝患者尿素氮测定值的均值与健康人相等H1:µ>µ0
即脂肪肝患者尿素氮测定值的均值高于一般健康人第10章-数值变量资料的统计描述(2)选定检验方法,计算检验统计量n=16<100,故选用t检验。已知第10章-数值变量资料的统计描述(3)确定P值,作出推断结论
查t界值表
为单侧检验Pt0.050.012.6021.725P<0.0252.32P<0.05,按检验水准,拒绝H0
,接受H1,认为脂肪肝患者尿素氮测定值的均数高于健康人。0.0252.131第10章-数值变量资料的统计描述二、配对设计的均数比较常见的配对设计主要有以下情形:①自身比较:同一受试对象处理前后或不同部位测定值的比较。(目的是判断此处理有无作用)②同一受试对象(或样品)分别接受两种不同的处理。(目的是比较不同方法之间的差异)③成对设计:将条件近似的观察对象两两配成对子,对子中的两个个体分别给予不同的处理。(目的是比较不同方法之间的差异)第10章-数值变量资料的统计描述配对t检验的基本原理:
假设两种处理的效应相同,即µ1=µ2
,则µ1-µ2=0,即可看成是差值的样本均数所代表的未知总体均数µd与已知总体均数µ0=0的比较,此时,我们可套用前述t检验的公式。第10章-数值变量资料的统计描述例
应用某药治疗8例高胆固醇患者,观察治疗前后血浆胆固醇变化情况,如表9-1,问该药是否对患者治疗前后血浆胆固醇变化有影响?表9-1用某药治疗前后血浆胆固醇变化情况病人编号血浆胆固醇(mmol/L)差值dd2治疗前治疗后⑴⑵⑶⑷=⑵-⑶110.106.693.4111.6326.785.401.833.35313.22
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司融资借款合同范本
- 农业集资合同范本
- 加盟课程合同范本
- 分房书合同范本
- 勘察设备购买合同范本
- 代加工洗煤合同范本
- 关于监理费合同范本
- 农机装备研发合同范本
- 办公区维修合同范本
- 2025年非晶、微晶合金项目申请报告模式
- 2022年兽医外科手术学作业题参考答案
- T∕CAMDI 009.1-2020 无菌医疗器械初包装洁净度 第1部分:微粒污染试验方法 气体吹脱法
- 医院门诊挂号收费系统操作要点
- 10KV变电所电气调试施工方案
- 国家农产品质量安全监督抽查抽样单
- 聘书模板可编辑
- 离心式压缩机功率公式
- 参保人员就医流程doc
- 2019湘美版五年级《书法练习指导》下册教案
- 东南大学建筑学专业课程设置
- Q∕CR 562.2-2017 铁路隧道防排水材料 第2部分:止水带
评论
0/150
提交评论