计量资料的统计描述-课件_第1页
计量资料的统计描述-课件_第2页
计量资料的统计描述-课件_第3页
计量资料的统计描述-课件_第4页
计量资料的统计描述-课件_第5页
已阅读5页,还剩105页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章计量资料的统计描述第一节频数分布(frequencydistribution)1第二章计量资料的统计描述第一节频数分布112101名正常成年女子的血清总胆固醇(mmol/L)频数分布表2101名正常成年女子的血清总胆固醇(mmol/L)频数分2求极差极差(range)也称全距,即最大值和最小值之差,记作R。本例:R=5.71-2.35=3.36(mmol/L)确定组数与组距根据原始数据多少,组段数通常取组8~15组组距i=全距R/组数k,本例i=3.36/10=0.336≈0.30确定组限资料中的每一个数据都必须能够归属于某一组,且只能归属于该组。统计频数编制频数表

3求极差334445556667三、频数分布表的用途可代替繁杂的原始资料,便于进一步分析。便于观察数据的分布类型。便于发现资料中某些远离群体的特大或特小的可疑值。当样本含量较大时,可用各组段的频率作为概率的估计值。7三、频数分布表的用途可代替繁杂的原始资料,便于进一步分析。78图2-2115名正常成年女子的血清转氨酶的频数分布右偏态分布或正偏态分布图2-3101名正常人的血清肌红蛋白的频数分布左偏态分布或负偏态分布8图2-2115名正常成年女子的血清转氨酶的频数分布右偏态8第二节

集中趋势的描述9第二节

集中趋势的描述9910平均数(average)

平均数是描述一组观察值集中位置和平均水平的统计指标。常用的平均数包括:算数均数(mean)几何均数(geometricmean)中位数(median)和百分位数(percentile)10平均数(average)平均数是描述一1011算数均数直接法

加权法均数的应用适用用于对称分布或偏度不大的资料,能够很好的反映数据的集中位置和平均水平。算数均数容易受到频数分布尾端极大或极小值的影响。11算数均数直接法11101名正常成年女子的血清总胆固醇

直接法:

加权法:12101名正常成年女子的血清总胆固醇

直接法:

加权法1213几何均数(geometricmean)

观察值间按倍数变化的资料可以计算几何均数(G)以描述其平均水平。计算公式为:加权法为:13几何均数(geometricmean)观察值间1314141415注意点:适用于数据呈等比分布或呈对数正态分布的资料。数据中出现0或负数时,需对数据进行转换。15注意点:适用于数据呈等比分布或呈对数正态分布的资料。1516中位数和百分位数中位数

一组观察值按从大到小顺序排列,居中心位置的数即为中位数(median)。将所以n个观察值按升序排列,n为奇数时:中位数n为偶数时:中位数16中位数和百分位数中位数16171717百分位数百分位数(percentile)是一种位置指标,用PX来表示。直接法当nX%为带有小数位时:PX=X(trunc(nX%)+1)当nX%为整数时:

PX=1/2(X(nX%)+X(nX%+1))18百分位数百分位数(percentile)是一种位置指18频数表法计算公式:19L、iX、fX分别为PX所在组段的下限、组距和频数,fL为PX所在组段之前各组段的累计频数。频数表法19L、iX、fX分别为PX所在组段的下限、组距和频1920202021注意点:算术均数,几何均数以及中位数都能反映一组数据的集中趋势和水平。算术均数适用对称分布的计量资料,几何均数适用于呈等比分布计量资料,中位数适用于任何频数分布资料。中位数对于对称分布资料,没有均数稳定,不便于进行统计运算。多个百分位数结合使用常可以说明某一特定的问题。21注意点:21第三节离散趋势的描述22第三节222223对甲乙2名高血压患者连续观察5天,测得的收缩压分别为:甲患者(mmHg)162145178142186()乙患者(mmHg)164160163159166()甲乙患者收缩压的均数很相似,但是甲患者的血压波动范围较大。23对甲乙2名高血压患者连续观察5天,测得的收缩压分2324衡量离散趋势的指标大体分为2大类:按间距计算:极差和四分位数间距按平均偏差计算:离均差平方和、方差、标准差和变异系数24衡量离散趋势的指标大体分为2大类:2425极差和四分位数间距极差(range):观测值中最大值和最小值之差,用R表示。R甲

=186-142=44(mmHg)R乙

=166-159=7(mmHg)四分位数间距(quartile):百分位数P75和P25之间的差。Q=P75–P2525极差和四分位数间距25表2-6中,已知P25=39.2,P75=67.7,计算118名链球菌咽喉炎患者潜伏期的四分位数间距。

QR=67.7-39.2=28.5(天)

四分位数间距主要用于衡量明显偏态分布资料的变异程度。

26表2-6中,已知P25=39.2,P75=67.7,计算112627离均差平方和(sumofsquare,SS)方差(meanofsquare,MS)离均差平方和再取平均,其结果为方差。对于样本资料,分母取n–1作为自由度(degreeoffreedom,df),式中MS为样本方差,方差越大说明数据的变异越大。27离均差平方和(sumofsquare,SS)方差(m2728标准差(standarddeviation,SD)方差的平方根称为标准差。

SD越大说明其变异程度越大。如果是频数表资料,可用以下的公式:28标准差(standarddeviation,SD)方差282929例如对于前例经计算有甲患者:

乙患者:2929例如对于前例经计算有2930标准差的量纲与原变量一致。标准差可以直接用于代数运算。标准差与均数结合能够完整地概括一个正态分布。标准差越大意味着个体差异越大。30标准差的量纲与原变量一致。3031变异系数(coefficientofvariation,CV)某地7岁男孩身高的均数为123.10cm,标准差为4.71;体重均数为22.59kg,标准差为2.26kg,比较其变异度?身高体重不同量纲的变量间变异程度的比较。均数差别较大的变量间变异程度的比较。31变异系数(coefficientofvariatio31第四节

正态分布32第四节

正态分布3232正态分布首先由德国数学家和天文学家德·莫阿弗尔(A.deMovre,1667-1754)于1733年提出。德国数学家Gauss将其运用于天文学研究中,从而使正态分布为世人所知。

因此,正态分布又称为Gauss分布。33A.deMovreGauss正态分布首先由德国数学家和天文学家德·莫阿弗尔(A.33343434将血清总胆固醇的横坐标用变量X表示,第i组的组距和人数分别为△Xi和fi表示,n为总观察例数,则在[X,X+△Xi)区间内每单位血清总胆固醇的频率为:

f(X)=(fi/n)/△Xi

35

各矩形的面积恰好等于红细胞在区间内的频率(f(X)△Xi=fi/n)面积的总和为1。将血清总胆固醇的横坐标用变量X表示,第i组的组距和人3536

假设观察的人数增多,组段不断细分,则直方图将逐渐接近于一条均匀连续的曲线,这条曲线所描述的分布,简称为正态分布。36假设观察的人数增多,组段不断细分,则直方图3637正态分布的密度函数,曲线方程为:

π和e是圆周率和自然对数的底,其近似值分别为3.14159和2.71828。

μ和σ是正态分布的两个参数,分别是总体的均数和标准差。总体的自由度是n而不是n-137正态分布的密度函数,曲线方程为:π和e是圆3738正态分布的特征正态分布以均数μ为中心,左右对称。正态分布曲线下面积集中在以均数μ为中心的中心部分,越远离中心曲线下面积越小。正态分布曲线下面积分布有一定的规律。38正态分布的特征38正态分布曲线下面积的计算可以通过对其概率密度函数积分来实现:39正态分布曲线下面积的计算可以通过对其概率密度函数积分3940正态分布完全由参数μ和σ决定。40正态分布完全由参数μ和σ决定。40标准正态分布及曲线下面积

41

标准正态分布

(StandardNormalDistribution)

对任何参数的正态分布,都可以通过一个简单的变量变换化成μ=0和s=1的标准正态分布。通常,可以利用标准正态分布表求出与原始变量X有关的概率值。标准正态分布及曲线下面积41标准正态分布(Standa4142代入:42代入:4243查附表1

Φ(-1.96)=?Φ(-2.58)=?43查附表14344

成年男性的红细胞数近似服从正态分布,假设其均数为4.78×1012/L,标准差为0.38×1012/L,想知道红细胞数在4×1012/L以下所占的比例。

然后查附表1得Φ(-2.05)=0.0202,表明红细胞数在4×1012/L以下所占的比例为总体的2%。44成年男性的红细胞数近似服从正态分布,假设其均数为4445正态分布的应用利用正态分布可以很容易确定资料中任意数值出现的概率,医学参考值范围的估计。准确地进行误差分析和质量控制。正态分布是以后学习各种统计推断方法的理论基础。45正态分布的应用45第五节

医学参考值范围的制定46第五节

医学参考值范围的制定464647医学参考值范围的概念正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。目的:基于临床事件,着眼于个体,作为划分正常人和异常人的界限。基于预防医学实践,着眼于人群,制定各种生理指标的等级标准。47医学参考值范围的概念4748医学参考值范围的制定方法选择足够数量的正常人作为参照样本。对选定的正常人进行准确的测定。决定取单侧范围还是双侧范围值。血清总胆固醇,过高或过低均属异常取双侧。血清转氨酶仅过高属异常,取单侧。肺活量仅过低属异常,取单侧。48医学参考值范围的制定方法4849选择适当的百分范围。49选择适当的百分范围。4950正态分布法计算医学参考值范围。单侧:双侧:50正态分布法计算医学参考值范围。5051百分位数法计算医学参考值范围。51百分位数法计算医学参考值范围。5152百分位数法与正态分布法前者适合任何分布类型的资料,实际中最为常用。后者仅适用于正态分布资料,适用范围较狭窄。前者必须有较大的样本含量,否则结果不稳定。后者的结果比较稳定。52百分位数法与正态分布法52535353计算正常人尿汞的95%参考值范围。54计算上侧界值第95的百分位数计算正常人尿汞的95%参考值范围。54计算上侧界值第95的百54小结计量资料的统计描述,频数表的编制方法,及主要用途。集中趋势的统计描述,各类均数的计算方法,适用范围。离散趋势的统计描述,衡量变异程度的各类统计学指标的含义,以及其适用资料的类型。正态分布、标准正态分布的特征,以及适用的资料类型。医学参考值制定的方法。55小结计量资料的统计描述,频数表的编制方法,及主要用途。5555第二章计量资料的统计描述第一节频数分布(frequencydistribution)56第二章计量资料的统计描述第一节频数分布15657101名正常成年女子的血清总胆固醇(mmol/L)频数分布表2101名正常成年女子的血清总胆固醇(mmol/L)频数分57求极差极差(range)也称全距,即最大值和最小值之差,记作R。本例:R=5.71-2.35=3.36(mmol/L)确定组数与组距根据原始数据多少,组段数通常取组8~15组组距i=全距R/组数k,本例i=3.36/10=0.336≈0.30确定组限资料中的每一个数据都必须能够归属于某一组,且只能归属于该组。统计频数编制频数表

58求极差35859459605606166162三、频数分布表的用途可代替繁杂的原始资料,便于进一步分析。便于观察数据的分布类型。便于发现资料中某些远离群体的特大或特小的可疑值。当样本含量较大时,可用各组段的频率作为概率的估计值。7三、频数分布表的用途可代替繁杂的原始资料,便于进一步分析。6263图2-2115名正常成年女子的血清转氨酶的频数分布右偏态分布或正偏态分布图2-3101名正常人的血清肌红蛋白的频数分布左偏态分布或负偏态分布8图2-2115名正常成年女子的血清转氨酶的频数分布右偏态63第二节

集中趋势的描述64第二节

集中趋势的描述96465平均数(average)

平均数是描述一组观察值集中位置和平均水平的统计指标。常用的平均数包括:算数均数(mean)几何均数(geometricmean)中位数(median)和百分位数(percentile)10平均数(average)平均数是描述一6566算数均数直接法

加权法均数的应用适用用于对称分布或偏度不大的资料,能够很好的反映数据的集中位置和平均水平。算数均数容易受到频数分布尾端极大或极小值的影响。11算数均数直接法66101名正常成年女子的血清总胆固醇

直接法:

加权法:67101名正常成年女子的血清总胆固醇

直接法:

加权法6768几何均数(geometricmean)

观察值间按倍数变化的资料可以计算几何均数(G)以描述其平均水平。计算公式为:加权法为:13几何均数(geometricmean)观察值间6869146970注意点:适用于数据呈等比分布或呈对数正态分布的资料。数据中出现0或负数时,需对数据进行转换。15注意点:适用于数据呈等比分布或呈对数正态分布的资料。7071中位数和百分位数中位数

一组观察值按从大到小顺序排列,居中心位置的数即为中位数(median)。将所以n个观察值按升序排列,n为奇数时:中位数n为偶数时:中位数16中位数和百分位数中位数71721772百分位数百分位数(percentile)是一种位置指标,用PX来表示。直接法当nX%为带有小数位时:PX=X(trunc(nX%)+1)当nX%为整数时:

PX=1/2(X(nX%)+X(nX%+1))73百分位数百分位数(percentile)是一种位置指73频数表法计算公式:74L、iX、fX分别为PX所在组段的下限、组距和频数,fL为PX所在组段之前各组段的累计频数。频数表法19L、iX、fX分别为PX所在组段的下限、组距和频7475207576注意点:算术均数,几何均数以及中位数都能反映一组数据的集中趋势和水平。算术均数适用对称分布的计量资料,几何均数适用于呈等比分布计量资料,中位数适用于任何频数分布资料。中位数对于对称分布资料,没有均数稳定,不便于进行统计运算。多个百分位数结合使用常可以说明某一特定的问题。21注意点:76第三节离散趋势的描述77第三节227778对甲乙2名高血压患者连续观察5天,测得的收缩压分别为:甲患者(mmHg)162145178142186()乙患者(mmHg)164160163159166()甲乙患者收缩压的均数很相似,但是甲患者的血压波动范围较大。23对甲乙2名高血压患者连续观察5天,测得的收缩压分7879衡量离散趋势的指标大体分为2大类:按间距计算:极差和四分位数间距按平均偏差计算:离均差平方和、方差、标准差和变异系数24衡量离散趋势的指标大体分为2大类:7980极差和四分位数间距极差(range):观测值中最大值和最小值之差,用R表示。R甲

=186-142=44(mmHg)R乙

=166-159=7(mmHg)四分位数间距(quartile):百分位数P75和P25之间的差。Q=P75–P2525极差和四分位数间距80表2-6中,已知P25=39.2,P75=67.7,计算118名链球菌咽喉炎患者潜伏期的四分位数间距。

QR=67.7-39.2=28.5(天)

四分位数间距主要用于衡量明显偏态分布资料的变异程度。

81表2-6中,已知P25=39.2,P75=67.7,计算118182离均差平方和(sumofsquare,SS)方差(meanofsquare,MS)离均差平方和再取平均,其结果为方差。对于样本资料,分母取n–1作为自由度(degreeoffreedom,df),式中MS为样本方差,方差越大说明数据的变异越大。27离均差平方和(sumofsquare,SS)方差(m8283标准差(standarddeviation,SD)方差的平方根称为标准差。

SD越大说明其变异程度越大。如果是频数表资料,可用以下的公式:28标准差(standarddeviation,SD)方差838484例如对于前例经计算有甲患者:

乙患者:2929例如对于前例经计算有8485标准差的量纲与原变量一致。标准差可以直接用于代数运算。标准差与均数结合能够完整地概括一个正态分布。标准差越大意味着个体差异越大。30标准差的量纲与原变量一致。8586变异系数(coefficientofvariation,CV)某地7岁男孩身高的均数为123.10cm,标准差为4.71;体重均数为22.59kg,标准差为2.26kg,比较其变异度?身高体重不同量纲的变量间变异程度的比较。均数差别较大的变量间变异程度的比较。31变异系数(coefficientofvariatio86第四节

正态分布87第四节

正态分布3287正态分布首先由德国数学家和天文学家德·莫阿弗尔(A.deMovre,1667-1754)于1733年提出。德国数学家Gauss将其运用于天文学研究中,从而使正态分布为世人所知。

因此,正态分布又称为Gauss分布。88A.deMovreGauss正态分布首先由德国数学家和天文学家德·莫阿弗尔(A.88893489将血清总胆固醇的横坐标用变量X表示,第i组的组距和人数分别为△Xi和fi表示,n为总观察例数,则在[X,X+△Xi)区间内每单位血清总胆固醇的频率为:

f(X)=(fi/n)/△Xi

90

各矩形的面积恰好等于红细胞在区间内的频率(f(X)△Xi=fi/n)面积的总和为1。将血清总胆固醇的横坐标用变量X表示,第i组的组距和人9091

假设观察的人数增多,组段不断细分,则直方图将逐渐接近于一条均匀连续的曲线,这条曲线所描述的分布,简称为正态分布。36假设观察的人数增多,组段不断细分,则直方图9192正态分布的密度函数,曲线方程为:

π和e是圆周率和自然对数的底,其近似值分别为3.14159和2.71828。

μ和σ是正态分布的两个参数,分别是总体的均数和标准差。总体的自由度是n而不是n-137正态分布的密度函数,曲线方程为:π和e是圆9293正态分布的特征正态分布以均数μ为中心,左右对称。正态分布曲线下面积集中在以均数μ为中心的中心部分,越远离中心曲线下面积越小。正态分布曲线下面积分布有一定的规律。38正态分布的特征93正态分布曲线下面积的计算可以通过对其概率密度函数积分来实现:94正态分布曲线下面积的计算可以通过对其概率密度函数积分9495正态分布完全由参数μ和σ决定。40正态分布完全由参数μ和σ决定。95标准正态分布及曲线下面积

96

标准正态分布

(StandardNormalDistribution)

对任何参数的正态分布,都可以通过一个简单的变量变换化成μ=0和s=1的标准正态分布。通常,可以利用标准正态分布表求出与原始变量X有关的概率值。标准正态分布及曲线下面积41标准正态分布(Standa9697代入:42代入:9798查附表1

Φ(-1.96)=?Φ(-2.58)=?43

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论