![第二章定量数据的统计描述_第1页](http://file4.renrendoc.com/view/9bd16e43c209d92f8fdc9b86ca624d53/9bd16e43c209d92f8fdc9b86ca624d531.gif)
![第二章定量数据的统计描述_第2页](http://file4.renrendoc.com/view/9bd16e43c209d92f8fdc9b86ca624d53/9bd16e43c209d92f8fdc9b86ca624d532.gif)
![第二章定量数据的统计描述_第3页](http://file4.renrendoc.com/view/9bd16e43c209d92f8fdc9b86ca624d53/9bd16e43c209d92f8fdc9b86ca624d533.gif)
![第二章定量数据的统计描述_第4页](http://file4.renrendoc.com/view/9bd16e43c209d92f8fdc9b86ca624d53/9bd16e43c209d92f8fdc9b86ca624d534.gif)
![第二章定量数据的统计描述_第5页](http://file4.renrendoc.com/view/9bd16e43c209d92f8fdc9b86ca624d53/9bd16e43c209d92f8fdc9b86ca624d535.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
【例2-1】2006年某市120名10岁男孩的身高(cm)资料如下135.4 139.8 144.0 147.3 146.3 142.5 138.1 143.6 141.6 152.6132.1 144.7 143.6 146.8 144.2 141.3 137.5 142.8 140.6 150.4145.9 140.2 144.5 148.2 146.4 142.4 138.5 148.9 146.2 155.4134.2 139.2 143.5 141.6 143.5 142.3 148.9 143.6 141.5 151.1132.5 138.7 149.6 146.9 148.7 141.5 137.8 142.7 144.6 151.8136.4 140.0 144.3 147.5 145.6 142.5 138.5 143.7 149.5 153.6130.2 138.9 143.7 146.5 138.8 141.7 136.9 142.0 140.5 150.3135.7 145.7 144.2 147.8 145.8 142.6 138.6 143.8 141.3 153.9133.4 139.6 143.7 147.5 144.8 148.0 137.4 142.1 140.8 141.8134.5 139.4 142.9 147.5 144.7 141.8 136.9 143.5 140.7 151.4145.6 147.3 143.9 141.9 151.6 145.6 148.9 144.3 139.1 145.8145.6 145.3 147.6 148.6 145.5 137.3 146.5 140.3 148.4 136.5当前1页,总共110页。【问题2-1】该资料为何种类型资料?如何对该资料进行描述?当前2页,总共110页。第一节频数表和频数图第二节集中趋势的描述第三节离散趋势的描述第四节正态分布及其应用当前3页,总共110页。频数表和频数图当前4页,总共110页。由于个体变异的存在,医学研究中某指标在各个体上的观察结果不是恒定不变的,但也不是杂乱无章的,而是有一定规律的,呈一定的分布(distribution)。将原始数据按照一定的标准划分为若干个组,合计各组的频数,得到频数分布表;也可再将频数表绘制成频数分布图。当前5页,总共110页。频数(frequency):一组资料中各观察值或不同组段内观察值出现的频繁程度(次数)。频数分布表(frequencytable):由变量值及其频数编制而成的表。一、频数分布表当前6页,总共110页。(一)频数表的编制1.求极差(range):极差又称全距,是指全部观察值中最大值与最小值之差,用符号R表示。
R=xmax-xmin当前7页,总共110页。2.确定组数和组距
(1)根据样本含量的大小及研究目的确定组数:一般设8~15个组。
(n<50,5~8;n>50,9~15)。当前8页,总共110页。(2)确定组距(classinterval):相邻两个组段下限之差为组距,一般采用等距分组。i=R/组数,为了方便资料整理汇总,组距一般取整数。当前9页,总共110页。
3.确定组段组段起点称为下限(lowerlimit)组段终点称为上限(upperlimit)注意:第一组段必须包含最小值,最后一个组段必须包括最大值,各组段不能重叠。除最末一个组段需同时写出上下限外,其余组段只写出其下限。当前10页,总共110页。4.归组计数,整理成表用计算机或手工划记法汇总,得到各组段观察单位个数,绘制成频数分布表。当前11页,总共110页。表2-12006年某市120名10岁男孩身高(cm)的频数表身高(1)频数(2)频率(%)(3)累计频数(4)累计频率(%)(5)130~132~134~136~138~140~142~144~146~148~150~152~154~15613481217212014106310.82.53.36.710.014.217.516.711.78.35.02.50.814816284566861001101161191200.83.36.713.323.337.555.071.783.391.796.799.2100.0合计120100.0——当前12页,总共110页。(二)频数分布表的用途1.揭示频数分布特征2.揭示频数分布类型3.便于发现特大或特小的可疑值4.便于进一步计算统计指标和进行统计分析当前13页,总共110页。频数分布的两个特征集中趋势(centraltendency):指一组数据向某个位置聚集或集中的倾向。
离散趋势(dispersion
tendency):指一组数据的分散性或变异度。
当前14页,总共110页。
频数分布的类型
对称分布(symmetricdistribution):集中位置在中间,左右两侧频数基本对称。当前15页,总共110页。偏态分布(skeweddistribution):集中位置偏向一侧,两侧频数分布不对称。正偏态(positiveskew)负偏态(negativeskew)当前16页,总共110页。频数频数频数血清肌红蛋白(μg/ml)负(左)偏态对称分布正(右)偏态当前17页,总共110页。二、频数分布图频数分布图(graphoffrequency)是以变量值为横坐标、频数(或频率)为纵坐标(不等距分组时以频率/组距=频率密度为纵坐标),以每个等宽的距形面积表示每组的频数(或频率)。当前18页,总共110页。连续型定量资料:频数图中各距形是相连的,又称直方图(histogram)。离散型定量资料:频数图中各距形是间隔的,又称直条图(bargraph)。当前19页,总共110页。图2-12006年某市120名10岁男孩身高的频数图当前20页,总共110页。离散型计量资料的频数表当前21页,总共110页。434名少数民族已婚妇女现有子女数频数分布图当前22页,总共110页。集中趋势的描述当前23页,总共110页。平均数(average)是一类描述计量资料集中位置或平均水平的统计指标,在医学领域中常用的平均数有算术均数、几何均数、中位数、众数、调和均数。当前24页,总共110页。一、算术均数(arithmeticmean)简称均数(mean),总体均数用希腊字母
(miu)表示,样本均数用(xbar)表示。均数描述一组数据在数量上的平均水平。当前25页,总共110页。直接法
将所有数据直接相加,再除以总例数
Σ:是希腊字母,读作sigma,为求和符号。1.计算方法当前26页,总共110页。【例2-2】某医生测量了10名脑出血患者的血尿素氮(mmol/L)分别是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,试计算该组数据的均数。当前27页,总共110页。加权法
用于频数表资料或样本中相同观察值较多时,将相同观察值的个数(频数f)乘以该观察值x,以代替相同观察值逐个相加。当前28页,总共110页。【例2-3】根据表2-1资料,用加权法求120名10岁男孩身高的均数当前29页,总共110页。f起了“权数”的作用,权衡了各组中值由于频数不同对均数的影响。加权法计算的均数是近似的。当前30页,总共110页。适用于描述单峰对称分布,特别是正态分布或近似正态分布资料的集中趋势。均数在描述正态分布特征方面有重要意义。均数的应用我也知道了!当前31页,总共110页。例现有5人,其血清抗体效价分别为1:10、1:100、1:1000、1:10000和1:100000,求其效价倒数的平均水平。若计算效价倒数的算术均数用算术均数反映这类资料的平均水平是不合适的。当前32页,总共110页。先求效价倒数对数值的均数,然后求反对数1000位于10、100、1000、10000、100000的中间位置,具有很好的表性,这种平均数就称为几何均数。当前33页,总共110页。是n个观察值乘积的n次方根,又称倍数均数,用G表示。
几何均数(geometricmean)
二、几何均数(Geometricmean,G)当前34页,总共110页。直接法:当n较小时,直接将n个观察值的乘积开n次方。1.计算方法二、几何均数(Geometricmean,G)当前35页,总共110页。
【例2-4】某实验室测得7人血清中某种抗体的滴度分别为1/4,1/8,1/16,1/32,1/64,1/128,1/256,试求平均滴度。
当前36页,总共110页。加权法:当资料中出现相同观察值较多或资料已编制成频数表时,也可用加权法计算几何均数。当前37页,总共110页。【例2-6】50名麻疹易感儿接种麻疹疫苗后,测得血凝抑制抗体滴度资料见表4-3,求抗体的平均滴度。表4-350名麻疹易感儿血凝抑制抗体滴度当前38页,总共110页。即50名麻疹易感儿接种麻疹疫苗后血凝抑制抗体的平均滴度为1/54。
当前39页,总共110页。2.应用及注意事项几何均数应用于:等比资料,如抗体平均滴度;对数正态分布资料。Remember!当前40页,总共110页。使用几何均数时应注意:观察值不能有0;观察值不能同时有正值和负值。若全为负值,在计算时先把负号去掉,得出结果再加上负号。Becareful!当前41页,总共110页。
【例2-7】200名食物中毒患者潜伏期资料如表2-4,研究人员据此采用加权法计算均数得平均潜伏期为27小时。(1)该组数据在分布上有何特点?(2)用均数描述该资料的平均水平是否合适?三、中位数与百分位数当前42页,总共110页。表2-4200名食物中毒患者的潜伏期潜伏期(小时)(1)频数(2)累计频数(3)累计频率(%)(4)=(3)/n0~303015.012~7110150.524~4915075.036~2817889.048~1419296.060~719999.572~841200100.0合计200--当前43页,总共110页。中位数(median):一组观察值从小到大排列,位次居中的观察值即中位数,是一个位置指标。当前44页,总共110页。直接法n为奇数,n为偶数,当前45页,总共110页。【例2-8】某实验师对10只小白鼠染毒后观察各小鼠的生存时间(分钟),得数据为:35,60,62,63,63,65,66,68,69,69,试计算小白鼠的平均生存时间将10个观察值由小到大排列:35,60,62,63,63,65,66,68,69,69
当前46页,总共110页。频数表法LM
中位数所在组段下限
组距中位数所在组段的频数中位数所在组段前一组的累计频数当前47页,总共110页。【例2-9】根据例4-7的资料计算中位数表2-4200名食物中毒患者的潜伏期潜伏期(小时)(1)频数(2)累计频数(3)累计频率(%)(4)=(3)/n0~303015.012~7110150.524~4915074.536~2817889.048~1419296.060~719999.572~841200100.0合计200--当前48页,总共110页。当前49页,总共110页。百分位数(percentile):是指将一组观察值由小到大排序后,将其平均分成100等份,对应于每一分割位置上的数值就称为一个百分位数,用
表示。当前50页,总共110页。是一种位置指标,一个百分位数将一组观察值分为两部分,理论上有x%的观察值比它小,有(100-x)%的观察值比它大。当前51页,总共110页。式中:第x百分位数所在组段下限组距第x百分位数所在组段的频数第x百分位数所在组段前一组的累计频数当前52页,总共110页。【例4-10】根据表4-4,计算P25、P75当前53页,总共110页。适用条件:偏态分布资料分布类型不明确的资料“开口资料”(即一端或两端无确切数值的资料)Understand?当前54页,总共110页。均数、中位数正态分布时:均数=中位数正偏态分布时:均数>中位数负偏态分布时:均数<中位数当前55页,总共110页。集中趋势指标小结1.即计量资料分布与平均数的选择2.计量资料的分布与统计分析
分布类型
算术均数几何均数中位数正态分布√×√对数正态分布×√√其他分布××√正态分布非正态分布可转换为正态分布其他分布应用手段丰富应用手段有限当前56页,总共110页。离散趋势的描述当前57页,总共110页。描述离散趋势的常用指标极差(range)四分位数间距(interquartilerange)方差(variance)和标准差(standarddeviation)变异系数(coefficientofvariation)当前58页,总共110页。1.极差/全距(range)
全部观察值中最大值与最小值之差,用符号R表示,即常用于描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度当前59页,总共110页。极差描述离散趋势的局限只考虑最大值与最小值之差异,不能反映组内其它观察值的变异程度样本含量越大,极差可能越大,样本含量相差悬殊时不宜用极差作比较
当前60页,总共110页。四分位数:P25,P50,P75三个点将全部观察值等分为四部分,处于分位点上的数值就是四分位数下四分位数即第25百分位数,用QL表示上四分位数即第75百分位数,用QU表示2.四分位数间距当前61页,总共110页。四分位数间距(interquartilerange)即上、下四分位数之差200名食物中毒患者的潜伏期资料,P25=15.4,P75=36当前62页,总共110页。四分位数间距常用于描述偏态分布及分布的一端或两端无确切数值资料的离散程度四分位数间距较全距稳定,但仍不能全面概括所有观察值的变异情况当前63页,总共110页。当前64页,总共110页。3.方差(variance)和标准差(SD)式中n–1称为自由度(Degreeoffreedom),允许自由取值的变量值个数,用符号(niu)表示当前65页,总共110页。方差的度量单位是原度量单位的平方方差开方后即与原数据的度量单位相同,这就是标准差(standarddeviation)当前66页,总共110页。
标准差应用公式
直接法
加权法当前67页,总共110页。
【例2-13】某医生测量了10名脑出血患者的血尿素氮(mmol/L)分别是:7.4、6.7、6.9、7.3、7.6、6.5、7.8、8.2、8.0、6.6,试计算该组数据的标准差当前68页,总共110页。【例2-14】根据表4-1资料,计算120名10岁男孩身高的标准差当前69页,总共110页。描述对称分布,特别是正态分布或近似正态分布资料的变异程度当前70页,总共110页。
【例2-15】某医院预防保健科,对一组5岁男孩进行体检,测量身高、体重等指标。得身高均数与标准差为115.8cm和4.5cm,体重均数与标准差为20.2kg和0.56kg,由此认为身高的变异程度比体重大。上述结论是否正确?4.变异系数(coefficientofvariation)当前71页,总共110页。
【例2-16】某实验室分别测量了10只小白鼠和10只家兔的体重,得小白鼠体重的均数与标准差分别为22g和3g,家兔体重的均数与标准差分别为1500g和100g。经比较得出结论,因家兔体重的标准差大于小白鼠体重的标准差,所以家兔体重的变异程度比小白鼠体重的变异程度大。当前72页,总共110页。变异系数(coefficientofvariation,CV):是一组观察值的标准差与其均数的比值用途:比较度量衡单位不同的资料的变异度比较均数相差悬殊的资料的变异度当前73页,总共110页。当前74页,总共110页。描述数值变量资料集中趋势的指标当前75页,总共110页。描述数值变量资料离散趋势的指标当前76页,总共110页。描述频数分布特征的指标总结对称分布偏态分布对数正态分布集中趋势均数中位数几何均数离散趋势标准差四分位数间距对数标准差的反对数当前77页,总共110页。正态分布及其应用当前78页,总共110页。图2-2频数分布逐渐接近正态分布示意图当前79页,总共110页。1.正态分布的概念及特征正态分布(Normaldistribution),也称高斯分布(Gaussiandistribution),是一种非常重要的连续型随机变量的概率分布,是自然界中最常见的一种分布当前80页,总共110页。正态分布(normaldistribution)称为高斯分布(Gaussdistribution),如果连续型随机变量X的概率密度函数为:概念正态分布的概念与特征则称随机变量X服从参数为和的正态分布,记作:-∞<x<+∞当前81页,总共110页。正态曲线(normalcurve)在横轴上方均数处最高;并以均数为中心,左右对称;两端与横轴永不相交,呈钟形的曲线。正态分布特征正态分布的概念与特征
正态曲线当前82页,总共110页。正态分布有两个参数,即位置参数和形状参数
正态分布的概念与特征
位置参数当前83页,总共110页。方差相等、均数不等的正态分布图示312当前84页,总共110页。形态参数σ正态分布的概念与特征
当前85页,总共110页。均数相等、方差不等的正态分布图示213当前86页,总共110页。正态分布的概念与特征
正态曲线下面积的分布有一定的规律。
正态分布曲线下一定区间内的面积代表了取值于相应区间内的观察值个数在全部观察值总数中所占的比例(概率),或者是观察值落在该区间内的概率。当前87页,总共110页。正态分布的概念与特征
正态曲线下面积的分布规律:
①正态曲线与横轴之间的面积恒等于1或100%;②对称分布,对称轴两侧的面积各为50%;③在区间的面积为68.27%在区间的面积为95.00%在区间的面积为99.00%
当前88页,总共110页。正态曲线下的面积规律-+15.87%15.87%68.27%当前89页,总共110页。-1.96+1.962.5%2.5%95%当前90页,总共110页。-2.58+2.580.5%0.5%99%当前91页,总共110页。若X服从正态分布,则Z就服从。2.标准正态分布标准正态分布与标准化变换(Z变换)当前92页,总共110页。标准正态分布曲线下面积分布规律当前93页,总共110页。标准正态分布曲线下面积(-z)
z 0.00 0.02 0.04 0.06 0.08-3.0 0.0013 0.0013 0.0012 0.0011 0.0010-2.5 0.0062 0.0059 0.0055 0.0052 0.0049-2.0 0.0228 0.0217 0.0207 0.0197 0.0188-1.9 0.0287 0.0274 0.0262 0.0250 0.0239-1.6 0.0548 0.0526 0.0505 0.0485 0.0465-1.0 0.1587 0.1539 0.1492 0.1446 0.1401-0.5 0.3085 0.3015 0.2946 0.2877 0.28100 0.5000 0.4920 0.4840 0.4761 0.46810z当前94页,总共110页。
【例2-18】
已知某地2003年18岁男大学生身高的均数cm,标准差cm,且18岁男大学生的身高服从正态分布。问该地18岁男大学生中身高在166.8cm及其以下者占多大的比例?
查附表3:表的左侧找-1.9,表的上方找0.06,相交处为0.025
当前95页,总共110页。3.正态分布的应用估计频率分布
【例2-19】某地2003年抽样调查了100名18岁男大学生身高,算得均数为172.70cm,标准差为4.01cm。该地18岁男大学生中身高在162.35cm~183.05cm范围内者所占的比例是多少?当前96页,总共110页。查附表3,左侧的面积为0.005,由正态分布曲线的对称性可知,右侧的面积也为0.005,又由正态分布曲线下的总面积为1,可得-2.58与2.58之间的面积为1-2×0.005=0.99=99%。当前97页,总共110页。制定医学参考值范围医学参考值范围也称正常值范围绝大多数正常人某观察指标的波动范围。绝大多数:90%、95%、99%等,最常用的是95%正常人:不是指完全健康的人,而是指排除了影响研究指标的疾病和有关因素的同质人群当前98页,总共110页。正常人病人假阳性率假阴性率正常人与病人的数据分布重叠示意图(单侧)当前99页,总共110页。制定医学参考值范围的注意事项:①要确定一批样本含量足够大的“正常人”②根据研究目的和使用要求选定适当的百分界值③根据专业知识确定单侧或双侧界值④根据资料的分布选用恰当的计算方法当前100页,总共110页。根据医学专业知识确定!单侧:下限:肺活量、IQ
……
上限:转氨酶、尿铅、发汞……双侧:白细胞计数、血清总胆固醇……
过低异常---单侧下限过高异常---单侧上限过低、过高均异常---双侧单侧下限异常正常单侧上限异常正常异常正常双侧下限双侧上限异常当前101页,总共110页。当前102页,总共110页。正态分布法:适用于正态或近似正态分布的资料
双侧界值
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024-2025学年高中地理课时分层作业12人类面临的主要环境问题含解析湘教版必修2
- 2024-2025学年高中化学课时分层作业11酚含解析新人教版选修5
- 2024-2025学年高中生物第6章第1节第2课时动物细胞的有丝分裂无丝分裂及观察有丝分裂实验学案新人教版必修1
- 2024-2025学年高中语文课时作业11包身工含解析新人教版必修1
- 2024-2025学年高中地理第三章区域自然资源综合开发利用第二节流域的综合开发-以美国田纳西河流域为例第一课时流域开发的自然背景流域的早期开发及其后果教学案新人教版必修3
- 物业管家转正申请书
- 2025年度民营企业高管职务聘用合同范本
- 商场退场申请书
- 贫困生申请书800字
- 2025年度人工智能技术研发与应用合作协议-@-7
- 2024标准版安全生产责任制培训记录
- 中英旅游文本用词的共同特点及其翻译
- Meta分析的步骤与实例分析
- 城市区域环境噪声监测实验报告
- MBTI量表完整版本
- 护理操作-吸痰
- 中医适宜技术-腕踝针
- 初二上劳动技术课件电子版
- 创业计划书模板-创业计划书-商业计划书模板-项目计划书模板-商业计划书30
- 医院护理带教老师竞聘课件
- 四川虹科创新科技有限公司高强超薄耐摔玻璃智能制造产业化项目环境影响报告
评论
0/150
提交评论