医学统计学-第2章课件_第1页
医学统计学-第2章课件_第2页
医学统计学-第2章课件_第3页
医学统计学-第2章课件_第4页
医学统计学-第2章课件_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章 数值变量的描述性统计统计图表;统计指标。第二章 数值变量的描述性统计统计图表;第一节 频数分布第一节 频数分布一. 编制频数表的步骤求极差R=84-57cm=27(次/分)划分组段确定组数:较大样本时,一般取10组左右。确定组距:极差/组数=27/10=2.73(次/分)确定各组段的上下限:上限=下限+组距统计各组段内的数据频数,编制频数表一. 编制频数表的步骤求极差 表2.1 130名健康成年男子脉搏(次/分)的频数分布表脉搏组段 (1)频数(2)频率(%) (3)累计频数 (4)累计频率(%) (5)5659626568717477808385合计25121525261915101

2、1301.543.859.2311.5419.2320.0014.6211.547.690.7727193459851041191291301.545.3814.6226.1545.3865.3880.0091.5499.23100.00 表2.1 130名健康成年男子脉搏(次/分)的频二. 频数表的用途可以揭示资料的分布类型和分布特征,以便于选用相应的统计分析方法。便于进一步计算指标和统计处理。便于发现某些特大或特小的可疑值。二. 频数表的用途可以揭示资料的分布类型和分布特征,以便于第二节 集中趋势的描述三种平均数算术均数几何均数中位数。第二节 集中趋势的描述三种平均数(一)算术均数(x)简

3、称均数,适合于表达呈正态分布资料的平均水平。直接法: X=X1+Xnn=Xn例2-2:X=81+70+66+6913=71.69(次/分)(一)算术均数(x)简称均数,适合于表达呈正态分布资料的平均加权法X=fXf例: X=572+605+6312+84 1130=71.12(次/分)加权法fXf例: X=572+605+6312+(二)几何均数(G)适用于原始数据分布不对称,但经对数转换后呈对称分布的资料。G= n X1X2XnG=lg-1( )lgXn G=lg-1( )f lgXf(二)几何均数(G)适用于原始数据分布不对称,但经对数转换后例:40名麻疹易感儿童接种麻疹疫苗后一个月,测其

4、血凝抑制抗体滴度,结果如表所示,求几何均数。抗体滴度人数 f滴度倒数 XlgX1:41:81:161:321:641:1281:2561:512145811641481632641282565120.60210.90311.20411.50511.80612.10722.40822.7093G=lg-1(f lgXn)=lg-1(1 0.6021+4 0.9031+ +1 2.7093)40例:40名麻疹易感儿童接种麻疹疫苗后一个月,测其血凝抑制抗体=lg-1(4067.1282)=48G=1:48=lg-1(4067.1282)=48G=1:48(三)中位数(M)适合于表达偏态资料、或分布不

5、明的资料的平均水平,尤其适合于表达只知数据的个数、但部分较大或较小数据的具体数值未准确知道的资料的平均水平。(三)中位数(M)适合于表达偏态资料、或分布不明的资料的平均对于原始数据和频数分布表资料,分别用下列两式计算中位数。M=(X n/2+X(n/2+1) )/2 (n为偶数)X(n+1)/2(n为奇数)M = LM + iMfM(n2 fL ) 其中, LM :中位数所在组下限; iM :中位数所在组的组距; fM :中位数所在组的频数; fL :中位数所在组前一组的累计频数。2对于原始数据和频数分布表资料,分别用下列两式计算中位数。M=例2-4 表2.3 107正常人的尿铅含量(g/L)

6、的中位数计算表含量( g/L ) (1)频数f(2)累计频数 f (3)累计频率 % (4)0481216202428合计1422291815612107143665839810410510713.0833.6460.7577.5791.5997.2098.13100.00M=8+ (107/2 - 36) = 10.41(g/L) 429例2-4 表2.3 107正常人的尿铅含量(g/L)的第三节 离散程度的描述例:设有三组同年龄、同性别儿童体重(kg)数据如下:甲组 26 28 30 32 34乙组 24 27 30 33 36丙组 26 29 30 31 34 第三节 离散程度的描述例:

7、设有三组同年龄、同性别儿童体重(描述离散程度的指标:极差、四分位数间距、方差、标准差及变异系数。描述离散程度的指标:一. 极差(全距,R)为一组同质观察值中最大值与最小值之差。甲组 R=34-26=8乙组 R=36-24=12甲组数据分布较乙组集中。一. 极差(全距,R)为一组同质观察值中最大值与最小值之差优点:计算简单缺点:1.没有充分利用样本信息,只考虑最大值与最小值之差异,不能反映组内其它观察值的变异度。2.样本含量越大,抽到较大或较小观察值的可能性越大,则极差可能越大,因此,样本含量悬殊时不宜用极差比较分布的离散度。所以,一般不用极差来反映离散程度。优点:计算简单二. 四分位数间距(Q

8、)二. 四分位数间距(Q)1.分位数的概念分位数是一种位置指标,一个特定的分位数将任何一个频数曲线下的面积分为两部分。第1四分位数记作Q1,第2、第3四分位数,分别记作Q2、Q3;第1百分位数,记作P1。同理,还有第2、第3、 、第99百分位数,分别记作P2、P3、 、P99。显然,Q1=P25、Q2=P50=M、Q3=P751.分位数的概念2.百分位数的计算公式对连续型变量频数表资料,按下式计算第X百分位数PX:PX=LX+iXfX(nX%fL )其中, LX :第X百分位数所在组下限; iX :第X百分位数所在组的组距; fX :第X百分位数所在组的频数; fL :第X百分位数所在组前一组

9、的累计频数。2.百分位数的计算公式iXfX(nX%fL )其中, LX例 某地200例正常成人血铅含量的频数分布如表所示,请计算出血铅含量的95%正常值范围。200例正常成人血铅含量的频数分布表 血铅含量 频数 累计频数 (mol/L) (1) (2)00.240.480.720.971.211.451.691.932.172.422.662.903.14648433628131444120165497133161174188192196197199199200解:即求P95。nX%=20095%=190P95 =1.69+ (190-188)0.24 4=1.81 (mol/L) 故某地正常

10、人血铅含量95%的单侧正常值范围的上限为 1.81 (mol/L)。 例 某地200例正常成人血铅含量的频数分布如表所示,请计算3.四分位数间距(Q)Q=P75-P25Q=QU-QL优缺点:用四分位数间距作为描述数据分布离散程度的指标,比极差稳定,但仍未考虑到每个数据的大小,常用于描述偏态频数分布以及分布的一端或两端无确切数值资料的离散程度。3.四分位数间距(Q)例2-10 据书中表2.3资料求四分位数间距Q。P25= 4+ 4 22(107 25%14)=6.32 (g/L)P75= 12+ 418(107 75%65)=15.39 (g/L)Q= P75 - P25=15.39-6.32=

11、9.07 (g/L)例2-10 据书中表2.3资料求四分位数间距Q。 4三.方差三.方差2=(X-)2NS2=(X-X)2n - 1 n - 1称为自由度2=(X-)2NS2=(X-X)2n - 1 n -四.标准差四.标准差 =(X-)2NS=(X-X)2n - 1直接法; s=X2-( X)2/n由于(X-X)2 =X2-( X)2/n,所以n - 1加权法: s= fX2-( fX)2/ff - 1(X-)2NS=(X-X)2n - 1直接法; 例2-12 求书中表2.2数据的标准差。解 f=130 fX=9246 fX2=662076 S= 662076-92462/130130-1=

12、 5.89(次/分)例2-12 求书中表2.2数据的标准差。130-1= 5.五. 变异系数(CV)CV=SX100%1.用于比较度量衡单位不同的多组资料的变异度。2.比较均数相差悬殊的多组资料的变异度。五. 变异系数(CV)SX100%1.用于比较度量衡单位六. 适用情况六. 适用情况第四节 正态分布第四节 正态分布一. 正态分布的概念和特征正态分布的图形:正态分布的密度函数:f(X)=1 2e-(X-)22 2-X+ 通常用N( , 2)表示均数为、方差为2的正态分布。一. 正态分布的概念和特征正态分布的图形:正态分布的密度函正态分布的特征1.正态曲线在横轴上方均数处最高;2.正态分布以均

13、数为中心,左右对称;3.正态分布有两个参数,即均数与标准差。 是位置参数,当固定不变时, 越大,曲线沿横轴越向右移动; 越小,曲线沿横轴越向左移动。 是变异度参数,当固定不变时, 越大,曲线越平阔; 越小,曲线越尖峭。4.正态曲线下的面积分布有一定的规律。正态分布的特征1.正态曲线在横轴上方均数处最高;常用的两个区间: 1.96 及2.58 的区间面积分别占总面积(或总观察例数)的95%及99%,如下图所示:95%2.5%2.5%-1.96 +1.96 99%-2.58 +2.58 0.5%0.5%常用的两个区间: 1.96 及2.58 的区间面二. 标准正态分布令 u=X- (u)=12e-

14、u22- u+ 用N(0,1)表示标准正态分布二. 标准正态分布X- (u)=12e-u22- 三. 正态分布的应用制定医学参考值范围许多统计方法的理论基础三. 正态分布的应用制定医学参考值范围参考值范围的制定正态分布法 百分位数法%909599双侧X1.64SX1.96SX2.58S 单只有下限X-1.28SX-1.64SX-2.33S 侧只有上限X+1.28SX+1.64SX+2.33S双侧P5P95P2.5P97.5P0.5P99.5 单只有下限P10P5P1侧只有下限 P90 P95 P99参考值范围的制定正态分布法 补充题 以下是101名30-49岁正常成年男子的血清总胆固醇(mmo

15、l/L)测定值的频数表,请据此资料:(1)选择适当的集中趋势指标并计算之;(2)选择适当的离散程度指标并计算之;(3)求该地30-49岁健康男子血清总胆固醇的正常值范围;(4)估计该地30-49岁健康男子血清总胆固醇值小于4.50 mmol/L的概率。血清总胆固醇2.53.03.54.04.55.05.56.06.57.07.5合计频数f1892325179621101fx2.752633.7597.75118.7589.2551.7537.513.57.25478.25fx27.5684.50126.56415.44564.06468.56297.56234.3891.1352.562342

16、.31补充题 以下是101名30-49岁正常成年男子的血清总胆固data samp2_1;input x;cards;75 76 72 69 66 72 57 68 71 72 69 72 7382 80 82 67 69 73 64 74 58 70 64 60 7766 77 64 67 76 75 75 71 65 62 76 72 7160 67 75 75 73 79 66 69 79 78 70 72 7072 78 72 67 72 80 68 70 61 70 73 72 7181 70 66 75 71 63 77 74 76 68 65 77 6977 75 79 64 7

17、9 73 76 61 80 64 69 70 7369 68 65 70 69 66 81 63 64 80 74 78 7684 66 70 73 60 76 82 73 64 65 73 73 6380 68 76 70 79 77 64 70 66 69 73 78 76;例2.1data samp2_1;例2.1proc univariate;output out=aa max=max min=min mean=m std=s median=medq1=p25 q3=p75 qrange=q mode=mode range=r;proc print data=aa;data samp2

18、11;set aa;p1=m-1.96*s;p2=m+1.96*s;proc print;var p1 p2;data samp212;set samp2_1;if 56x59 then x=56; if 59=x62 then x=59;if 62=x65 then x=62; if 65=x68 then x=65;if 68=x71 then x=68; if 71=x74 then x=71;if 74=x77 then x=74; if 77=x80 then x=77;if 80=x83 then x=80; if 83=x|T| 0.0001 Range 27 Num = 0 1

19、30 Num 0 130 Q3-Q1 9 M(Sign) 65 Pr=|M| 0.0001 Mode 70 Sgn Rank 4257.5 Pr=|S| 0.0001 Extremes Lowest Obs Highest Obs 57( 7) 81( 98) 58( 22) 82( 14) 60( 109) 82( 16) 60( 40) 82( 111) 60( 25) 84( 105) OBS M S MAX P75 MED P25 MIN R Q MODE 1 71.3154 5.80168 84 76 72 67 57 27 9 70 OBS P1 P2 1 59.9441 82.6

20、867 Cumulative Cumulative X Frequency Percent Frequency Percent - 56 2 1.5 2 1.5 59 5 3.8 7 5.4 62 12 9.2 19 14.6 65 15 11.5 34 26.2 68 25 19.2 59 45.4 71 26 20.0 85 65.4 74 19 14.6 104 80.0 77 15 11.5 119 91.5 80 10 7.7 129 99.2 83 1 0.8 130 100.0医学统计学-第2章课件data lx;input x f;cards;2.75 1 3.25 8 3.7

21、5 9 4.25 23 4.75 25 5.25 17 5.75 9 6.25 6 6.75 2 7.25 1;proc means;var x;freq f;output out=aa mean=m std=s;data b;set aa;p1=m-1.96*s;p2=m+1.96*s;proc print;var p1 p2;run;data lx; Analysis Variable : X N Mean Std Dev Minimum Maximum - 101 4.7351485 0.8816333 2.7500000 7.2500000 - OBS P1 P2 1 3.00715 6.46315 data lx2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论