临床常用的统计学方法课件_第1页
临床常用的统计学方法课件_第2页
临床常用的统计学方法课件_第3页
临床常用的统计学方法课件_第4页
临床常用的统计学方法课件_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、平均数:反映一组观察值的平均水平。常用的平均数有算术均数,几何均数和中位数。(一)算术均数(mean):简称均数,总体均数用希腊字母表示,样本均数用拉丁字母 表示。 1. 计算方法 1) 直接法: 其中X1,X2Xn为各变量值,n为样本例数。定量资料平均数计算平均数:反映一组观察值的平均水平。定量资料平均数计算 2) 加权法: f1,f2fn分别为各组段的频数,X1,X2X0 为各组段的组中值, 组中值=(本组段下限+下组段下限)/2。权即频数多,权数大,作用也大,频数小,权数小,作用也小。 2) 加权法: 权即频数多,权数大,作用例: 测得8只正常大白鼠总酸性磷酸酶(TACP)活性(U/L)

2、为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其算术均数。例: 测得8只正常大白鼠总酸性磷酸酶(TACP)活性(U/例 :已知正常人血清白蛋白水平呈对称分布,某检验师测得10人白蛋白含量(单位g/L)如下:35、35、44、52、44、40、40、38、41、42,求10人血清白蛋白平均数。 例 :已知正常人血清白蛋白水平呈对称分布,某检验师测得10人 均数的应用 但它最适用于对称分布资料,尤其是 正态分布资料。因为这时均数位于分布的中心,最能反映资料的集中趋势。 均数的应用 但它最适用于对称分布资料,120名成年男子血清铁含量均数、标准差计算表(加权法

3、) 组段 频数(f) 组中值(X0) fX 0 (1) (2) (3) (4)=(2)(3) (5)=(3)(4) 6 8 10 12 14 16 18 20 22 24 26 2830 合计 120(f) 2228(fX0) 43640( )13681220271210841727661041803405133782762001082979111315171921232527294924372613522700578097477938634850002916841120名成年男子血清铁含量均数、标准差计算表(加权法) ( 二)几何均数(geometric mean): (几何均数也称为倍数均

4、数,用G表示) 1. 几何均数的计算方法 1) 直接法:适用于样本例数n较少的资料。 将n个观察值X1,X2,X3Xn的乘积开n次方对数形式:G=lg-1(lgX1+lgX2+lgX3+lgXn)/n =lg-1(lgX/n)( 二)几何均数(geometric mean): 例: 7名慢性迁延性肝炎患者的HBsAg滴度资料为1:16,1:32,1:32,1:64,1:64,1:128,1:512。求其平均效价。7份HBsAg的平均滴度为1:64 例: 7名慢性迁延性肝炎患者的HBsA几何均数应用的注意事项: 1)几何均数常用于等比级数资料或资料呈倍数关系或对数正态分布资料。 2)观察值中不能

5、有0。 3)观察值中不能同时有正值和负值。几何均数应用的注意事项: 1)几何均数常用临床常用的统计学方法课件 中位数(median,M):将一组变量值从小到大按顺序排列,位次居中的那个变量值就是中位数。 例:11名交通警察血铅值(单位gL)如下:32、45、46、50、57、59、61、65、71、71、100。已知交警的血铅值呈偏态分布,求平均血铅浓度。M=59(三)中位数和百分位数 中位数(median,M):将一组变量值从小 百分位数(percentile, Px):指把数据从小到大排列后位于第X%位置的数值。有n个观察值X1,X2Xn,把他们由小到大按顺序排列成X1X2X3Xn,将这n

6、个观察值平均的分为100等份,对应于每一等份的数值就是一个百分位数,对应于前面X%个位置的数值称为第X百分位数,用Px表示。 四分位间距:P25,P50,P75例:计算1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11-,99, 100的P25,P50,P75 。P25=25P50=50.5P75=75 百分位数(percentile, P 2. 中位数和百分位数的应用 1)中位数常用于描述偏态分布资料的集中趋势,反映位次居中的观察值的平均水平。在对称分布的资料中,中位数和均数在理论上是相同的,(但在使用过程中不能混用)。 2)百分位数可用于确定医学参考值范围(详后)。 3)分

7、布在中部的百分位数相当稳定,具有较好的代表性,但靠近两端的百分位数,只有在样本例数足够多时才比较稳定。 2. 中位数和百分位数的应用 1. 极差(range ,R) 二、描述离散趋势的特征数例: 试观察3组数据的离散情况。A组 26 28 30 32 34 B组 24 27 30 33 36 C组 20 23 30 37 401. 极差(range ,R) 二、描述离散趋势2. 标准差(standard deviation ,S) 总体标准差样本标准差 式中n-1是自由度,为随机变量能自由取值的个数。它描述了当 选定时n个变量值中能自由变动的变量值的个数。 2. 标准差(standard de

8、viation ,S) SS=lxx= =X2-(X)2/n(1) 直接法:适用于n较小的资料求例题中A组数据的标准差。(2) 加权法:适用于n较大的资料SS=lxx= =* 标准差的应用: 1) 表示变量分布的离散程度。 2) 结合均数计算变异系数。 3) 结合样本含量计算标准误。 4)结合均数描述正态分布特征。* 标准差的应用: 1) 表示变量分布的离散程度。 3. 四分位数间距(quartile range ,Q) 简记为Q,可看为特定的百分位数。 P25表示全部观察值中有25%(1/4)的观察值比它小,记为下四分位数QL , P75表示全部观察值中有25%(1/4)的观察值比它大,记为

9、上四分位数QU。 Q适用于各种类型的连续型变量,特别是偏态分布的资料。 3. 四分位数间距(quartile range ,Q 一、正态分布的概念 常用概率分布 第一节 正态分布 正态分布是自然界最常见的一种分布,若指标X的频率分布曲线对应于数学上的正态分布曲线,则称该指标服从正态分布。 一、正态分布的概念 临床常用的统计学方法课件临床常用的统计学方法课件 正态分布的特征 1. 即正态分布以均数为中心,左右对称。 2.表现为 钟形曲线。即正态曲线在横轴上方均数处最高。 正态分布的特征 1. 即正态分布以均数为t分布的概念 在统计应用中,可以把任何一个均数为,标准差为的正态分布N(,2)转变为=

10、0,=1的标准正态分布,即将正态变量值X用 来代替。 第二节 t 分布也服从正态分布,服从标准正态分布N(0,1)服从=n-1的t分布t分布的概念 第二节 t 分布也服从正态分布,服从临床常用的统计学方法课件t分布曲线特点: 1) t分布曲线是单峰分布,它以0为中心,左右对称。 2)t分布的形状与样本例数n有关。自由度越小,则 越大,t 值越分散,曲线的峰部越矮,尾部翘的越高。 3) 当 n时,则S逼近,t分布逼近标准正态分布。t分布不是一条曲线,而是一簇曲线。t 分布的图形和t 分布表t分布曲线特点:t 分布的图形和t 分布表 t 检验二、配对设计资料的t 检验*配对t检验 配对设计是研究者

11、为了控制可能存在的主要非处理因素而采用的一种试验设计方法。形式:(1)同一样品分成两份,用2种方法测定,比较两种方法测定结果是否存在差异。(2)同一受试对象处理前后,数据作对比。(3)其他 t 检验二、配对设计资料的t 检验*配对t检例ALBK法和高铁硫酸比色法测得血清总胆固醇含量如表,问两法测定结果是否有差别。例ALBK法和高铁硫酸比色法测得血清总胆固醇含量如表,问两假设检验步骤:假设检验步骤:临床常用的统计学方法课件*两组独立样本资料的t 检验 将受试对象随机分配成两个处理组,每一组随机接受一种处理。1、一般把这样获得的两组资料视为代表两个不同总体的两份样本,据此推断其对应的总体均数是否相

12、等。2、从两个人群分别随机抽取一定数量的观察对象,测量某项指标进行比较,在实际工作中这类资料也按完全随机设计的两样本比较来对待。*两组独立样本资料的t 检验 将受试例 某口腔科测得长春市1316岁居民男性20人的恒牙腭弓深度均值为17.15mm,标准差为1.59mm;女性34人的均值为16.92mm,标准差为1.42mm。根据这份数据可否认为该市1316岁居民腭弓深度有性别差异?例 某口腔科测得长春市1316岁居民男性20人的恒牙腭弓检验步骤:检验步骤:查t 临界值表:t0.5/2,50=0.679 t 0.5 按=0.05水准不拒绝H0,故还不能认为该市1316岁居民腭弓深度有性别差异。t0

13、.4,50=0.849, t0.4,60=0.848采用内插法得: t0.4,52的值查t 临界值表:t0.5/2,50=0.679t0.4,5例:某研究者调查了10名卵巢恶性肿瘤患者和10名对照血浆尿激酶型纤溶酶原激活物(uPA)含量,结果见下表,问两组uPA含量是否存在差别例:某研究者调查了10名卵巢恶性肿瘤患者和10名对照血浆尿激方差分析方差分析研究因素为k个:当k2时,两组总体均数比较是否相等可采用前面介绍的t检验(当然也可采用今天所介绍的方差分析)当k2时,即检验两组以上的总体均数是否相等时,t检验已不能满足要求,需采用方差分析(analysis of variance ,ANOVA

14、) 研究因素为k个:例某医生为研究一种降糖新药的疗效,以统一的纳入标准和排除标准选择了60名2型糖尿病患者,按完全随机设计方案将患者分为三组进行双盲临床试验。其中,降糖新药高剂量组21人,低剂量组19人,对照20人。对照组服用公认的降糖药物,治疗4周后测得其餐后2小时血糖的下降值(mmol/L),结果如表所示。问治疗4周后,餐后2小时血糖下降值的总体平均水平是否不同?例某医生为研究一种降糖新药的疗效,以统一的纳入标准和排除标表2型糖尿病患者治疗4周后餐后2小时血糖下降值(mmol/L) 高剂量组 (i=1) 低剂量组 (i=2) 对照组 (i=3)合计5.616.3-0.62.012.42.7

15、9.511.85.75.60.97.86.014.612.87.07.06.98.74.94.17.93.91.59.28.1-1.84.31.69.45.03.8-0.16.46.43.83.56.16.37.03.07.55.813.212.75.43.98.48.016.59.83.12.212.215.59.212.66.06.011.8211920609.19525.80005.43006.865017.360518.186712.384318.4176表2型糖尿病患者治疗4周后餐后2小时血糖下降值(mmol/临床常用的统计学方法课件方差分析表变异来源SSdfMSFP组间(处理组间)

16、176.7612288.38065.5370.01组内(误差)909.87235715.9627总1086.633559方差分析表变异来源SSdfMSFP组间(处理组间)176.7例 :老年甲状腺功能异常患者和对照组血清总高半胱氨酸(homocysteine, HCY)水平如表3,问老年甲状腺功能亢进、低下和正常组之间HCY水平有无差异? 例 :老年甲状腺功能异常患者和对照组血清总高半胱氨酸(hom定性资料的统计描述 第一节 定性变量的分布特征一、定性资料的频数分布 构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 构成比= 某一组成部分的观察单位数同一事物内部各组成

17、部分的观察单位总数100%常用来表示疾病或死亡的顺位、位次或所占比重。 定性资料的统计描述 第一节 定性变量的分布疾病种类 死亡人数 百分比(%)恶性肿瘤 50 33.33呼吸系统疾病 30 20.00消化系统疾病 20 13.33循环系统疾病 40 26.67传染病 10 6.67合计 150 100.00表 某医院2001年住院病人5类疾病的死亡情况构成比的两个特点: 1)各构成部分的相对数之和为100%。 2)构成比的各构成部分之间存在着相互影响, 某一部分的增减会引起其他部分的相应变化。疾病种类 (一)频率型指标:近似的反映某一事件出现的机会大小,如发病率、死亡率、不合格率。 相对数都

18、是由两个有联系的指标之比。大致有三种类型:频率、强度和相对比。 某事件发生的个体数 可能发生某事件的个体数频率 =KK:比例基数选择K的原则:使算得的率至少保留12位整数。(一)频率型指标:近似的反映某一事件出现的机会大小,如发病率例: 某医院1998年在某城区随机调查了8589例60岁及以上老人,体检发现高血压患者为2823例。60岁以上老人高血压患病率为:2823 / 8589 100% = 32.87% 。例: 某医院1998年在某城区随机调查了8589例60岁及以某医院某月各科室住院病人数及死亡人数科室 病人数 死亡人数 死亡构成(%) 病死率(1/千分)内 科 350 25 30.8

19、6 71.43 外 科 650 30 37.04 46.15肿瘤科 120 20 24.69 166.67妇产科 300 5 6.17 16.67皮肤科 56 0 0 0眼 科 45 0 0 0小儿科 100 1 1.24 10.00合计 1621 81 100.00 49.97某医院某月各科室住院病人数及死亡人数科室 病人数 2 检 验 (chi-square test) 主要应用:推断两个或多个样本率及构成比之间有无差别。 2 检 验 (chi-square test) 主要应一、 二分类情形22列联表例 某医师研究用兰芩口服液与银黄口服液治疗慢性咽炎疗效有无差别,将病情相似的80名患者随

20、机分成两组,分别用两种药物治疗,结果见下表:一、 二分类情形22列联表药物疗效合计有效无效兰芩口服液41(36.56)4(8.44)45银黄口服液24(28.44)11(6.56)35合计651580慢性咽炎两种药物疗效资料药物疗效合计有效无效兰芩口服液41(36.56)4(8.44临床常用的统计学方法课件二、多分类的情形2C列联表例: 1986年某地城市和农村20至40岁已婚妇女避孕方法情况,如下表,试分析该地城市和农村避孕方法的总体分布是否有差别?组别避孕方法合计节育器服避孕药避孕套其他城市1533316540391农村320754318456合计47310820858847 城市和农村避孕方法比较二、多分类的情形2C列联表例: 1986年某地城市和农村临床常用的统计学方法课件秩和检验秩和检验临床常用的统计学方法课件 线性相关分析 线性相关分析一、直线相关的概念及其统计描

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论