医学资料的统计分析讲座_第1页
医学资料的统计分析讲座_第2页
医学资料的统计分析讲座_第3页
医学资料的统计分析讲座_第4页
医学资料的统计分析讲座_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学资料的统计分析概述包头医学院韦丽琴2013.7

一、科研定义

科研是科学研究(Scientificresearch)的简称。科研就是以科学的观点和方法,对未知事物进行探索、观测和分析,从而发展有关科学知识(理论和技术)的认识活动。

科研活动本身是以现有的现象、认知和习惯为基础的活动,凭借知识和经验预测科研可能达到的科学目的。

科研是一个提出问题,并解决问题的过程

科研创新(在不同层次对人们熟悉的思维方式高度抽象或转换,既发散思维)医学研究有无人观察性研究实验研究为干预现况调查回顾性研究前瞻性研究动物实验临床试验医学研究的类型科研选题研究设计

观察和实验(预实验和实施)

统计分析(资料整理和数据分析)总结(论文报告)提出问题解决问题研究结果医学科研的基本步骤二、统计工作中的步骤统计设计收集资料整理资料分析资料(一)、设计(design)

这里指的是统计设计。是科学研究成败的关键。因此必须重视。按照是否施加干预措施分为:观察性研究设计(obsevationalstudydesign)实验性研究设计(experimentalstudydesign)1)实验设计(experimentaldesign)2)临床试验设计(clinicaltrialdesign)科研设计研究设计包括:专业设计与统计设计专业设计:选题、查阅文献、建立假说、预试验、确定研究对象和技术方法等统计设计:围绕专业设计,确定统计设计类型、受试对象、样本大小、分组方法、观察指标、统计分析指标及统计分析方法等分析方法统计设计是控制误差、改善实验有效性和确定资料的分析方法,同时也是保证专业设计的布局合理性和实验结论可信性的关键因素。1、科研设计的基本内容确定研究方法

确定研究对象

确定样本大小

确定观察指标

5234明确研究目的1拟定预期分析内容、分析方法预实验或预调查

研究的质量控制

研究的组织工作

10789收集资料调查问卷

62、统计设计的主要内容1、确定统计设计的类型:调查设计、实验设计2、观察对象选择3、样本含量的估计4、具体研究方法(方案)5、统计分析指标(预期指标)6、统计分析方法设计的基本原则(1)对照(control):对照的形式(2)随机化(randomization):设计方案(完全随机设计、配对设计、区组设计、析因设计、、、)(3)重复(replication):样本含量(二)、收集资料(collectionofdata)

是指按照设计要求准确可靠的收集原始数据。资料的来源:1、统计报表2、经常性工作记录3、专题调查或实验4、统计年鉴和统计数据专集(三)、整理资料(sortingdata)是将原始数据系统化、条理化。为下一步计算和分析打好基础。主要是通过分组来实现。质量分组和数量分组(四)、分析资料(analysisofdata)又称统计分析包括:1、统计描述(statisticaldescription)2、统计推断(statisticalinference)目的是表达数据的特征,阐明事物的内在联系和规律。统计描述统计推断指标描述图表描述参数估计假设检验统计分析三、资料类型计量资料(measurementdata):对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。计数资料(countdata):将观察单位的观察结果安某种属性或类别分组,分别统计各组的观察单位数所得的资料称为计数资料。其观察值是定性的,表现为两个或多个互不相容的类别或属性。等级资料(ordinaldata):将观察单位的结果安某种属性的程度或等级分组,分别统计各组的观察单位数所得的资料称为等级资料。资料转换不同类型的变量可以进行转化,一般由高级向低级转化。

定量定量(记分)

半定量(有序多分类)二分类(计数)Fisher(英)在他的著作中多次强调,统计学家与科学研究者的合作应该在实验设计阶段,而不是在需要数据处理的时候。“试验完成后再找统计学家,无异于请统计学家为试验进行“尸体解剖”。统计学家或许只能告诉你试验失败的原因。”四、医学研究中的统计方法的应用

以正确的方式收集数据以正确的指标描述数据的统计特征以适合的统计分析得出正确结论(一)、计量资料统计分析1、统计描述:集中趋势、离散趋势指标平均数:(均数、几何均数、中位数)

变异指标:(全距、四分位数间距、离均差平方和、方差或均方、标准差、变异系数)

均数和标准差----正态中位数和四分位数间距---偏态2、统计推断:参数估计点值估计可信区间估计1、比较平均数的差别-------假设检验:t、z、F、T检验等2、确定相互间的关系:直线相关、直线回归、多重线性回归、logistic回归等分析Z检验、t检验、方差分析的应用条件各样本是相互独立的随机样本;各样本来自正态总体;各处理组总体方差相等,即方差齐性或齐同(homogeneityofvariance)。两均数比较大样本的---z检验、方差分析

小样本的---t检验、方差分析多个样本均属比较的----方差分析

完全随机设计的资料例6-1为研究茶多酚保健饮料对急性缺氧的影响,将60只小白鼠随机分为低、中、高三个剂量组和一个对照组。每组15只小白鼠。对照组每天给予蒸馏水0.25ml灌胃,低、中、高剂量组分别给予2.0g∕kg、4.0g∕kg、8.0g∕kg的饮料溶于0.2~0.3ml蒸馏水后灌胃。每天一次,40天后,对小白鼠进行耐缺氧存活时间试验,结果如表10-1。试比较不同剂量的茶多酚保健饮料对延长小白鼠的耐缺氧存活时间有无差别。对照组低剂量组中剂量组高剂量组合计21.3123.1427.4819.5418.0324.0322.8218.7223.4620.3426.9819.5617.3924.3716.0120.1624.4921.3219.4625.6328.8118.7418.4226.1325.2420.2322.4729.3820.1622.5135.0728.1124.7429.7922.6823.0128.3229.0424.3333.9721.8628.6525.1334.4431.6930.2336.8438.6127.1328.7933.2431.6828.2938.4735.1028.0123.3728.4434.2235.081521.54533.42741522.87673.55561528.05534.23941531.83334.53736026.07775.6642表6-2各组小白鼠耐缺氧时间/min讲述抽样误差的概念时提到,从同一总体中随机抽取样本,所得样本均数与总体均数以及样本均数与样本均数间是不同的,它们之间的差称抽样误差,在抽样研究中抽样误差是不可避免的,是必然存在的。具体到本例两均数不同的可能原因有两种:①所有的样本是来自同一个总体,其均数之间的差异仅仅是由抽样误差所致。②该样本不是来自同一总体,是来自另外一个总体(某县),其均数间差异是由不同处理因素所致。如何判断是由那种原因所致,统计上是通过假设检验,按照小概率原理和反证法相结合来回答这个问题。假设检验的方法很多,但其检验的步骤是一致的。基本步骤如下:

检验假设的基本步骤1.

建立检验假设,确定检验水准进行假设检验首先必须建立检验假设,假设有两种:一是无效假设(nullhypothesis)或称零假设,用H0表示,二是备择假设(alternativehypothesis)或称对立假设,用H1表示。两者都是根据推断目的提出的对总体特征的假设,H0是从反证法的思想提出的,两者既有联系又是一对对立的假设。2.

计算检验统计量

应根据资料的类型、设计方案、统计推断目的和适用条件选择检验统计量。如:统计量t,t’,u、z、F、T、H、等。注意:所有的检验统计量都是在H0成立的前提下计算出来的。统计分析方法选择:1.对于正态分布且方差齐同的资料,常采用完全随机设计的单因素方差分析(one-wayANOVA)或两样本t检验(k=2);2.对于非正态分布或方差不齐的资料,可进行数据变换或采用非参数统计的秩和检验(T检验、H检验)。随机区组设计的资料配对设计配伍设计例6-3为探索丹参对肢体缺血再灌注损伤的影响,将30只纯种新西兰实验用大白兔,按窝别相同、体重相近划分为10个区组。每个区组3只大白兔随机采用A、B、C三种处理方案,即在松止血带前分别给予丹参2ml/kg、丹参1ml/kg、生理盐水2ml/kg,在松止血带前及松后1小时分别测定血中白蛋白含量(g/L),算出白蛋白减少量如下表6-8所示,问A、B两方案分别与C方案的处理效果是否不同?区组A方案B方案C方案12.212.914.2533.123322.322.644.5633.173333.153.674.3333.716741.863.293.8933.013352.562.453.7832.930061.982.744.6233.113372.373.154.7133.410082.883.443.5633.293393.052.613.7733.1433103.422.864.2333.503310101030()2.58002.97604.17003.2420()0.27430.15810.16050.6565()

表6-8A、B、C三种方案处理后大白兔血中白蛋白减少量(g/L)统计方法选择:1.正态分布且方差齐同的资料,应采用两因素方差分析(two-wayANOVA)或配对t检验(g=2);2.当不满足方差分析和t检验条件时,可对数据进行变换或采用随机区组设计资料的Friedman秩和检验(M检验)。另:SPSS的主要窗口和菜单1SPSS的3个主要窗口1-1数据编辑器窗口(SPSSDataEditor):用来编辑和显示数据;在此窗口中的文件名称为*.sav。1-2程序语句编辑器窗口(SPSSSyntaxEditor):用来编写各种程序;在此窗口中的文件名称为*.sps。1-3结果观看窗口(SPSSViewer):显示统计运算结果;在此窗口中的文件名称为*.spo。2SPSS数据编辑器的主要菜单2-1File菜单:文件管理New;Open;Save;Saveas;Exit。2-2Edit菜单:编辑Undo;Cut;Copy;Paste;Clear;Find;2-3View菜单:视图Fonts;Gridlines;Valuelabels。2-4Data菜单:数据整理definevariables;Insertvariables;Insertcase;gotocase;sortcase;selectcase。2-5Transform菜单:数据转换recode;compute;count。2-6Analyze菜单:统计2-7Graphs菜单:统计图2-8Utilities菜单:工具附件2-9Windows菜单:窗口2-10Help菜单:帮助4、SPSS10.0的分析(Analyze)功能:

一、报表Reports二、描述统计DescriptiveStatistics1、频数分析Frequencies2、描述统计Descriptives3、数据探索Explore

4、交叉表Crosstabs

三、均值比较CompareMeans1、平均数分析Means2、单一样本t检验One-SampleTTest3、独立样本t检验Independent-SamplesTTest4、配对样本t检验Paired-SampleTTest5、单因素方差分析One-WayANOVA

四、一般线性模型GeneralLinearModel1、单变量方差分析Univariate……五、相关分析Correlate

1、双变量相关Bivariate2、偏相关Partial3、距离相关Distances六、回归分析Regression1、线性回归Linear……七、对数线性Loglinear八、聚类分析Classify九、数据简化DataReduction十、尺度分析Scale十一、非参数检验NonparametricTests

1、卡方检验Chi-Square2、

二项式检验Binomial3、

游程检验Runs

4、

单样本柯—斯检验1-SampleK-S5、

两个独立样本检验2IndependentSamples6、

多个独立样本检验KIndependentSamples7、

两个相关样本检验2RelatedSamples8、

多个相关样本检验KRelatedSamples十二、存活分析Survival十三、多项选择MultipleResponse

二、描述性统计:

例1:某市120名12岁男孩身高(cm)资料如下:试作描述性统计分析。142.3156.6142.7145.7138.2141.6142.5130.5134.5148.8134.4148.8137.9151.3140.8149.8145.2141.8146.8135.1150.3133.1142.7143.9151.1144.0145.4146.2143.3156.3141.9140.7141.2141.5148.8140.1150.6139.5146.4143.8143.5139.2144.7139.3141.9147.8140.5138.9134.7147.3138.1140.2137.4145.1145.8147.9150.8144.5137.1147.1142.9134.9143.6142.3125.9132.7152.9147.9141.8141.4140.9141.4160.9154.2137.9139.9149.7147.5136.9148.1134.7138.5138.9137.7138.5139.6143.5142.9129.4142.5141.2148.9154.0147.7152.3146.6132.1145.9146.7144.0135.5144.4143.4137.4143.6150.0143.3146.5149.0142.1140.2145.4142.4148.9146.7139.2139.6142.4138.7139.9操作方法:A、定义变量属性:名称Name——身高,……B、数据录入:在DATA窗口第一列录入上述数据。

C、选择统计分析方法:分析Analyze→描述性统计DescriptiveStatistics

→次数分配表Frequencies→主对话框。D、主对话框:选定身高进入分析变量框。

E、分别选定“统计量”、“图表”和“格式”按钮出现下面三个次级对话框。根据研究需要进行统计指标选择后,按“继续”按钮返回主对话框。

选择:四分位数、2个百分位数、全部集中趋势和离散趋势指标、偏态和峰度系数。作直方图并附正态曲线。变量按升序排列、变量分5组F、经过上述选择后在主对话框按“确定OK”按钮,产生如左表的描述性结果。12岁男孩的身高次数分布直方图

均数比较:t检验、u检验、F检验(q检验)1、两个小样本资料均数的比较t检验(t,检验——两个方差不齐性的小样本资料):

例2:将27例确诊为肠憩室患者随机分为两组,分别给予甲、乙两种饮食,观察饮食排出时间(小时)结果如下,试问两种饮食对肠蠕动效果有无差别?甲饮食组7675445551666968526071627075乙饮食组977479839510198955264688883

已知:n1=14

n2=13

x1=63.86

x2=82.85S1=10.11

S2=15.00A、数据录入。B、分析Analyze

→比较平均数法CompareMeans

→独立样本T检验Independent-SamplesTTest→主对话框。C、把排除时间送入检验变量框↓把分组送入分组变量框↓定义组别↓按“选项”按钮↓次级对话框。D、输入置信区间(95%)↓按“继续”按钮↓返回主对话框。GroupStatistics1463.857110.11362.70301382.846215.00474.1616分组甲饮食组乙饮食组排出时间NMeanStd.DeviationStd.ErrorMeanIndependentSamplesTest1.659.210-3.88225.001-18.98904.8911-29.06-8.92-3.82720.837.001-18.98904.9623-29.31-8.66EqualvariancesassumedEqualvariancesnotassumedFSig.Levene'sTestforEqualityofVariancestdfSig.(2-tailed)MeanDifferenceStd.ErrorDifferenceLowerUpper95%ConfidenceIntervaloftheDifferencet-testforEqualityofMeansE、在主对话框中按“确定”按钮→产生结果(见上图)。上表是分组描述性统计结果,下表t检验结果:4、单因素方差分析及多组样本均数的两两比较:

例4:为研究某药物的抑癌作用,将一批小白鼠致癌后随机分为四组,三个实验组分别注射不同剂量的药物(0.5ml、1.0ml、1.5ml),一个对照组不用药,一定时间后测定四组小白鼠的癌肿重量(g)结果见下表,试比较不同剂量的药物的抑癌作用。对照组实验A组实验B组实验C组3.63.00.43.34.52.31.71.24.22.42.30.04.41.14.52.73.74.03.63.05.63.71.33.27.02.73.20.64.11.93.01.45.02.62.11.24.51.32.52.1

A、数据录入→分析Analyze→比较平均数法CompareMeans

→单因素方差分析One-WayANOVA

→主对话框。B、把肿瘤重量送入检验变量框↓把分组送入因子框。C、按PostHoc检验按钮↓点击LSD和Tamhane’sT2检验复选框↓输入显著性水平(0.05)↓按“继续”按钮→返回主对话框。Descriptives描述性结果肿瘤重量104.66001.0091.31913.93825.38183.607.00102.5000.9309.29441.83403.16601.104.00102.46001.1843.37451.61283.3072.404.50101.87001.1576.36611.04192.6981.003.30402.87251.4913.23582.39553.3495.007.00对照组实验A组实验B组实验C组TotalNMeanStd.DeviationStd.ErrorLowerBoundUpperBound95%ConfidenceIntervalforMeanMinimumMaximumD、按“选项”按钮↓次级对话框点击描述性统计量复选框↓按“继续”按钮↓返回主对话框。

E、在主对话框中按“确定”按钮→产生结果(见下图)。TestofHomogeneityofVariances方差齐性检验LeveneStatisticdf1df2Sig.0.517

3

36

0.673

均值图ANOVA方差分析表肿瘤重量45.091315.03012.992.00041.649361.15786.74039BetweenGroupsWithinGroupsTotalSumofSquaresdfMeanSquareFSig.MultipleComparisons多重比较表(q检验)DependentVariable:肿瘤重量2.1600*.4810.001.87703.44302.2000*.4810.002.74263.65742.7900*.4810.0001.35274.2273-2.1600*.4810.001-3.4430-.87704.000E-02.48101.000-1.37621.4562.6300.4810.733-.76492.0249-2.2000*.4810.002-3.6574-.7426-4.0000E-02.48101.000-1.45621.3762.5900.4810.854-.95662.1366-2.7900*.4810.000-4.2273-1.3527-.6300.4810.733-2.0249.7649-.5900.4810.854-2.1366.9566(J)分组实验A组实验B组实验C组对照组实验B组实验C组对照组实验A组实验C组对照组实验A组实验B组(I)分组对照组实验A组实验B组实验C组LSDMeanDifference(I-J)Std.ErrorSig.LowerBoundUpperBound95%ConfidenceIntervalThemeandifferenceissignificantatthe.05level.在0.05水平上平均数差异显著。*.多重比较不能用两样本均数比较的t检验!

若用两样本均数比较的t检验进行多次重复比较,将会加大犯Ⅰ类错误(把本无差别的两个总体均数判为有差别)的概率。(二)、无序分类资料统计分析1、统计描述:相对数指标率构成比相对比

率的抽样误差:2、统计推断:参数估计:点值估

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论