版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、SPSS软件基本统计分析应用介绍医学统计学中软件应用一、统计软件概述从20世纪60年代开始,统计软件(statistical software)在数量和质量上有了很大的发展,应用最早、范围最广、最完善的三种软件是: SAS(Statistical Analysis System) -美国SAS研究公司 SPSS(Statistical Package for the Social Science) - 美国SPSS研究公司 BMDP(Biomedical Computer Programs) -美国加利福尼亚大学此外,SYSTAT、 STATA 、STATISTICA 90年代后这些软件包都开
2、发出Windows下版本,使用更加方便. 国内也有:原上海医科大学的POMS、原华西医科大学的PEMS、第四军医大学的SPLM、北京万通电子技术公司的SDAS、上海第二医科大学的Exact-P 等等汉化版的。 还有一些数据管理软件也有一些统计分析功能:Fox base 、Excel 、Fox pro、 EPI INFO、 Epi data等等。二、统计软件包的评价和选择1、实用性:良好的用户界面,灵活的处理方式,简明的语句或命令。2、数据文件的管理:进行数据录入、查询、修改、转换、选择等功能。即兼容性好。数据文件扩张名: SPSS-.sav DATA-.dat dBbaseFox-.dbf e
3、xcel-.xls EPI-.rec SAS-sas3、统计分析功能: 包括统计设计、统计描述、统 计推断所涉及到的统计分析。4、编辑功能5、处理数据的容量:流调资料6、在线帮助功能 提供随时可用的有关方法操作步骤地帮助功能7、统计绘图和制表 1、SPSS的特点: SPSS涵盖了统计学各方面的基本内容,并具有较强的图表生成功能。 SPSS有良好的用户界面,采用Windows的窗口方式展示各种分析方法的功能,用键盘录入数据,操作只需通过鼠标点击“菜单”、“图标按钮”、“对话框”来完成。 。 SPSS用与Excel相似的表格和菜单进行统计处理,使用者无需编程序,记命令,无需精通统计学。通过菜单选择
4、就可以完成统计处理任务, SPSS清晰、直观、方便、易学易用。 2、SPSS的启动(详见下图所示)。第二节 数据文件的建立一、启动:二、退出: 点击“开始” “程序” “SPSS for Windows” “SPSS10.0 for Windows” 出现SPSS的数据窗口开始选择菜单,共有六种选择项。第一讲 SPSS数据编码录入进入SPSS之前的准备工作2-1-2 编码的概念: 根据一定的规则将研究资料转换为可进行统计分析的数码资料的过程。问题025:您认为打工的外地人对北京市的社会秩序是否有影响?(单选)1有很大影响 2有较大影响 3没有影响 4不好说 4编码答案2-1-3编码的步骤:1)
5、确定变量;变量:用来反映文意概念的量化形式。在统计中往往指最小的分析单位。编码就是对变量进行编码。变量由两个部分构成:变量名和变量值。要注意区分何为变量,何为变量值。在调查问卷中还要注意区分问题和变量。问题009:您有几个儿子?几个女儿? 1儿子_人 2女儿_人 23问题变量1变量2变量1的值变量2的值直接过录0-1编码变量名: 一个数据文件中,一个变量只能有一个唯一名称。码位:某一变量在数据文件中占据的栏位码数:某一变量由几位数组成。该变量是数值型(Numeric)如定距、定比,还是字串型(String),如定类、定序。前者在统计中可以做高级运算,后者则不可以。不适于被访人回答的问题的编码。
6、一般采用7,97,997等。被访人回答不知道时的编码。一般采用8,98,998等。被访人拒绝回答某变量时的编码。一般采用9,99,999等。问卷中出现漏答时的处理编码。一般采用9,99,999等。231000112-2 数据录入外部式录入内部式录入采用DOS、WPS、CCED等软件,按ASCII码方式录入成文本文件(*.dat;*.txt)。这种录入方式的特点是,数据之间没有间隔,录完一个数码后自动后移,录入速度较快。缺点是容易错位。采用SPSS数据编辑器(SPSS Data Editor)录入。其优点是不容易错位,缺点是不能自动后移,录入速度慢,数据错误不容易修改。作业:将问卷填答好,并做出
7、问题001问题011的编码表,将自己的答案在问卷上编码。下一节课带问卷上机。练习:SPSS数据定义的命令共有4个,分别用来定义数据的变量名、变量名标签、变量值标签和缺失值。1 变量名定义命令:Data List1-1命令格式:Data List File=原始数据文件名(*.dat)/变量1名 码位 变量2名 码位变量n名 码位.这些数据定义命令都要写在SPSS的语句窗口(Syntax)里,而后运行。2 变量名标签定义命令:Variable labels 该命令是给变量名一个说明标注。2-1 命令格式: Variable labels 变量1名 标签 /变量2名 标签 /变量3名 标签 /变量
8、n名 标签 .示例:Variable Labels num 编号 /W01 性别/W01a 出生年 /W02 婚姻状况 /W03 文化程度 .或: Variable Labels num 编号 /W01 性别/W01a 出生年 /W02 婚姻状况 /W03 文化程度 .或: Variable Labels num 编号 W01 性别W01a 出生年 W02 婚姻状况 W03 文化程度 .2-2 要求:变量名要和已定义过的名称相一致;标签用中、西文均可,但长度不要超过120个字符,即60个汉字。练习:问卷 p1变量名标签定义并运行。3. 变量值标签定义命令:Value labels该命令是给变量
9、的每一取值加一个说明标注。3-1 格式: Value Labels 变量名 值1 标签 值2 标签 值3 标签 /变量名 值1 标签 值2 标签 值3 标签 .示例:Value labels W01 1男 2女/W02 1未婚 2已婚 3离婚后未再婚 4离婚后再婚 5丧偶后未再婚 6丧偶后再婚 7未婚同居/W03 1不识字或识字很少 2初小 3高小 4初中 5高中中专或中技 6大专 7大学本科 8研究生以上/W04 1不识字或识字很少 2初小 3高小 4初中 5高中中专或中技 6大专 7大学本科 8研究生以上 0不适用 .3-2 要求:变量名要和已定义过的名称相一致;标签用中、西文均可,但长度
10、不要超过60个字符,即30个汉字。练习:问卷问题001007的变量值标签定义并运行。4 缺失值定义命令:Missing Value4-1 格式: Missing Value 变量名 变量名 变量名(缺失值1,缺失值2,)/变量名 变量名 变量名(缺失值1,缺失值2,) .示例:Missing Value W01 W02 W03(9)/W04 (0,9)/W01a W8.1 W8.2 W8.3(99) .4-2 要求:缺失值的定义与前面的命令格式不同,它是按照缺失值的码位数来排列变量的。有相同码位数的变量放在一组。上机作业:1、在EXCEL下编辑器下录入问卷。2、运用SPSS的4个数据定义命令对
11、问卷的第一页进行定义。进入数据编辑窗口。变量属性设置窗口。1-2要求:变量名不能超过8个字符;变量名不能以数字开头;变量名中不能包含,/、?、等运算和逻辑符号。当相邻变量名称上存在顺序且码位相同时,可用简略方法 : W02 8 W03 9 W04 10.可换为 W02 to W04 8-10.当变量值是字符时,在码位后加(a);如:W7 12(a);当变量值包含小数时,在码位后加(n),n表示小数的位数。如:446.79,在录入时要录成44679,定义时为:W12 12-16(2);第三讲 SPSS的主要窗口和菜单1 SPSS的3个主要窗口1-1 数据编辑器窗口(SPSS Data Edito
12、r):用来编辑和显示数据;在此窗口中的文件名称为*. sav。1-2 程序语句编辑器窗口( SPSS Syntax Editor):用来编写各种程序;在此窗口中的文件名称为*. sps。1-3 结果观看窗口( SPSS Viewer):显示统计运算结果;在此窗口中的文件名称为*. spo。2 SPSS 数据编辑器的主要菜单2-1 File 菜单:文件管理 New;Open;Save;Save as;Exit。2-2 Edit 菜单:编辑 Undo;Cut;Copy;Paste;Clear; Find;2-3 View菜单:视图 Fonts;Grid lines;Value labels。2-4
13、 Data菜单:数据整理define variables;Insert variables;Insert case;go to case;sort case;select case。2-5 Transform菜单:数据转换recode;compute;count。2-6 Statistics菜单:统计2-7 Graphs菜单:统计图2-8 Utilities菜单:工具附件2-9 Windows菜单:窗口2-10 Help菜单:帮助第四讲 SPSS的单变量描述统计1 单变量描述统计介绍A变量的尺度:a 定类 Category Scale:只能计次b 定序 Ordinal Scale:计次、排序c
14、 定距 Interval Scale:计次、排序、加减d 定比 Ratio Scale:计次、排序、加减、乘除 4、SPSS10.0的分析(Analyze)功能: 一、报表 Reports 二、描述统计 Descriptive Statistics 1、频数分析 Frequencies 2、描述统计 Descriptives 3、数据探索 Explore 4、交叉表 Crosstabs 三、均值比较 Compare Means 1、平均数分析 Means 2、单一样本 t检验 One-Sample T Test 3、独立样本 t检验 Independent-Samples T Test 4、配
15、对样本 t检验 Paired-Sample T Test 5、单因素方差分析 One-Way ANOVA 四、一般线性模型 General Linear Model 1、单变量方差分析 Univariate 五、相关分析 Correlate 1、双变量相关 Bivariate 2、偏相关 Partial 3、距离相关 Distances六、回归分析 Regression 1、线性回归 Linear 七、对数线性 Loglinear八、聚类分析 Classify九、数据简化 Data Reduction 十、尺度分析 Scale十一、非参数检验 Nonparametric Tests 1、 卡方
16、检验 Chi-Square 2、 二项式检验 Binomial 3、 游程检验 Runs 4、 单样本柯斯检验 1-Sample K-S 5、 两个独立样本检验 2 Independent Samples 6、 多个独立样本检验 K Independent Samples 7、 两个相关样本检验 2 Related Samples 8、 多个相关样本检验 K Related Samples十二、存活分析 Survival十三、多项选择 Multiple Response 5、统计资料的分类及常用统计学处理方法: (1)计量资料(数值变量,一般有计量单位):参数统计,常用:平均数、标准差、u检验
17、、t检验、方差分析(F检验)、相关与回归、时间数列、多元分析等等(一般要求:资料服从正态分布、近似正态分布或对称分布、方差具有齐同性)。 (2)计数资料(无序分类变量):常用:率、构成比、X2检验等等。 (3)等级资料(有序分类变量):非参数统计,是介于计量资料和计数资料之间的半定量资料,常用:率、构成比、秩和检验、Ridit分析等等。 B变量的统计描述:分布 Distribution集中趋势 Central tendency离散趋势 Dispersion2 SPSS的单变量描述统计命令 A Frequencies: 频数统计StatisticsSummarizeFrequencies变量值频
18、数百分比有效百分比累计百分比中位数百分比和有效百分比B Descriptives: 定距变量描述统计StatisticsSummarizeDescriptives变量名平均数标准差最小值最大值 3、统计处理方法:设置变量属性数据录入选择“分析Analyze”菜单统计分析程序对话框项目选择(输入参数)产生结果。 4、SPSS10.0的分析(Analyze)功能: 一、报表 Reports 二、描述统计 Descriptive Statistics 1、频数分析 Frequencies 2、描述统计 Descriptives 3、数据探索 Explore 4、交叉表 Crosstabs 三、均值比
19、较 Compare Means 1、平均数分析 Means 2、单一样本 t检验 One-Sample T Test 3、独立样本 t检验 Independent-Samples T Test 4、配对样本 t检验 Paired-Sample T Test 5、单因素方差分析 One-Way ANOVA 四、一般线性模型 General Linear Model 1、单变量方差分析 Univariate 五、相关分析 Correlate 1、双变量相关 Bivariate 2、偏相关 Partial 3、距离相关 Distances六、回归分析 Regression 1、线性回归 Linear
20、 七、对数线性 Loglinear八、聚类分析 Classify九、数据简化 Data Reduction 十、尺度分析 Scale十一、非参数检验 Nonparametric Tests 1、 卡方检验 Chi-Square 2、 二项式检验 Binomial 3、 游程检验 Runs 4、 单样本柯斯检验 1-Sample K-S 5、 两个独立样本检验 2 Independent Samples 6、 多个独立样本检验 K Independent Samples 7、 两个相关样本检验 2 Related Samples 8、 多个相关样本检验 K Related Samples十二、存
21、活分析 Survival十三、多项选择 Multiple Response 5、统计资料的分类及常用统计学处理方法: (1)计量资料(数值变量,一般有计量单位):参数统计,常用:平均数、标准差、u检验、t检验、方差分析(F检验)、相关与回归、时间数列、多元分析等等(一般要求:资料服从正态分布、近似正态分布或对称分布、方差具有齐同性)。 (2)计数资料(无序分类变量):常用:率、构成比、X2检验等等。 (3)等级资料(有序分类变量):非参数统计,是介于计量资料和计数资料之间的半定量资料,常用:率、构成比、秩和检验、Ridit分析等等。 二、描述性统计: 例1:某市120名12岁男孩身高(cm)资
22、料如下:试作描述性统计分析。142.3 156.6 142.7 145.7 138.2 141.6 142.5 130.5 134.5 148.8134.4 148.8 137.9 151.3 140.8 149.8 145.2 141.8 146.8 135.1150.3 133.1 142.7 143.9 151.1 144.0 145.4 146.2 143.3 156.3141.9 140.7 141.2 141.5 148.8 140.1 150.6 139.5 146.4 143.8143.5 139.2 144.7 139.3 141.9 147.8 140.5 138.9 13
23、4.7 147.3138.1 140.2 137.4 145.1 145.8 147.9 150.8 144.5 137.1 147.1142.9 134.9 143.6 142.3 125.9 132.7 152.9 147.9 141.8 141.4140.9 141.4 160.9 154.2 137.9 139.9 149.7 147.5 136.9 148.1134.7 138.5 138.9 137.7 138.5 139.6 143.5 142.9 129.4 142.5141.2 148.9 154.0 147.7 152.3 146.6 132.1 145.9 146.7 1
24、44.0135.5 144.4 143.4 137.4 143.6 150.0 143.3 146.5 149.0 142.1140.2 145.4 142.4 148.9 146.7 139.2 139.6 142.4 138.7 139.9操作方法:A、定义变量属性:名称Name身高, B、数据录入:在DATA窗口第一列录入上述数据。 C、选择统计分析方法:分析Analyze描述性统计Descriptive Statistics 次数分配表Frequencies主对话框。 D、主对话框:选定身高进入分析变量框。 E、分别选定“统计量” 、“图表”和“格式”按钮出现下面三个次级对话框。根据研
25、究需要进行统计指标选择后,按“继续”按钮返回主对话框。 选择:四分位数、2个百分位数、全部集中趋势和离散趋势指标、偏态和峰度系数。 作直方图并附正态曲线。 变量按升序排列、 变量分5组 F、经过上述选择后在主对话框按“确定OK”按钮,产生如左表的描述性结果。 12岁男孩的身高次数分布直方图 三、均数比较: t检验、u检验、F检验(q检验) 1、两个小样本资料均数的比较t检验(t, 检验两个方差不齐性的小样本资料): 例2:将27例确诊为肠憩室患者随机分为两组,分别给予甲、乙两种饮食,观察饮食排出时间(小时)结果如下,试问两种饮食对肠蠕动效果有无差别?甲饮食组 76 75 44 55 51 66
26、 69 68 52 60 71 62 70 75乙饮食组 97 74 79 83 95 101 98 95 52 64 68 88 83 已知:n114 n2 13 x163.86 x282.85 S110.11 S2 15.00 、数据录入。 、分析Analyze 比较平均数法Compare Means 独立样本T检验Independent-Samples T Test 主对话框。 、把排除时间送入检验变量框 把分组送入分组变量框定义组别按“选项”按钮次级对话框。 、输入置信区间(95) 按“继续”按钮返回主对话框。Group Statistics1463.857110.11362.7030
27、1382.846215.00474.1616分组甲饮食组乙饮食组排出时间NMeanStd.DeviationStd. ErrorMeanIndependent Samples Test1.659.210-3.88225.001-18.98904.8911-29.06-8.92-3.82720.837.001-18.98904.9623-29.31-8.66 Equal variances assumedEqual variances notassumedFSig.Levenes Test forEquality of VariancestdfSig.(2-tailed)MeanDifferen
28、ceStd. ErrorDifferenceLowerUpper95% ConfidenceInterval of theDifferencet-test for Equality of Means、在主对话框中按“确定”按钮产生结果(见上图)。上表是分组描述性统计结果,下表t检验结果: 3、配对资料比较 例3:研究活血化瘀汤对动物血管灌流量的影响,测得 8只家兔给药前、给药后血管灌流量数据(相对单位)如下,试问:活血化瘀汤有无扩张血管的作用? 家兔号 给药前 给药后 差值d d2 1 15.3 31.0 -15.7 246.49 2 10.0 14.0 - 4.0 16.00 3 9.0 1
29、5.7 - 6.7 44.89 4 32.7 26.7 6.0 36.00 5 5.7 11.7 - 6.0 36.00 6 13.2 22.0 - 8.8 77.44 7 25.3 40.0 -14.7 216.09 8 32.1 42.6 -10.5 110.25 、数据录入。、分析Analyze比较平均数法Compare Means 成对样本T检验Paired-Sample T Test 主对话框。 、把两个都送入检验变量框按“选项”按钮次级对话框。输入置信区间(95)按“继续”按钮返回主对话框。 D、在主对话框中按“确定”按钮产生结果(见下图)。上表是配对资料描述性统计结果。Paire
30、d Samples Correlations8.817.013给药前 & 给药后Pair 1NCorrelationSig.Paired Samples Test-7.47506.80252.4050-13.162-1.7880-3.1087.017给药前 - 给药后MeanStd.DeviationStd. ErrorMeanLowerUpper95% ConfidenceInterval of theDifferencePaired DifferencestdfSig.(2-tailed)下表是配对资料相关分析和t检验结果。 4、单因素方差分析及多组样本均数的两两比较: 例4:为研究某药物
31、的抑癌作用,将一批小白鼠致癌后随机分为四组,三个实验组分别注射不同剂量的药物(0.5ml、1.0ml、1.5ml) ,一个对照组不用药,一定时间后测定四组小白鼠的癌肿重量(g)结果见下表,试比较不同剂量的药物的抑癌作用。 对照组 实验A组 实验B组 实验C组 3.6 3.0 0.4 3.3 4.5 2.3 1.7 1.2 4.2 2.4 2.3 0.0 4.4 1.1 4.5 2.7 3.7 4.0 3.6 3.0 5.6 3.7 1.3 3.2 7.0 2.7 3.2 0.6 4.1 1.9 3.0 1.4 5.0 2.6 2.1 1.2 4.5 1.3 2.5 2.1 A、数据录入分析An
32、alyze比较平均数法Compare Means 单因素方差分析One-Way ANOVA 主对话框。B、把肿瘤重量送入检验变量框把分组送入因子框。 C、按Post Hoc检验按钮点击LSD和Tamhanes T2检验复选框输入显著性水平(0.05) 按“继续”按钮返回主对话框。Descriptives描述性结果肿瘤重量104.66001.0091.31913.93825.38183.607.00102.5000.9309.29441.83403.16601.104.00102.46001.1843.37451.61283.3072.404.50101.87001.1576.36611.041
33、92.6981.003.30402.87251.4913.23582.39553.3495.007.00对照组实验A组实验B组实验C组TotalNMeanStd.DeviationStd. ErrorLower BoundUpper Bound95% ConfidenceInterval for MeanMinimumMaximum D、按“选项”按钮次级对话框点击描述性统计量复选框按“继续”按钮返回主对话框。E、在主对话框中按“确定”按钮产生结果(见下图)。Test of Homogeneity of Variances方差齐性检验 Levene Statisticdf1df2Sig.0.5
34、17 3 36 0.673 均值图ANOVA方差分析表肿瘤重量45.091315.03012.992.00041.649361.15786.74039Between GroupsWithin GroupsTotalSum ofSquaresdfMean SquareFSig.Multiple Comparisons多重比较表(q检验)Dependent Variable: 肿瘤重量2.1600*.4810.001.87703.44302.2000*.4810.002.74263.65742.7900*.4810.0001.35274.2273-2.1600*.4810.001-3.4430-.
35、87704.000E-02.48101.000-1.37621.4562.6300.4810.733-.76492.0249-2.2000*.4810.002-3.6574-.7426-4.0000E-02.48101.000-1.45621.3762.5900.4810.854-.95662.1366-2.7900*.4810.000-4.2273-1.3527-.6300.4810.733-2.0249.7649-.5900.4810.854-2.1366.9566(J) 分组实验A组实验B组实验C组对照组实验B组实验C组对照组实验A组实验C组对照组实验A组实验B组(I) 分组对照组实验A
36、组实验B组实验C组LSDMeanDifference(I-J)Std. ErrorSig.Lower BoundUpper Bound95% Confidence IntervalThe mean difference is significant at the .05 level.在0.05水平上平均数差异显著。*. 四、相关与回归分析 例5、某医师测得13例 8岁男孩体重(kg)和心脏横径(cm)的数据如下表所示,试作相关和回归分析。 编号 体重x 心脏横径y x2 y2 xy 1 25.5 9.2 650.25 84.64 234.60 2 19.5 7.8 380.25 60.84 1
37、52.10 3 24.0 9.4 576.00 88.36 225.60 4 20.5 8.6 420.25 73.96 176.30 5 25.0 9.0 625.00 81.00 225.00 6 22.0 8.8 484.00 77.44 193.60 7 21.5 9.0 462.25 81.00 193.50 8 23.5 9.4 552.25 88.36 220.90 9 26.5 9.7 702.25 94.09 257.05 10 23.5 8.8 552.25 77.44 206.80 11 22.0 8.5 484.00 72.25 187.00 12 20.0 8.2 4
38、00.00 67.24 164.00 13 28.0 9.9 784.00 98.01 277.20 合计 301.5 116.3 7072.80 1044.26 2713.70 1、相关分析操作方法: A、数据录入。 B、分析Analyze相关Correlate 二元相关分析 Bivariate 主对话框。 C、把体重和心脏横径送入检验变量框选择相关系数复选框选择显著性水平(双侧) 。 D、按“选项”按钮次级对话框点击描述性统计量复选框按“继续”按钮返回主对话框。Correlations1.000.893*.0001313.893*1.000.000.1313Pearson Correlat
39、ionSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N心脏横径体重心脏横径体重Correlation is significant at the 0.01 level (2-tailed).*. E、在主对话框中按“确定”按钮产生结果(见下表)。上表是描述性统计结果,下表是皮尔逊相关系数表。Correlations肯德尔和斯皮尔曼等级相关系数1.000.755*.0001313.755*1.000.000.13131.000.876*.0001313.876*1.000.000.1313Correlation CoefficientSig.
40、 (2-tailed)NCorrelation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)N体重心脏横径体重Kendalls tau_bSpearmans rho心脏横径体重Correlation is significant at the .01 level (2-tailed).*. 心脏横径2、回归分析操作方法:A、数据录入。 B、分析Analyze 回归方法Regression 线性回归Linear 主对话框。C、把心脏横
41、径送入依变量框把体重送入自变量框。 D、分别点击“统计量”、“统计图”、存储”、“选项”按钮次级对话框点击所需统计量复选框(尽量选择系统默认选项)按“继续”按钮返回主对话框。统计量对话框:图形对话框:选项对话框:存储对话框: E、在主对话框中按“确定”按钮产生结果(见下图)。ANOVAb3.34413.34443.3900.000a.848117.708E-024.19212RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors: (Constant), 体重a. Dependent Variable: 心脏
42、横径b. Coefficients系数表a4.212.7235.828.0000.204.0310.8936.587.000(Constant)体重Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: 心脏横径a. 回归方程显著性检验:回归方程:Y=0.204X+4.212第四讲 SPSS的双变量关系描述统计(二)列联与卡方分析1、变量关系概述寻找变量间的关系是科学研究的首要目的。变量间的关系最简单的划分即是有关与无关。在统计学上,我们通常这样判断变量之间是
43、否有关:如果一个变量的取值发生变化,另外一个变量的取值也相应发生变化,则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则二者无关。 1、X2 检验 X2检验相关计算公式:X2基本公式: X2(AT)2/T四格表专用公式: T 5 且N 40 X2(ad-bc)2n/(a+b)(c+d)(a+c)(b+d)四格表校正公式: 当 1T5且N40 X2(ad-bc-n/2)2n/(a+b)(c+d)(a+c)(b+d) 自由度: (R-1)(C-1) R行、C列 理论值: TijnR(nCn)性别与四级英语考试通过率的相关统计表述:统计结果显示,当性别取值不同时,通过率变量的取值并未发生变
44、化,因此性别与考试通过率无关。自变量的不同取值在因变量上无差异,两变量无关。自变量的不同取值在因变量上有差异,两变量有关。因变量自变量表述:统计结果显示,当性别取值不同时,收入变量的取值发生了变化,因此性别与月收入有关。自变量因变量2、双变量关系的统计类型3、列联统计3-1 列联表的格式自变量因变量人数行百分比列百分比总百分比边缘百分比边缘百分比条件百分比3-2 列联分析的原理:自变量发生变化,因变量取值是否也发生变化。比较边缘百分比和条件百分比的差别。4-1) 变量关系强度的含义:指两个变量相关程度的高低。统计学中是以准实验的思想来分析变量相关的。通常从以下的角度分析:A)两变量是否相互独立
45、。B)两变量是否有共变趋势。C)一变量的变化多大程度上能由另一变量的变化来解释。4 列联变量的关系强度测量4-2) 双变量关系强度测量的主要指标4-3)卡方测量的原理:卡方测量用来考察两变量是否独立(无关)。其原理是根据这一概率定理:若两变量无关,则两变量中联合事件发生的概率应等于各自独立发生的概率乘积。在列联表中,这一定理就具体转化为:若两变量无关,则两变量中条件概率应等于各自边缘的概率乘积。反之,则两变量有关,或,两变量不独立。示例151565 5观察值边缘概率边缘概率期望条件概率 9 9-9-9残差由此可见,期望值(独立模型)与观察值的差距越大,说明两变量越不独立,也就越有相关。因此,卡
46、方的表达式如下:卡方的取值在0之间。卡方值越大,关联性越强。在SPSS中,有Pearson X2和相似比卡方(Likelihood Ratio X2 )两种。4-4) 的改进标准化系数:为使 值有一固定的区间,便于比较,采用了以下几个修正:A、系数(Phi): (01), 适用于22表。B、 列联系数(Contingency Coefficient): (01),适用任意表。C、 Cramer V系数:(01),适用任意表。D、系数(Lambda): (01),适用任意表。E、 Goodman & Kruskal-tau系数: (01),适用任 意表。5 列联统计命令:StatisticsSu
47、mmarizeCrosstabs 例6、四格表资料的X2检验 某医师对性乱者和献血员分别检测抗HCV,结果见下表,试问两组抗HCV检测阳性率是否有差别?分 组 阳性 阴性 合计 阳性率(%) 性乱者 18(a) 190(b) 208 8.65献血员 2(c) 105(d) 107 1.87合 计 20 295 315 6.35 本例的四个理论值均大于5,应采用基本公式或专用公式。A、数据录入。 B、资料data观察值加权weight cases 产生次级对话框 (原始数据表不需要加权!)。点击“加权”项目把“频数”送进加权变量框按“确定”按钮。数据录入格式:C、分析Analyze描述性统计De
48、scriptive Statistics 交叉表Crosstabs 主对话框。 D、把行送进上变量框把列送进直行变量框。 E、按“统计量”、“格”、“格式”按钮次级对话框对需要的项目进行选择按“继续”按钮返回主对话框。选择卡方统计量:选择实际值和行的百分比:列联表: F、在主对话框中按“确定”按钮产生结果(见下图)。Chi-Square Tests5.470b1.0194.3881.0366.6021.010.026.013315Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact TestN of Vali
49、d CasesValuedfAsymp. Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 tablea. 0 cells (.0%) have expected count less than 5. The minimum expected count is 6.79。b. 上表是卡方检验结果(注意结果的应用条件): 例7、四格表资料的X2 检验(校正公式): 某医院进行肿瘤手术切除分析,资料见下表,试问两组切净率是否有差别?肿瘤性质 切净例数 残留例数 合计 切净率(%)良 性 26(18.
50、44) 1(8.56) 27 96.30恶 性 2( 9.56) 12(4.44) 14 14.29合 计 28 13 41 6.35 分析:本例一个理论值均小于5,应采用四格表校正公式。 操作方法:与例题6完全一样,不在重复(下同)。数据录入格式:Chi-Square Tests28.636b1.00024.9741.00031.1831.000.000.00041Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact TestN of Valid CasesValuedfAsymp. Sig.(2-side
51、d)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed only for a 2x2 tablea. 1 cells (25.0%) have expected count less than 5. The minimum expected count is 4.44。b. 列联表:卡方检验结果: 例8、四格表资料确切概率法: (T1或N 40) 某医师对20例急性心机梗死并发休克患者分别采用西药和中西药结合方法抢救,结果如下表,试问两组疗效有无差别?分 组 有效 无效 合计 有效率(%)西 药 6(8.25) 5(2.75) 11 54.55中西药
52、9(6.75) 0(2.25) 9 100.00合 计 15 5 20 75.00 本例 N 40,应采用四格表确切概率法(Fisher法)。数据录入格式:Chi-Square Tests5.455b1.0203.3001.0697.3351.007.038.03020Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact TestN of Valid CasesValuedfAsymp. Sig.(2-sided)Exact Sig.(2-sided)Exact Sig.(1-sided)Computed o
53、nly for a 2x2 tablea. 2 cells (50.0%) have expected count less than 5. The minimum expected count is 2.25。b. 列联表:卡方检验结果: 例9、R C 列联表的X2 检验 某地区观察吡嗪磺合剂预防疟疾复发的效果结果,用乙胺嘧啶和不用药组作对照,结果如下表,问三组的疟疾复发率是否有差别?分 组 复发数 未复发数 合 计 复发率%吡嗪磺合剂 76 1920 1996 3.81乙胺嘧啶组 27 446 473 5.71 不用药组 53 431 484 10.95 合 计 156 2797 2953
54、 5.28 数据录入格式:Chi-Square Tests39.923a2.00033.8182.0002953Pearson Chi-SquareLikelihood RatioN of Valid CasesValuedfAsymp. Sig.(2-sided)0 cells (.0%) have expected count less than 5. Theminimum expected count is 24.99。a. 列联表:卡方检验结果表 六、非参数检验:秩和检验 1、配对资料对比的秩和检验(Wilcoxon法): 例10: 对9个水样分别采用重量法和硬度联合测定EDTA法测定
55、其硫酸含量,结果如下表,试问两种方法所得结果有无差别? 分析:本资料呈明显偏态分布。水样号 EDTA法 重量法 差值d 秩次 (1) (2) (3) (4)=(2)(3) (5) 1 115.3 115.3 0 2 355.4 354.0 1.4 4 3 336.2 337.5 1.3 3 4 215.2 222.3 7.1 8 5 159.5 156.4 3.1 5 6 57.6 56.6 1.0 2 7 59.5 58.7 0.8 1 8 653.2 658.6 5.4 6 9 1786.7 1792.6 5.9 7 -24,12 A、分析Analyze非参数检验Nonparametric
56、 Tests 两个相关样本检验 2 Related Samples 主对话框。 C、把两个变量送入检验变量框选定Wilcoxon检验复选框。 D、点击“选项”按钮次级对话框点击描述性统计量复选框按“继续”按钮返回主对话框。Test Statisticsb-.840a.401ZAsymp. Sig. (2-tailed)总量法 - EDTA法Based on negative ranks.a. Wilcoxon Signed Ranks Testb. E、在主对话框中按“确定”按钮产生结果(见下图)。上表是描述性统计结果,下表是秩和检验结果。Ranks秩(等级)4a3.0012.004b6.00
57、24.001c9Negative RanksPositive RanksTiesTotal总量法 - EDTA法NMean RankSum of Ranksa.总量法 EDTA法 c. EDTA法 = 总量法上表是等级比较表。 2、两样本资料对比的秩和检验: 例11:多毛症患者与对照组血清睾酮含量(ng%)的数据如下表,试检验两组血清睾酮含量值有无差别? 分析:本资料呈明显偏态分布且两组方差不齐性。 多毛症组 对照组 血清睾酮含量 秩次 血清睾酮含量 秩次 74.6 10 45.8 6 60.7 8 30.2 2 65.6 9 24.8 1 99.4 12 33.7 3 133.8 14 36.6 4 118.3 13 60.5 7 83.0 11 42.5 5 n28 T282 n16 T123 A、数据录入。 B、分析Analyze非参数检验Nonparametric Tests 两个独立样本检验 2 Independent S
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度互联网+教育合作协议3篇
- 2025年实验心得体会(2篇)
- 二零二五年度个人信用借款服务协议范本合同2篇
- 课程设计手帐素材
- 调速系统安装安全技术规程(2篇)
- 二零二五年度度假村厨师团队承包与餐饮服务合同3篇
- 2025年三贤收支管理制度范文(二篇)
- 2025年华师大新版八年级化学下册阶段测试试卷
- 2025年初中数学教研组工作计划样本(2篇)
- 二零二五年度搬家及物品打包运输合同范本2篇
- 棋牌室消防应急预案
- 《ISO56001-2024创新管理体系 - 要求》之22:“8运行-8.2 创新行动”解读和应用指导材料(雷泽佳编制-2024)
- 幼儿园大班主题课程《爱在我身边》主题活动方案
- 广西桂林市(2024年-2025年小学三年级语文)部编版期末考试(上学期)试卷(含答案)
- 煤炭行业智能化煤炭筛分与洗选方案
- 高级会计实务案例分析-第三章 企业全面预算管理
- 2024年数学四年级上册线段、射线和直线基础练习题(含答案)
- 2024至2030年中国防弹衣行业市场全景分析及投资策略研究报告
- 高三日语复习:高考日语语法总结
- 3.16谣言止于智者-正确处理同学关系班会解析
- 2024年美国氟苯尼考市场现状及上下游分析报告
评论
0/150
提交评论