培训资料-spss统计软件培训数据分析_第1页
培训资料-spss统计软件培训数据分析_第2页
培训资料-spss统计软件培训数据分析_第3页
培训资料-spss统计软件培训数据分析_第4页
培训资料-spss统计软件培训数据分析_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、宿宿 昆昆重庆市疾控慢病所重庆市疾控慢病所 统计描述统计描述 均数比较:均数比较:t检验、方差分析检验、方差分析 2 检验检验 简单线性回归简单线性回归 二分类二分类Logistic回归回归 基于秩次的基于秩次的非参数检验非参数检验 连续变量的统计描述连续变量的统计描述 分类变量的统计描述分类变量的统计描述 集中趋势集中趋势:算术均数、中位数、几何均数、众数、调和:算术均数、中位数、几何均数、众数、调和均数等。均数等。 离散趋势离散趋势:全距、方差和标准差、百分位数、四分位数:全距、方差和标准差、百分位数、四分位数/间距、变异系数。间距、变异系数。 分布特征:对正态分布而言,偏度系数和峰度系数

2、等。分布特征:对正态分布而言,偏度系数和峰度系数等。 其他趋势:单峰、双峰、对称、偏态其他趋势:单峰、双峰、对称、偏态 算术均数算术均数: 用于描述服从正态分布的变量值的平均水平。用于描述服从正态分布的变量值的平均水平。 中位数中位数: 用于描述服从偏态分布资料的平均水平。用于描述服从偏态分布资料的平均水平。 几何均数几何均数: 用于描述等比或等差数列变量值的平均水平。用于描述等比或等差数列变量值的平均水平。 方差方差:主要用于正态分布资料主要用于正态分布资料; 标准差标准差:主要用于正态分布资料主要用于正态分布资料; 四分位数间距四分位数间距:主要用于偏态分布资料主要用于偏态分布资料(QP7

3、5P25 ); 变异系数变异系数:用于度量单位不同或均数相差悬殊的资料用于度量单位不同或均数相差悬殊的资料。SPSS中的相应功能:中的相应功能:“频率频率”过程过程SPSS中的相应功能:中的相应功能:“描述描述”过程过程SPSS中的相应功能:中的相应功能:“探索探索”过程过程 频数分布情况的描述:绝对频数、百分比频数分布情况的描述:绝对频数、百分比 集中趋势的描述:众数集中趋势的描述:众数 使用相对数进行深入描述:比、构成比、率使用相对数进行深入描述:比、构成比、率 SPSS中的相应功能:中的相应功能:“频率频率”过程、过程、“描述描述”过程和过程和“探索探索”过程过程 完全随机化设计完全随机

4、化设计单组单组计量资料的均数与总体均数比较的计量资料的均数与总体均数比较的t检验检验 某个小区某个小区1000个个6岁男孩的身高与重庆市所有岁男孩的身高与重庆市所有6岁男孩的岁男孩的身高平均值的比较身高平均值的比较 配对配对设计设计两组两组相关计量资料均数间比较的相关计量资料均数间比较的t检验检验 自身配对自身配对:如治疗前后某项指标比较。如治疗前后某项指标比较。 异体配对异体配对:如对两只兔子两种处理方法的结果比较。如对两只兔子两种处理方法的结果比较。 完全随机化设计完全随机化设计两组独立两组独立计量资料均数间比较的计量资料均数间比较的t检验检验 如男女如男女BMI比较比较 完全随机化设计完

5、全随机化设计多组独立多组独立计量资料均数间比较的单因素计量资料均数间比较的单因素ANOVA 如比较不同乡镇如比较不同乡镇BMI 完全随机设计的单样本计数资料的率完全随机设计的单样本计数资料的率/构成比与已知总构成比与已知总体率体率/构成比比较构成比比较 完全随机设计的两完全随机设计的两(多多)独立样本计数资料的率独立样本计数资料的率(构成比构成比)比较比较 配对设计的两组相关样本计数资料的率配对设计的两组相关样本计数资料的率/构成比比较与构成比比较与Kappa一致性检验一致性检验 完全随机设计的分层完全随机设计的分层2检验检验 回归的最初含义:生物学含义回归的最初含义:生物学含义 英国的遗传学

6、家英国的遗传学家F.Galton和和K.Pearson注意到一个有趣的现象,注意到一个有趣的现象,即父亲高,儿子也高,父亲矮,儿子也矮,但儿子的身高离平均水即父亲高,儿子也高,父亲矮,儿子也矮,但儿子的身高离平均水平更近些,即子代身高有向人群的平均身高回归平更近些,即子代身高有向人群的平均身高回归(regression to the mean)的趋势,这就是的趋势,这就是“回归回归”的生物学内涵,的生物学内涵,Galton称该现象为称该现象为“普遍回归法则普遍回归法则(law of universal regression)”。这是很自然的,否则,岂不一代比一代无限制。这是很自然的,否则,岂不

7、一代比一代无限制地远离平均值,导致身高两级分化?地远离平均值,导致身高两级分化? 回归的现在含义:完全不同了,回归分析是研究事物或回归的现在含义:完全不同了,回归分析是研究事物或现象之间的数量依存关系,控制现象之间的数量依存关系,控制/预测预测 模型模型: iiiXYiiibXaY( 随机误差) 线性回归分析的一般步骤线性回归分析的一般步骤 (1)确定因变量和自变量确定因变量和自变量 (2)绘制散点图绘制散点图 (3)从样本数据出发确定变量之间的数学关系式从样本数据出发确定变量之间的数学关系式,并并对回归方程的各个参数进行估计对回归方程的各个参数进行估计. (4)对回归方程进行各种统计检验对回

8、归方程进行各种统计检验.:回归方程的显回归方程的显著性检验;拟合优度检验;残差著性检验;拟合优度检验;残差(Y的估计值的估计值与实测与实测值的差值的差)分析分析(y/残差残差-x/X or ) (5)利用回归方程进行预测与控制;利用回归方程进行预测与控制; 相关相关(correlation)与回归与回归(regression)简介简介 在大量的医学研究中还需要对两个变量之间的关系进行在大量的医学研究中还需要对两个变量之间的关系进行量化研究,一是确定两个变量间是否有联系及联系的程量化研究,一是确定两个变量间是否有联系及联系的程度如何,二是定量地确定它们之间的互依关系,相关与度如何,二是定量地确定

9、它们之间的互依关系,相关与回归就是研究这种关系的统计方法。回归就是研究这种关系的统计方法。 变量间的关系变量间的关系 (1)函数关系函数关系(确定性关系确定性关系):如如:圆面积和圆半径圆面积和圆半径. (2)统计关系统计关系(非确定性关系非确定性关系):不象函数关系那样直接不象函数关系那样直接,但却普但却普遍存在遍存在,且有强有弱且有强有弱, 如如:身高与体重身高与体重. (变异变异) 相关和回归分析的研究对象相关和回归分析的研究对象:统计关系统计关系 Logistic回归:应变量为分类变量,自变量回归:应变量为分类变量,自变量: 连续连续/分类变量,研究该分类变量与一组自变量之间的关系分类

10、变量,研究该分类变量与一组自变量之间的关系 0/1:治愈:治愈/未治愈,或患病未治愈,或患病/未患病未患病 有序分类:治愈有序分类:治愈/好转好转/未治愈未治愈 无序分类:腺癌、鳞癌、大细胞癌无序分类:腺癌、鳞癌、大细胞癌模型中参数的意义模型中参数的意义 0为常数项:自变量取值全为为常数项:自变量取值全为0时的基线状况,未必有实际时的基线状况,未必有实际意义意义 i为偏回归系数,代表固定其它为偏回归系数,代表固定其它Xj时,时,Xi改变一个单位引改变一个单位引起起logit(P)平均值的改变量平均值的改变量 当其它自变量当其它自变量(Xj)取值保持不变时,取值保持不变时, Xi取值增加一个单位

11、取值增加一个单位引起引起OR自然对数值的变化量,因此在使用上自然对数值的变化量,因此在使用上OR值要远比值要远比i本身更常用本身更常用iORPPPPln)1/()1ln(1111 哑变量哑变量 偏回归系数表示其它自变量偏回归系数表示其它自变量Xj不变,不变,Xi每改变一个单位,每改变一个单位,所导致所导致logitP的平均变化量的平均变化量 x为连续性为连续性/二分类变量:没有问题二分类变量:没有问题 x为多分类变量:不太合适为多分类变量:不太合适 无序多分类:民族,各族之间不存在大小问题无序多分类:民族,各族之间不存在大小问题 有序多分类:家庭收入分为高、中、低三档,它们之间的差距有序多分类:家庭收入分为高、中、低三档,它们之间的差距无法准确衡量无法准确衡量 在以上这些情况时,我们就必须将原始的多分类变量转在以上这些情况时,我们就必须将原始的多分类变量转化为数个哑变量(化为数个哑变量(Dummy Variable),),哑变量哑变量 每个哑变量只代表某两个级别或若干个级别间的差异,这样得到每个哑变量只代表某两个级别或若干个级别间的差异,这样得到的回归结果才能有明确而合理的实际意义的回归结果才能有明确而合理的实际意义 对于取值具有对于取值具有n个水平的自变量个水平的自变量Xi,可以生成,可以生成n-1个哑变量个哑变量 模型中哑变量遵循模型中哑变量遵循“同进同出同进同出”

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论