如何选择数据分析方法_第1页
如何选择数据分析方法_第2页
如何选择数据分析方法_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

如何选择数据分析方法如何选择数据分析方法数据分析技术层面须把握三大关键:变量、数据分析方法、变量和方法的关联认识数据分析方法:对数据进行统计分析时,选择正确的分析方法是非常重要的。选择统计分析方法时,必须考虑许多因素,主要有:(1)统计分析的目的,(2)所用变量的特征,(3)对变量所作的假定,(4)数据的收集方法(即抽样过程)。选择统计分析方法时一般考虑前两个因素就足够了。小样本并且两个变量服从双正态分布,则用pearson相关系数做统计分析大样本或两个变量不服从双正态分布,则用spearman相关系数进行统计分析2、两个变量均为有序分类变量,可以用spearman相关系数进行统计分析3、一个变量为有序分类变量,另一个变量为连续型变量,可以用spearman相关系数进行统计分析【2】回归分析1、直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。2、多重线性回归:应变量(y)为连续型变量(即计量资料),自变量(xl,x2,…,xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用3、二分类的logistic回归:应变量为二分类变量,自变量(x1,x2,…,xp)可以为连续型变量、有序分类变量或二分类变量。非配对的情况:用非条件logistic回归⑴观察性研究:可以用逐步线性回归寻找(拟)主要的'影响因素(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用配对的情况:用条件logistic回归(1) 观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素(2) 实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用4、有序多分类有序的logistic回归:应变量为有序多分类变量,自变量(xl,X2,…,xp)可以为连续型变量、有序分类变量或二分类变量。观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用5、无序多分类有序的logistic回归:应变量为无序多分类变量,自变量(x1,x2,…,xp)可以为连续型变量、有序分类变量或二分类变量。观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用如何选择数据分析方法[篇2]把握两个关键2、全面理解数据。哪些变量,什么类型?适合或者可以用什么统计方法,这是数据分析技术层面。须把握三大关键:变量、数据分析方法、变量和方法的关联。认识变量认识数据分析方法选择合适的数据分析方法是非常重要的。选择数据分析(统计分析)方法时,必须考虑许多因素,主要有:1、 数据分析的目

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论