几种常用的数据分析方法_第1页
几种常用的数据分析方法_第2页
几种常用的数据分析方法_第3页
几种常用的数据分析方法_第4页
几种常用的数据分析方法_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

方差、相关与回归分析第一页,共二十一页。主要内容方差分析方差分析的过程单因素方差分析二因素方差分析相关分析相关分析的过程回归分析一元回归多元回归第二页,共二十一页。方差方析

方差分析是检验两个或两个以上样本均数间差异是否显著的方法。在比较几个组时,H0假设通常是设各组平均值相等。检验两个均数间差别的显著性可以用t检验法,也可用方差分析法。第三页,共二十一页。方差分析的基本概念样本均数间所以有差别,可能有两种原因造成:首先它们必须有抽样误差(个体间变异的影响;其次,如果各组所接受的不同处理方法是有不同的作用的,那么,它也是由于处理不同所造成的。第四页,共二十一页。常用的方差分析法有以下4种:单因素方差分析多元方差分析重复测量方差分析

第五页,共二十一页。3.

举例例1.完全随机设计资料的方差分析(单因素方差分析)下面列出了15名英语专业学生四次听力测验的成绩。这四次测验的内容与主题各不相同,第一次的主题是科普读物,第二次的是时事新闻,第三次的是名人轶事,第四次的是美国文化方面的短文。这四次听力考试的平均成绩是否有显著差异,即听力材料的主题与内容对考试成绩有没有影响。第六页,共二十一页。表1测验1(科普读物)测验2(时事新闻)测验3(名人轶事)测验4(美国文化)12159148616181110139101616101487171998141011。。。。。。。。。。。。第七页,共二十一页。相关与回归

在医学上人的身高与体重、体温与脉搏次数、年龄与血压、药物剂量与疗效等均有一定的联系。说明客观事物或现象相互关系的密切程度并用适当的统计指标表示出来,这是相关分析的任务。把客观事物或现象间的关系用函数形式表示出来,则是回归分析所要解决的问题。第八页,共二十一页。

CORR过程计算变量间的相关系数,包括PEARSON积矩相关系数等,同时给出单变量描述统计。REG过程是SAS中通用的基本的回归分析过程,它是用最小二乘法原理求解线性回归方程的有效过程。此外,因为逐步回归分析的方法在实际工作中应用甚广,故将其单独提出来介绍如何使用REG过程进行逐步回归分析。第九页,共二十一页。CORR过程相关分析相关是研究随机变量之间相互关系的统计分析方法,它研究随机变量之间相互关系的密切程度。线性相关,又称简单相关。其统计指标是PEARSON相关系数r。相关分析的取值在-1与+1之间,当数值越接近+1或-1时,说明关系越密切,接近0时,说明几乎没有关系。第十页,共二十一页。相关分析要回答的问题就是:变量x的一组高数值是不是与变量y的一组高数值有必然的联系,或者变量x的高数值就导致了变量y的数值变低。作为根据的变量就是自变量,发生对应变化的就是因变量。第十一页,共二十一页。

当研究多个随机变量之间的相互关系时,可对变量进行多元线性相关分析。多元线性相关的统计量是全相关系数R和各偏相关系数。在多元线性相关分析中,变量之间的关系是错综复杂的,两个变量间的简单线性相关系数往往不能正确说明两者的真实关系,只有在其它变量固定,即扣除了其它变量的影响后,计算两变量间的偏相关系数才能反映此两变量的真实情况。第十二页,共二十一页。

当变量不服从正态分布时,例如按等级分类或相对数资料,这时需用非参数相关分析方法,如等级相关分析法等。第十三页,共二十一页。二变量相关分析12名英语专业学生参加了语音、听写和语法三项考试:语音考试与听写考试之间的相关程度?语音考试与语法考试之间的相关程度?听写与语法之间的相关程度?第十四页,共二十一页。偏相关分析(partialcorrelations)云南省西双版纳地区是傣族同胞聚居区,他们的母语是傣语,但那里的儿童小学开始学习汉语,上中学时又学习英语。研究人员在该地区对30名受过高等教育的傣族成年人进行了傣、汉、英三种语言水平的测试第十五页,共二十一页。REG过程

回归是研究随机变量(学习成绩)和非随机变量(学习时间)之间的数量依存关系的统计分析方法。当自变量X与因变量Y之间呈直线关系时,称为直线回归。直线回归要求因变量Y是服从正态分布的且方差相等。第十六页,共二十一页。当自变量不只一个时,可进行多元线性回归分析。研究一个因变量与多个自变量之间的线性依存关系,称为多元线性回归。REG过程是用最小二乘法原理求解线性回归方程的过程。第十七页,共二十一页。只有弄清楚两个变量之间存在显著的相关关系时,才能使用直线回归模型。第十八页,共二十一页。第十九页,共二十一页。举例简单线性回归分析某一中学高三老师在多次实践的基础上建立了一个试题库。今年年初以来,他们从该题库中提出三套试卷,对高三学生进行摸底考试。最近,高考前一个月,他们又根据今年最新考试大纲要求,设计了一份新的模拟考试,用该试卷对高三学生再次进行摸底考试。题库试题成绩在多大程度上能预测新模拟试卷的成绩。

第二十页,共二十一页。内容梗概方差、相关与回归分析。方差分析是检验两个或两个以上样本均数间差异是否显著的方法。样本均数间所以有差别,可能有两种原因造成:。例1.完全随机设计资料的方差分析(单因素方差分析)。这四次听力考试的平均成绩是否有显著差异,即听力材料的主题与内容对考试成绩有没有影响。在医学上人的身高与体重、体温与脉搏次数、年龄与血压、药物剂量与疗效等均有一定的联系。说明客观事物或现象相互关系的密切程度并用适当的统计指标表示出来,这是相关分析的任务。把客观事物或现象间的关系用函数形式表示出来,则是回归分析所要解决的问题。CORR过程计算变量间的相关系数,包括PEARSON积矩相关系数等,同时给出单变量描述统计。REG过程是SAS中通用的基本的回归分析过程,它是用最小二乘法原理求解线性回归方程的有效过程。此外,因为逐步回归分析的方法在实际工作中应用甚广,故将其单独提出来介绍如何使用REG过程进行逐步回归分析。相关是研究随机变量之间相互关系的统计分析方法,它研究随机变量之间相互关系的密切程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论