




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
相关分析和回归分析一、相关分析(一)相关的概念两个变量之间不精确、不稳定的变化关系称为相关关系。两个变量之间的变化关系,既表现在变化方向上,又表现在密切程度上。(二)相关的种类1、从变化方向上划分正相关:一个变量增大,另一个变量对应值也随之增大;或另一个变量值减小,另一个变量对应值也随之减小,两列变量变化方向相同。负相关:一个变量增大,另一个变量对应值也随之减少;或一个变量值减小,另一个变量对应值也随之增大,两列变量变化方向相反。零相关:两变量值的变化方向无规律。2、从变量相互关系的程度上划分无论两个变量的变化方向是否一致,凡密切程度高的称为强相关或高度相关;密切程度一般的称为中度相关;密切程度弱的称为弱相关或低度相关。(三)相关散布图它是表示两种事物之间的相关性及联系的模式。以直角坐标的横轴表示x列变量,纵轴表示y列变量,在相关的两变量对应值的垂直相交处画点,构成相关散布图。相关散布图的用途:图5-2(b)直线相关图5-2(a)曲线相关1、判断相关是否直线式图5-2(b)直线相关图5-2(a)曲线相关图5-3b低度相关图5-3(a)高度相关2、判断相关密切程度高低图5-3b低度相关图5-3(a)高度相关图5-4(a)正相关3、判断相关变化方向图5-4(a)正相关图5-4(b)负相关图5-4(b)负相关(四)相关系数用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。一般用r表示。注:(1)相关系数的数值范围是。(2)从r的正负以及绝对值的大小,可以表明两个变量之间变化的方向及密切程度。“+”、“—”号表示变化方向(“+”号表示变化方向一致,即正相关;“—”号表示变化方向相反,即负相关)r的绝对值表示两变量之间的密切程度(即强度)。绝对值越接近1,表示两个变量之间关系越密切;越接近0,表示两个变量之间关系越不密切。(3)相关系数只能描述两个变量之间的变化方向及密切程度,并不能揭示两者之间的内在本质联系。另外若两变量相关系数为0,只能表示两变量间没有线性关系,也可能存在曲线关系,即r=0,并不意味着两变量是独立的。(五)积差相关1.积差相关的概念当两个变量都是正态连续变量,且两者之间呈线性关系时,表示这两个变量之间的相关称为积差相关。2.积差相关的适用条件(1)两变量均应由测量得到的连续性数据(量—量数据)。两个变量的总体都呈是正态分布,或接近正态的单峰对称分布。3.积差相关系数的定义公式积差相关系数就是两个变量标准分数乘积之和除以n所得之商。用公式可表示为:在此:表示X变量的样本标准差,表示Y变量的样本标准差。(六)相关系数的显著性检验1.:条件下,相关系数的显著性检验对于总体相关系数的零假设进行显著性检验时,又分为两种情况:(1)当的情况当时,r的抽样分布接近于正态分布,其检验的统计量为:在此r表示两个变量的积差相关系数n表示样本的容量(2)当的情况当时,关于的零假设,可以用t统计量来检验相关系数的显著性。在此r表示两个变量的积差相关系数n表示样本的容量例2.从高一学生中随机抽取26名学生,其数学与英语考试成绩的积差相关系数为0.65,试问从总体上讲,数学与英语考试成绩是否相关?解:(1)提出假设:(2)选择检验统计量并计算其值由于假设,样本相关系数的标准记分呈t分布,故选择t作为检验统计量,将r=0.65,n=26代入公式,则(3)确定检验的形式:双侧检验(4)统计决断根据df=n-2=26-2=24,查t值表得,。由于实际的。根据统计决断规则,在0.01的显著性水平上拒绝原假设。结论:从总体上看:高一学生数学与英语考试成绩呈正相关。 2.:()条件下,相关系数的显著性检验检验步骤:(1)提出假设(2)查r与的转换表将r转换成,转换成(3)选择检验统计量并计算其值由于的抽样分布呈正态分布,则检验统计量为在这里表示的标准误,其中n代表样本容量(4)、确定检验的形式(5)、统计决断例3,26名高一学生的数学与英语考试成绩的积差相关系数为0.65是否来自于相关系数等于0.5的总体?解:提出假设,进行r与的转换:查r与转换表得,与r=0.65相对应的=0.775,与相对应的。选择统计量并计算—由于的抽样分布呈正态分布,故选择Z作为统计量,将上述数据代入公式: 统计决断:由于实际算出的|Z|=1.08<1.96=,根据双侧Z检验统计决断规则,则P>0.05。于是,只得保留原假设。结论是:在0.05的显著性水平上可以认为,高一学生数学与英语考试成绩总体相关系数一致,来源于总体。(七)其他相关系数1.等级相关系数等级相关是指以等级次序排列或以等级次序表示的变量之间的相关。我们主要介绍斯皮尔曼等级相关。(1)斯皮尔曼等级相关的概念及适用条件两变量是等级测量数据,且总体不一定呈正态分布,样本容量也不一定大于30,这样两变量的相关,称为斯皮尔曼等级相关。适用条件:①两变量的资料为等级测量数据,且具有线性关系。②对于粗略估计到的连续变量的测量数据,按其大小排成等级,亦可用等级相关计算。③不要求总体呈正态分布。(2)相关系数的计算计算等级相关系数的公式为:在这里表示等级相关系数D表示两个变量每对数据等级(不是指原始的等级)之差n表示样本的容量注:若出现相同的等级分数时,可用它们所占等级位置的平均数作为它们的等级。如下例,X列中90分有两个,且所占等级位置分别为3、4,故取它们的平均值(3+4)/2=3.5。例4,某校为了研究学生自学能力与学业成绩之间的关系,随机抽取10名学生的自学能力和学科成绩,见下表,求其相关系数。序号X(能力)等级Y(成绩)等级D 1903.5884-10.25285780611370108064164857798-115903.5952.51168097010-117857759-2481001981009875806-1110922922.5-10.25 25.5解:即学生的自学能力与学习成绩的相关程度是0.852.点二列相关(质—量相关)(1)概念及适用条件两列变量一列是正态连续变量,另一列是二分变量,描述这两个变量之间的相关,称为点二列相关。适用条件:一列是正态连续变量,另一列是二分变量(如男与女,对与错等)。(2)相关系数的计算在此p为二分变量中某一项所占比例q为二分变量中另一项所占比例为二分变量中比例为p部分所对应的连续变量的平均数为二分变量中比例为q部分所对应的连续变量的平均数为连续变量的标准差另一种表示形式为:在这里表示连续变量中所有分数的平均数(八)相关分析小结一、如何判断两个变量的相关性——步骤(1)找出两个变量的正确相应数据;(2)画出它们的散布图(散点图);(3)通过散布图判断它们的相关性;(4)给出相关系数的解答;(5)对结果进行评价和显著性检验。二、知识结构一览表 相关类型相关系数水平显著性检验适用条件统计量检验类备注量-量相关积差相关系数r=(n<50)T检验小样本(n>50)Z检验大样本,近似于正态分:Z检验近似于正态分质-质相关等级相关系数两类都是等级变量T检验非正态分布质-量相关点二列相一列是正态变量一列是二分变量采用积差相关系数的检验方法同上同上查表法——df=n-2,找到相关系数的临界值,将计算所得的值与临界值进行比较,若小于临界值,保留原假设,否则,拒绝。。T检验非正态分布二、回归分析相关表示两个变量之间的双向相互的关系。如果我们将存在相关的两个变量,一个作为自变量,另一个作为因变量,并把两者之间不十分准确、稳定的关系,用数学方程式来表达,则可利用该方程由自变量的值来估计、预测因变量的估计值,这一过程称为回归分析。可见,回归表示一个变量随另一个变量作不同程度变化的单向关系。回归分析的目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测研究者感兴趣的变量。在教育研究中,不少变量之间存在一定的关系,但是由于关系比较复杂,而且受偶然因素影响较大,两者只是一种不十分确定的回归关系。如果散点的分布有明确的直线趋势,我们就可以配制一条最能代表散点图上分布趋势的直线,这条最优拟合线即称为回归线。确定回归线的方程称为回归方程。(一)一元线性回归方程的建立一元线性回归方程的通式为,式中a是回归线在Y轴上的截距;b是回归线的斜率,称为回归系数。如何求a、b?方法一:用最小二乘法确定a、b:我们构造一元线性回归方程,用来估计实际值y,要使这样估计获得最好的效果。那么,a、b的值应该使的值最小,由于用计算,有正有负,总体上看趋向于0。因此,在计算时,我们对其取平方值,用,求a、b,使得最小。因此,构造一个新的函数,令求出Q(a,b)的最小值点——根据微积分求极值原理:(2)(1)(2)(1)将代入(2)中运用最小二乘法,确定回归方程:方法二:在r(相关系数)已知的情况下,可以代入以下公式::Y的标准差:X的标准差一元线性回归方程的检验用回归系数检验回归方程的显著性模型:首先,提出原假设和备择假设:其次,确定并计算统计量:最后,统计决断:查自由度为n-2的t值分布表,若,拒绝原假设,认为X对Y有显著影响。 2、用积差相关系数检验回归方程的显著性采用统计量:(同积差相关系数显著性检验)3、用方差分析检验回归方程的显著性回归平方和所占比重越大,误差平方和所占比重就越小,意味着变量间线性关系就越显著。所以,回归方程的显著性,可以采用回归平方和的分析来进行。总平方和=回归平方和+误差平方和方差分析检验的过程1.提出假设:2.采用统计量:注:F= 3.查表并作统计推断:当F<,接受,不存在显著关系;当,在0.05水平上拒绝原假设;当,在0.01水平上拒绝原假设。 15名学生的数学分数与物理分数计算表序号 13132-1.40-6.731.9645.299.422238-9.40-30.7388.36944.33288.86340697.6030.2757.76916.27230.0541921-13.40-17.73179.56314.35273.585606627.6027.27761.76743.65752.6561541-17.402.27302.765.15-39.507465713.6018.27184.96333.79248.478267-6.40-31.7340.961006.79203.0793257-0.4018.270.16333.79-7.31103037-2.40-173.005.762.994.1511586825.6029.27655.36856.73749.31122827-4.40-11.7319.36137.5951.61132241-10.402.27108.165.19-23.61142321-9.40-18.7388.36305.81176.601533300.60-8.730.3676.21-5.24总和4865816072.932875.60平均32.438.73例5,对建立的数学分数预测物理分数的回归方程进行显著性检验。解:提出假设:(1)用回归系数检验回归方程的显著性由表11.1中的结果得:由表中数据,计算带入查表得,结论:在0.01的显著性水平上拒绝,其回归方程是显著的。(2)用积差相关系数检验回归方程的显著性由于N<50,采用统计量查表得所以,在0.01的显著性水平上拒绝原假设,认为回归方程是显著的。(3)用方差分析检验回归方程的显著性由于查表得,因为所以,在0.01水平上拒绝原假设,认为两个变量间回归关系极其显著。综上所述:三种检验方法得到的结果是相同的,可见,三种检验具有等效性。参考文献【1】《教育统计与测量评价新编教程》【M】黄光扬,原霞,华东师范大学出版社【2】《教育统计学》第4版【M】王孝玲,华东师范大学出版社【3】《教育统计与测量导论》【M】刘新平,刘存侠,科学出版社【4】《教育统计学—思想、方法与应用》第2版【M】徐文彬,南京师范大学文献使用情况:相关分析主要借鉴的是王孝玲的《教育统计学》。例如相关的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公益服务协议合同
- 人力资源服务劳务合同
- 劳动合同培训协议
- 高科技企业研发投入合同
- 数据服务合同
- 灯饰采购合同范本
- 课程育人数学课件
- 小升初专题02 汉字
- (6)-小学语文知识(文学、百科)集锦
- 2025年项目安全合同模板
- 干部人事档案管理岗位培训的讲义课件
- 立体构成概述课件完整版
- 财务人员廉政谈话记录 财务个人谈话记录3篇
- 沪教牛津版小学三至六年级英语单词表
- 西门子仿真数据与流程管理平台介绍
- JJG(交通)064-2016 沥青混合料拌和机检定规程-(高清现行)
- 专业税务顾问业务报告
- 钻孔灌注桩钢筋笼加工两种方法
- 学生宿舍楼建筑与结构设计毕业设计计算书
- 局部水头损失计算03835
- 慢性肾小球肾炎详细(课堂PPT)
评论
0/150
提交评论