版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章相关与回归分析
第1节变量间关系的度量
一、变量间的相互关系1、函数关系:是指当一个或几个变量取一定的值时,另一个变量有确定值与之相对应的确定性关系。
y=f(x)函数关系(举例)某种商品的销售额y与销售量x之间的关系可表示为y=px
(p为单价)圆的面积S与半径R之间的关系可表示为S=
R2
企业的原材料消耗额y与产量x1
、单位产量消耗x2
、原材料价格x3之间的关系可表示为
y=x1x2x3
2、相关关系
当一个变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系。
相关关系一个变量的取值不能由另一个变量唯一确定当变量
x取某个值时,变量y的取值可能有几个各观测点分布在直线周围
Y=f(X)+ε(ε为随机变量)
xy相关关系(举例)父亲身高x与子女身高y之间的关系收入水平y与受教育程度x之间的关系商品的消费量y与居民收入x之间的关系商品销售额y与广告费支出x之间的关系没有关系◆没有关系
二、相关关系的类型
按相关关系的表现形式:线性相关和非线性相关;按相关关系变化的方向:正相关和负相关;按相关的程度:完全相关、不完全相关和完全不相关;
完全负线性相关完全正线性相关
散点图
(scatterdiagram)
不相关
负线性相关
正线性相关
非线性相关1.散点图第2节相关关系的描述与测度
完全负线性相关完全正线性相关
散点图
(scatterdiagram)
不相关
负线性相关
正线性相关
非线性相关2.相关系数度量变量之间关系强度的一个统计量;对两个变量之间线性相关强度的度量称为简单相关系数;若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;若是根据样本数据计算的,则称为样本相关系数,简称为相关系数,记为r;相关系数的性质性质1:r
的取值范围是[-1,1]|r|=1,为完全相关r=1,为完全正相关r=-1,为完全负正相关
r=0,不存在线性相关关系
-1
r<0,为负相关0<r
1,为正相关|r|越趋于1表示关系越强;|r|越趋于0表示关系越弱相关系数的性质性质2:r具有对称性。即x与y之间的相关系数和y与x之间的相关系数相等,即rxy=ryx性质3:r数值大小与x和y原点及尺度无关,即改变x和y的数据原点及计量尺度,并不改变r数值大小性质4:仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系。这意味着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系相关系数的经验解释
|r|
0.8时,可视为两个变量之间高度相关0.5
|r|<0.8时,可视为中度相关0.3
|r|<0.5时,视为低度相关|r|<0.3时,说明两个变量之间的相关程度极弱,可视为不相关例:根据下表资料,计算该公司B产品的广告费投入与销售收入之间的相关系数。年份广告费(万元)销售收入(万元)20011.34820022502003352200445220055.15320066.354200765520086.256200975620107.257相关系数的显著性检验
相关系数不是确定的值,作为随抽样而变动的随机变量,样本相关系数具有一定的概率分布,要对样本相关系数进行显著性检验,r的显著性检验通常采用t分布检验。相关系数的显著性检验
1.检验两个变量之间是否存在线性相关关系采用R.A.Fisher提出的t检验检验的步骤为提出假设:H0:
;H1:
0计算检验的统计量确定显著性水平α4.比较、决策若|t|>tα/2(n-2)
,则拒绝原假设H0,表明总体的两个变量之间存在显著的线性关系。例:根据下表资料,计算该公司B产品的广告费投入与销售收入之间的相关系数。年份广告费(万元)销售收入(万元)20011.34820022502003352200445220055.15320066.354200765520086.256200975620107.257解:1.提出假设
H0:ρ=0H1:ρ≠02.计算统计量
3.确定显著水平:α=0.054.因为t>所以拒绝原假设,该公司B产品的广告费投入与销售收入之间存在显著的正线性相关关系练习企业编号产量生产费用企业编号产量生产费用123456404250556578581058811811713778910111284100116125130140157169149202175185
第2节一元线性回归分析
相关和回归分析是研究变量之间不确定性统计关系的重要方法。相关分析主要是判断两个或两个以上变量之间是否存在相关关系,并分析变量间相关关系的形态和程度。回归分析主要是对存在相关关系的现象间数量变化的规律性作测定。假定因变量与自变量之间有某种关系,并把这种关系用适当的数学模型表达出来,那么,就可以利用这一模型根据给定的自变量来预测因变量,这就是回归要解决的问题回归分析研究什么?
正线性相关回归分析研究什么?在回归分析中,只涉及一个自变量时称为一元回归,涉及多个自变量时则称为多元回归。如果因变量与自变量之间是线性关系,则称为线性回归(linearregression);如果因变量与自变量之间是非线性关系则称为非线性回归(nonlinearregression)一元线性回归涉及一个自变量的回归因变量y与自变量x之间为线性关系被预测或被解释的变量称为因变量,用y表示用来预测或用来解释因变量的一个或多个变量称为自变量,用x表示因变量与自变量之间的关系用一个线性方程来表示一元线性回归模型描述因变量y如何依赖于自变量x和误差项
的方程称为回归模型一元线性回归模型可表示为
y=b0+b1x+
y是x的线性函数(部分)加上误差项线性部分反映了由于x的变化而引起的y的变化误差项
是随机变量反映了除x和y之间的线性关系之外的随机因素对y的影响式中
0和
1称为模型的参数回归方程
描述y的平均值或期望值如何依赖于x的方程称为回归方程一元线性回归方程的形式如下
E(y)=
0+
1x假定E(ε)=0回归方程
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安徽省A10联盟2025届高三上学期11月段考语文试卷(含答案)
- 《创意中国龙》课件2024:弘扬民族精神传承文化根脉
- 美容院财务主管聘用协议
- 保安工作总结计划成人用品行业保安工作的隐私保护
- 河道清洁维护施工协议
- 2024年折叠筷子:课堂演示与环保的完美结合
- 2023年9月15日中级注册安全工程师-安全生产法律法规真题
- 人教部编版《道德与法治》二年级上册第3课《欢欢喜喜庆国庆》精美课件(第2课时)
- 红色扁平化抗美援朝精神冰雕精神党课课件教育(冰雕连)
- 智能卫浴用品制造业的账务处理-记账实操
- 2024江苏省沿海开发集团限公司招聘23人高频难、易错点500题模拟试题附带答案详解
- 2024年计算机二级WPS考试题库380题(含答案)
- 22G101三维彩色立体图集
- 大学生安全文化智慧树知到期末考试答案章节答案2024年中南大学
- 建筑施工安全生产治本攻坚三年行动方案(2024-2026年)
- 人教版小学英语单词表(完整版)
- DL-T 1476-2023 电力安全工器具预防性试验规程
- 《短视频拍摄与制作》课件-3短视频拍摄的三大技巧
- 【川教版】《生命 生态 安全》四上第11课《预防流感》课件
- 2024年江苏江南水务股份有限公司招聘笔试参考题库附带答案详解
- 用友华表伙伴商务手册.
评论
0/150
提交评论