版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、实实例1:全球吃死的人比饿死的人多? 据世界卫生组织统计,全球肥胖症患者达据世界卫生组织统计,全球肥胖症患者达3亿亿人,其中儿童占人,其中儿童占2200万人,万人,11亿人体重过重。亿人体重过重。肥胖症和体重超常早已不是发达国家的肥胖症和体重超常早已不是发达国家的“专专利利”,已遍及五大洲。目前,全球因,已遍及五大洲。目前,全球因”吃吃”致病乃至死亡的人数已高于因饥饿死亡的人致病乃至死亡的人数已高于因饥饿死亡的人数。数。 (引自引自光明日报光明日报刘军刘军/文)文) 问题问题: 肥胖症和体重超常与死亡人数真有显肥胖症和体重超常与死亡人数真有显著著 的数量关系吗的数量关系吗?第七章第七章 相关分
2、析相关分析妇女生育水平除了受计划生育政策影响以外,还可能妇女生育水平除了受计划生育政策影响以外,还可能与社会、经济、文化等多种因素有关。与社会、经济、文化等多种因素有关。1. 影响中国妇女生育率变动的因素有哪些?影响中国妇女生育率变动的因素有哪些?2. 各种因素对生育率的作用方向和作用程度如何?各种因素对生育率的作用方向和作用程度如何?3. 哪些因素是影响妇女生育率主要的决定性因素?哪些因素是影响妇女生育率主要的决定性因素?4. 如何评价计划生育政策在生育水平变动中的作用?如何评价计划生育政策在生育水平变动中的作用?5. 计划生育政策与经济因素比较计划生育政策与经济因素比较,什么是影响生育率的
3、什么是影响生育率的 决定因素?决定因素?6. 如果某些地区的计划生育政策及社会、经济、文化如果某些地区的计划生育政策及社会、经济、文化 等因素发生重大变化,预期对这些地区的妇女生育等因素发生重大变化,预期对这些地区的妇女生育 水平会产生怎样的影响?水平会产生怎样的影响?第一节第一节 相关分析的意义和任务相关分析的意义和任务 一、相关关系的概念一、相关关系的概念( (注意相关关系与函数关系的区别注意相关关系与函数关系的区别) ) ( (一一) ) 函数关系函数关系 它它反映着现象之间存在着反映着现象之间存在着严格严格的依存关系,也就的依存关系,也就是具有是具有确定性确定性的对应关系,这种关系的对
4、应关系,这种关系可用一个数学可用一个数学表达式表达式反映出来。反映出来。 例例如某种商品的销售额和销售量之间,由于价格如某种商品的销售额和销售量之间,由于价格因素,所以两者可表现为严格的依存关系。因素,所以两者可表现为严格的依存关系。( (二二) ) 相关关系相关关系 它它反映着现象之间的数量上反映着现象之间的数量上不严格不严格的依存关系,的依存关系,也就是说两者之间也就是说两者之间不具有确定性不具有确定性的对应关系,这种关的对应关系,这种关系有二个明显特点:系有二个明显特点:1.1.现现象之间象之间确实存在数量上的依存关系确实存在数量上的依存关系,即某一,即某一社会经济现象变化要引起另一社会
5、经济现象的变社会经济现象变化要引起另一社会经济现象的变化;化;2.2.现现象之间的这种依存关系是象之间的这种依存关系是不严格不严格的,的,即无即无法用数学公式法用数学公式表示。表示。商品价格和商品销售量之间,存在着一商品价格和商品销售量之间,存在着一定的依存关系,即商品价格发生变动,商品定的依存关系,即商品价格发生变动,商品的销售量也会随之发生变动。的销售量也会随之发生变动。例例 在在具有相互依存关系的两个变量中,作为具有相互依存关系的两个变量中,作为根据的变量称自变量,一般用根据的变量称自变量,一般用X X表示;发生对表示;发生对应变化的变量称因变量,一般用应变化的变量称因变量,一般用y y
6、表示。表示。1.1.按按相关关系涉及的因素多少来分,可分为:相关关系涉及的因素多少来分,可分为: 单相关和复相关。单相关和复相关。 在实际工作中,如存在多个自变量,可抓住在实际工作中,如存在多个自变量,可抓住其中主要的自变量,研究其相关关系,而保持另其中主要的自变量,研究其相关关系,而保持另一些因素不变,这时复相关可转化为一些因素不变,这时复相关可转化为偏相关偏相关。二因素之间的相关关系称二因素之间的相关关系称单相关单相关,即只涉,即只涉及一个自变量和一个因变量。及一个自变量和一个因变量。三个或三个以上因素的相关关系称三个或三个以上因素的相关关系称复相关复相关,或多元相关,即涉及二个或二个以上
7、的自变量和或多元相关,即涉及二个或二个以上的自变量和因变量。因变量。二、相关关系的种类二、相关关系的种类 2.2.按按相关关系的性质来分,可分为相关关系的性质来分,可分为: : 正相关和负相关正相关和负相关正相关正相关是指两相关现象变化的方向是一致的。是指两相关现象变化的方向是一致的。负相关负相关是指两相关现象变化的方向是相反的。是指两相关现象变化的方向是相反的。3. 3. 按按相关关系的形式来分,可分为:相关关系的形式来分,可分为: 直线相关和曲线相关直线相关和曲线相关 直线相关直线相关是指两个相关现象之间,当自变量是指两个相关现象之间,当自变量X X的数值发生变动时,因变量的数值发生变动时
8、,因变量y y随之发生近似于固定比随之发生近似于固定比例的变动,在相关图上的例的变动,在相关图上的散点近似地表现为直线形式散点近似地表现为直线形式,因此称其为直线相关关系。因此称其为直线相关关系。 曲线相关曲线相关是指两个相关现象之间,当自变量是指两个相关现象之间,当自变量X X的数值发生变动时,因变量的数值发生变动时,因变量y y也随之发生变动,但这也随之发生变动,但这种变动在数值上不成固定比例,在种变动在数值上不成固定比例,在相关图上的散点可相关图上的散点可表现为抛物线、指数曲线、双曲线等形式表现为抛物线、指数曲线、双曲线等形式,因此称其,因此称其为曲线相关关系。为曲线相关关系。4.4.
9、按按相关程度分,可分为:相关程度分,可分为: 完全相关、不完全相关和不相完全相关、不完全相关和不相关关 完全相关完全相关就是相关现象之间的关系是完全确定的就是相关现象之间的关系是完全确定的关系,因而完全相关关系就是函数关系。关系,因而完全相关关系就是函数关系。 不相关不相关是指两现象之间在数量上的变化上各自独是指两现象之间在数量上的变化上各自独立,互不影响。立,互不影响。 不完全相关不完全相关就是介于完全相关和不相关之间的一就是介于完全相关和不相关之间的一种相关关系。种相关关系。相关分析的对象主要是不完全相关关相关分析的对象主要是不完全相关关系。系。三、相关分析的任务和内容三、相关分析的任务和
10、内容 相关分析的主要任务,概括起来是两个方面:相关分析的主要任务,概括起来是两个方面:一方面一方面,研究现象之间关系的密切程度,即相,研究现象之间关系的密切程度,即相关分析;关分析;另一方面另一方面,研究自变量与因变量之间的变动关,研究自变量与因变量之间的变动关系,用数学方程式表达,即回归分析。系,用数学方程式表达,即回归分析。相关分析的主要内容包括以下五个方面:相关分析的主要内容包括以下五个方面:1. 1. 判判断社会经济现象之间是否存在相互依存断社会经济现象之间是否存在相互依存的关系,是直线相关,还是曲线相关,这的关系,是直线相关,还是曲线相关,这是相关分析的出发点;是相关分析的出发点;2
11、. 2. 确确定相关关系的密切程度;定相关关系的密切程度;3. 3. 测测定两个变量之间的一般关系值;定两个变量之间的一般关系值;4. 4. 测测定因变量估计值和实际值之间的差异,定因变量估计值和实际值之间的差异,用以反映因变量估计值的可靠程度;用以反映因变量估计值的可靠程度;5. 5. 相相关系数的显著性检验。关系数的显著性检验。第二节第二节 简单线性相关分析简单线性相关分析 一、相关表和相关图一、相关表和相关图相关图,也称散布图相关图,也称散布图( (或散点图或散点图) )。 简简单单相相关关表表 根根据据总总体体单单位位的的原原始始资资料料汇汇编编的的相相关关表表分分组组相相关关表表 将
12、将原原始始资资料料进进行行分分组组而而编编制制的的相相关关表表单单变变量量分分组组表表 按按自自变变量量分分组组 双双变变量量分分组组表表 按按自自变变量量和和因因变变量量均均分分组组单变量分组表:指根据一个变量进行分组,另一个变量不单变量分组表:指根据一个变量进行分组,另一个变量不进行分组,只计算次数和平均数。进行分组,只计算次数和平均数。(实际应用最多实际应用最多, P331)双变量分组表:一般情况下很少使用双变量分组表:一般情况下很少使用 某市某市19961996年年 2003 2003年的工资收入与城镇储蓄存款余额年的工资收入与城镇储蓄存款余额的资料,说明简单相关表和相关图的编制方法。
13、的资料,说明简单相关表和相关图的编制方法。 从表可看出,随着工资收入的增加,城镇储蓄存款余额从表可看出,随着工资收入的增加,城镇储蓄存款余额有明显的增长趋势。所以,资料表明有明显的增长趋势。所以,资料表明( (如图如图) )有明显的直线有明显的直线相关趋势。相关趋势。序号序号年份年份工资收入工资收入(万元万元)x城镇储蓄城镇储蓄存款余额存款余额(万元万元)y11996 50012021997 54014031998 62015041999 73020052000 90028062001 97035072002 105045082003 1170510例例1 1企业按销售额分组企业按销售额分组(
14、万元万元)流通费用率流通费用率(%)4以下以下9.65 4 87.68 8 127.2512 167.0016 206.8620 246.7324 286.6428 326.6032 366.5866.577.588.599.51004812162024283236销售额(万元)流通费用率(%)例例2 2二、相关系数二、相关系数 相相关系数是在直线相关条件下,表明两关系数是在直线相关条件下,表明两个现象之间相关关系的方向和密切程度的综个现象之间相关关系的方向和密切程度的综合性指标。一般用符号合性指标。一般用符号r r表示。表示。r r的测定方法:的测定方法:2222221 ()()11 ()
15、()()() ()()1.xyxyxyxyrxxyynxxyynnxxyyrxxyy 积积差差法法:仍以上例1资料计算:序序号号年年份份x(万元万元)y(万元万元)11996 500120-310-155 96100 240254805021997 540140-270-135 72900 182253645031998 620150-190-125 36100 156252375041999 730200 -80 -75 6400 5625 600052000 900280 90 5 8100 25 45062001 970350 160 75 25600 56251200072002105
16、0450 240175 57600 3062542000820031170510 360235129600 5522584600合计合计6480 2200-432400155000 253300yyxx2yy 2xxyy xx经过计算,表明该市工资性收入与城镇储蓄存经过计算,表明该市工资性收入与城镇储蓄存款余额之间存在着高度正相关。款余额之间存在着高度正相关。98. 0155000432400253300)()()()(27582200 ),(8108648022yyxxyyxxrnyynxx万元万元r rr rr rr r0.30.3时时,没没有有关关系系;0.30.3 0.50.5时时,称
17、称低低度度相相关关;0.50.5 0.80b0,x x与与y y为正相关为正相关 b0b0,x x与与y y为负相关为负相关 a a、b b的确定:的确定:在在简单直线回归方程中,简单直线回归方程中,a a、b b为待定系数,常用为待定系数,常用最小平方法来确定,即最小平方法来确定,即(y-y(y-yc c) )2= =最小值。最小值。2ynabxxyaxbx 即即22()nxyxybnxxyxabnn 简单直线回归方程建立的步骤为:简单直线回归方程建立的步骤为: 确确定自变量定自变量x x和因变量和因变量y y; 计计算算xx、yy、 xx2、 xyxy; 代代入公式,先求入公式,先求b b
18、,再求,再求a a。仍用上例1资料得到: yc = -199.5 + 0.5858x表明该市工资收入每增加1万元,储蓄存款余额就增加0.5858万元。举例说明b(回归系数)在经济管理中的作用: 某企业的某种产品月产量与单位成本的关系呈直线关系,用直线回归方程表示是: yc=77.36-1.818x,其中, x表示月产量(千件) y表示单位成本(元); a=77.36(元),表示生产这种产品在单位成本方面的条件(特征); b=-1.818,表示月产品每增加1000件,单位成本平均降低1.818元。 从单变量分组表配合回归直线从单变量分组表配合回归直线(选学(选学) 222cyabxyfafbxf
19、xyfaxfbx ffxyfxfyfbfx fxfyfxfaybxbff 方方法法基基本本上上与与上上述述相相同同,只只是是在在计计算算过过程程中中要要采采用用加加权权方方法法:简单直线回归分析的主要特点:简单直线回归分析的主要特点: 1.1.直直线回归分析时,要根据研究目的,在两线回归分析时,要根据研究目的,在两个变量之间确定哪个是自变量,哪个是因变量。个变量之间确定哪个是自变量,哪个是因变量。 2.2.在在两个现象互为根据的情况下,可以有两两个现象互为根据的情况下,可以有两个回归方程:个回归方程: y yc c=a+bx=a+bx 称称y y倚倚x x回归直线回归直线 x xc c=c+d
20、y=c+dy 称称x x倚倚y y回归直线回归直线( (二二) ) 多元线性回归分析多元线性回归分析 多多元线性回归分析可以看作是一元线元线性回归分析可以看作是一元线性回归分析的扩展。现以二元线性回归模性回归分析的扩展。现以二元线性回归模型进行回归分析,其方程式为:型进行回归分析,其方程式为:为为因因变变量量估估计计值值、 、 为为参参数数确确定定 、 、 的的数数值值,也也要要用用最最小小平平方方法法,使使为为最最小小值值,根根据据微微分分学学中中求求极极值值的的原原理理,对对 、 、 分分别别求求偏偏导导数数并并令令其其为为零零,便便可可求求得得如如下下三三个个规规范范方方程程:11221
21、221212112221111212221122 ()cccyab xb xyabbabbyyabbynabxbxx yaxbxbx xx yaxbx xb 22x 以我国19731983年11年手表销售量和手表价格的实际资料为例,拟合一元线性回归方程为: yc= 9643 - 65x此时,回归系数b表明,手表平均价格每降低1元/只,销售量约平均增长65万只。 一元线性回归模型只列入了手表平均价格对销售量的影响,而忽略了居民收入这一很重要的因素,因此,现对此资料补入同期居民人均货币收入资料,将原来的一元线性回归模型扩展为二元线性回归模型进行回归分析。例例列成计算表如下:年份年份(n=11)手表
22、销售量手表销售量y(万只万只)人均货币人均货币收入收入x1(元元)手表平均手表平均价格价格x2(元元/只只)x1yx2yx1x21973 650.4102.113466405.8487153.613681.41974 758.4105.313479859.52101625.614110.21975 819.9110.112990270.99105767.114202.91976 1051.7113.9131119788.63137772.714920.91977 1149.7120.4127148423.88146011.915290.81978 1388.1131.0125181841.10
23、173512.516375.01979 1944.4157.0123305270.80239161.219311.01980 2534.0193.5123490329.00311682.023800.51981 2890.0210.2114607478.00329460.023962.81982 3576.0228.7 89817831.20318264.020354.31983 3898.0258.7 861008412.60335228.022248.2合计合计20660.61730.9562285638.6198258.0年份年份(n=11)197310 424
24、.4117 956197411 088.0917 956197512 122.0116 641197612 973.2117 161197714 496.1616 129197817 161.0015 625197924 649.0015 129198037 442.2515 129198144 184.0412 996198252 303.697 921198366 925.697 396合计合计303 769.55160 03921x22x续表续表21212121210328.86368.180641.940328.86368.180641.9416003919825813156 .228
25、563819825855.3037699 .173056.390591113159 .1730116 .20660 xxybbabbabbabbacb1表明在手表平均价格固定时,人均货币收入每增加元,手表销售量平均增长18.6368万只;b2表明在人均货币收入固定时,手表平均价格每上升元/只,手表销售量平均减少8.0328万只。这里的b2比原一元线性回归模型中的同一回归系数b=-65要大得多,是因为一元线性回归模型只列入了手表平均价格对销售量的影响而忽略了居民收入这一很重要的因素,在手表平均价格的影响中渗入了居民收入的影响。210328.86368.180641.94xxyc211223311
26、22211112121222112222112211 cnnnnnnnnnnnnnnyab xb xb xb xnnynabxbxbxx yaxbxbx xbx xx yaxbx xbxbx xx yaxbx xbx xbx L LL LL LL LM ML L因因有有个个参参数数,应应确确定定个个方方程程式式:二、曲线回归二、曲线回归 拟合方法拟合方法:统计上通常采用变量代换法把:统计上通常采用变量代换法把非线性形式转换为线性形式处理,使线性非线性形式转换为线性形式处理,使线性回归分析的方法也能适用于非线性回归问回归分析的方法也能适用于非线性回归问题的研究。题的研究。 某商店各个时期的商品流
27、通费率和商品零售额资料如下:某商店各个时期的商品流通费率和商品零售额资料如下:x商品零售商品零售额额(万元万元)9.511.513.515.517.519.521.523.525.527.5y商品流通商品流通费率费率(%)6.0 4.64.03.22.82.52.4 2.3 2.22.1散点图显示出散点图显示出x x与与y y的变动关系为一条递减的双曲线。的变动关系为一条递减的双曲线。经济理论和实际经验都可说明,流通费率决定于商品经济理论和实际经验都可说明,流通费率决定于商品零售额,体现着经营的规模效益。零售额,体现着经营的规模效益。例例双曲线方程为:双曲线方程为:11 ccyabxyabxx
28、x 令令, 则则 :然然 后后 用用 最最 小小 平平 方方 法法 解解 出出 参参 数数 如如 下下 计计 算算 表表 : 9.56.00.1050.011030.6311.54.60.0870.007560.4013.54.00.0740.005490.3015.53.20.0650.004160.2117.52.80.0570.003270.1619.52.50.0510.002630.1321.52.40.0470.002160.1123.52.30.0430.001810.1025.52.20.0390.001540.0927.52.10.0360.001320.08合计合计 32.10.6040.040972.21xx1 2 xyx(%)y)(万元x
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度电子琴研发与生产合作合同(琴行与科技公司)
- 2024年度广告创意设计与制作合同书
- 2024年度产学研合作合同:高校与企业产学研合作项目
- 大学英语语法课件教学
- 《食物中毒与预防》课件
- 端午节课件 的
- 《全国税务反诈骗》课件
- 青岛版四年级下册数学全册教案
- xx集团中高层人力资源管理体系培训课件
- 2024年度砌块需求与供应量预测合同3篇
- 2024水样采集与保存方法
- 2025届高考语文一轮复习:二元思辨类作文思辨关系高阶思维
- 糖尿病患者体重管理专家共识(2024年版)解读
- 静电粉末喷涂实用工艺
- 高速公路布控图(电子版)
- 学生放学高峰期校门口疏导方案
- 建筑桩基技术规范 JGJ942008
- 第三章非均相反应
- 榆林地区电厂明细
- 经开区闲置低效工业用地盘活处置工作实施方案
- 卫生院基本公共卫生服务项目工作进度表
评论
0/150
提交评论