版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、应用统计学习题解答第一章 绪 论【1.1】指出下列变量的类型:(1)汽车销售量;(2)产品等级;(3)到某地出差乘坐的交通工具(汽车、轮船、飞机);(4)年龄;(5)性别;(6)对某种社会现象的看法(赞成、中立、反对)。【解】(1)数值型变量(2)顺序变量(3)分类变量(4)数值型变量(5)分类变量(6)顺序变量【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。要求:(1)描述总体和样本。(2)指出参数和统计量。(3)这里涉及到的统计指标是什么?【解】(1)总体:某大学所有的大学生 样本:从某大学抽取的200名大学生 (2)参数:某大学大学生的月平均消费水平 统计量:从
2、某大学抽取的200名大学生的月平均消费水平(3)200名大学生的总消费,平均消费水平【1.3】下面是社会经济生活中常用的统计指标:轿车生产总量,旅游收入,经济发展速度,人口出生率,安置再就业人数,全国第三产业发展速度,城镇居民人均可支配收入,恩格尔系数。在这些指标中,哪些是数量指标,哪些是质量指标?如何区分质量指标与数量指标?【解】数量指标有:、质量指标有:、数量指标是说明事物的总规模、总水平或工作总量的指标,表现为绝对数的形式,并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标,通常是两个有联系的统计指标对比的结果。【1.4】某调查机构从某小区随机地抽取了5
3、0为居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。回答以下问题:(1) 这一研究的总体是什么?(2) 月收入是分类变量、顺序变量还是数值型变量?(3) 对居住环境的满意程度是什么变量?【解】(1)这一研究的总体是某小区的所有居民。(2)月收入是数值型变量(3)对居住环境的满意程度是顺序变量。第二章 统计数据的搜集【2.1】从统计调查对象包括的范围、调查登记时间是否连续、搜集资料的方法是否相同等方面,对以下统计调查实例分类,并指出各属于那种统计调查方式。(1) 2004年,对我国的工业企业从业人数进行调查,各企业按上级部
4、门要求填报统计表;(2) 2004年,对全国所有第二、第三产业活动单位进行基本情况摸底调查,以2004年12月31日为标准时点,调查2004年度的资料;(3) 对进口的一批产品,抽检其中少部分以对整批产品质量进行评价;(4) 要了解全国粮食产量的基本情况,只要对全国几个重点粮食产区进行调查,就能及时地对全国粮食产量的基本情况进行推断;(5) 为了探讨一项新改革措施实施的效果,推广其成功的经验,对已采取改革措施并产生明显效果的代表性单位进行调查。【解】(1)的调查方式是统计报表制度 (2)的调查方式是普查 (3)的调查方式是抽样调查 (4)的调查方式是重点调查 (5)的调查方式是典型调查【2.2
5、】某调查机构从某小区随机地抽取了50位居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。回答下列的问题:(1)这里用到什么调查方式?(2)这里涉及的数据有哪些?哪些是截面数据,哪些是动态数据?【解】(1)这里用到的调查方式是抽样调查。(2)这里涉及的数据主要有:居民对居住环境的态度、月收入,这些数据都是截面数据。第三章 统计数据的整理与显示【3.1】已知40名消费者购买5种不同款式的手机,分别是:a.诺基亚 b.摩托罗拉 c.波导 d.联想 e.西门子。他们购买的情况如下表所示:abdbebcdbabedaaeceedbe
6、badacaadebecaccbac要求:(1)指出上面的数据属于什么类型?(2)用excel制作一张频数分布表。(3)绘制一张条形图和一张饼图,反映各类别的频数分布情况。【解】(1)上面数据属于分类型数据(2)频数分布表如下表所示:类别频数比例百分比(%)a100.2525b90.22522.5c70.17517.5d60.1515e80.2020(3)条形图如下所示 饼图如下图所示【3.2】已知40份用于购买汽车的个人贷款数据:9305144561903124012802550585164012172235957211144578387263830053461590110055497466
7、07201377861328142374725611903401620152512001780935592655要求:(1)利用excel的frequency函数进行统计分组整理,编制频数分布表,并计算出累积频数和累积频率。(2)利用spss绘制直方图。【解】(1)excel中得到的频数分布表贷款数据频数频率(%)向上累积向下累积频数频率(%)频数频率(%)050061561540100500100016402255348510001500820307518451500200061536901025200025002538954102500以上254010025合计40100(2)spss中绘
8、制的直方图【3.3】下表列出了最近某年5月15日美国30个城市的最低温度。要求做出最低温度数据的茎叶图。城市最低温度城市最低温度城市最低温度奥尔巴尼39哥伦比亚47洛杉矶61安克雷奇47哥伦布40孟菲斯51亚特兰大46达拉斯68纽约城50奥斯丁66底特律43菲克尼斯74伯明翰42韦恩堡37波特兰53波士顿53格林贝38旧金山55布法罗44檀香山65西雅图50卡斯帕51休斯顿67锡拉拉丘兹43芝加哥45杰克逊维尔50坦帕59克利夫兰40拉斯维加斯63华盛顿52【解】最低温度的茎叶图最低温度 stem-and-leaf plotfrequency stem & leaf 3.00 3 . 789
9、6.00 4 . 002334 4.00 4 . 5677 8.00 5 . 00011233 2.00 5 . 59 2.00 6 . 13 4.00 6 . 5678 1.00 7 . 4 stem width: 10 each leaf: 1 case(s)【3.4】下表列出了某班12名学生的身高、体重和肺活量的相关数据 学生编号身高体重肺活量1135.1 32.0 1.75 2139.9 30.4 1.75 3163.6 46.2 2.75 4146.5 33.5 2.50 5156.2 37.1 2.75 6156.4 35.5 2.00 7167.8 41.5 2.75 8149.
10、7 31.0 1.50 9145.0 33.0 2.50 10148.5 37.2 2.25 11165.5 49.5 3.00 12135.0 27.6 1.25 要求:绘制出不同学生的身高、体重和肺活量的箱线图。【解】12名学生身高、体重、肺活量的箱线图【3.5】据中国统计年鉴.2005年,19982004年中国对外贸易进出口数据如下:(单位:亿美元)年份1998199920002001200220032004出口总额1837194924922661325643825933进口总额1402165722512436295241285612要求:在同一坐标系内绘制出出口总额、进口总额的时间序列
11、线图。【解】出口总额和进口总额的线图【3.6】从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:企业编号产量生产费用14013024215035015545514056515067815478416581001709116167101251801113017512140185要求:绘制产量与生产费用的散点图。【解】产量与生产费用之间的散点图第四章 统计描述【4.1】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。试分别计算产量、成本、劳动生产率的计划完成程度。【解】产量的计划完成程度=即产量超额
12、完成12.5%。成本的计划完成程=即成本超额完成3.16%。劳动生产率计划完=即劳动生产率超额完成1.85%。【4.2】某煤矿可采储量为200亿吨,计划在19911995年五年中开采全部储量的0.1%,在五年中,该矿实际开采原煤情况如下(单位:万吨)年份1991年1992年1993年1994年1995年上半年下半年上半年下半年实际开采量156230540279325470535累计开采量试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。【解】本题采用累计法:(1)该煤矿原煤开采量五年计划完成= =即:该煤矿原煤开采量的五年计划超额完成26.75%。(2)将1991年的实际开采量一直加
13、到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。【4.3】我国1991年和1994年工业总产值资料如下表:1991年1994年数值(亿元)比重(%)数值(亿元)比重(%)轻工业总产值13800.921670.6重工业总产值14447.129682.4工业总产值2824851353要求:(1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中;(2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)?(3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几?【解】(1)199
14、1年1994年数值(亿元)比重(%)数值(亿元)比重(%)轻工业总产值13800.948.86%21670.642.20%重工业总产值14447.151.14%29682.457.8%工业总产值2824851353(2)是比例相对数;1991年轻工业与重工业之间的比例=;1994年轻工业与重工业之间的比例=(3)即,94年实际比计划增长25.37%。【4.4】某乡三个村2000年小麦播种面积与亩产量资料如下表:村名亩产量(斤)播种面积亩数(亩)所占比重(%)甲700120乙820150丙650130合计要求:(1)填上表中所缺数字;(2)用播种面积作权数,计算三个村小麦平均亩产量;(3)用比重
15、作权数,计算三个村小麦平均亩产量。【解】(1)村名亩产量(斤)播种面积亩数(亩)所占比重(%)甲70012030%乙82015037.5%丙65013032.5%合计400100%(2)(3)【4.5】两种不同品种的玉米分别在五块地上试种,产量资料如下:甲品种乙品种田块面积(亩)总产量(斤)田块面积(亩)总产量(斤)0.88400.96300.981011200111001.311701.110401.313001.212001.516805499065980已知生产条件相同,对这两种玉米品种进行分析比较,试计算并说明哪一种品种的亩产量更稳定一些?【解】即: 由于是总体数据,所以计算总体均值:
16、计算表格甲品种田块面积(亩)总产量(斤)亩产量0.884010500.98109001110011001.11040945.45 1.212001000总计: 54990乙品种田块面积(亩)总产量(斤)亩产量0.96307001120012001.311709001.3130010001.516801120总计: 65980下面分别求两块田地亩产量的标准差:要比较两种不同玉米的亩产量的代表性,需要计算离散系数:,甲品种的亩产量更稳定一些。【4.6】两家企业生产相同的产品,每批产品的单位成本及产量比重资料如下:甲企业批次单位产品成本(元/台)产量比重(%)第一批10010第二批11020第三批1
17、2070合计100乙企业批次单位产品成本(元/台)产量比重(%)第一批10033第二批11033第三批12034合计100试比较两个企业哪个企业的产品平均单位成本低,为什么?【解】乙企业的产品平均单位成本更低。【4.7】某粮食储备库收购稻米的价格、数量及收购额资料如下:等级单价(元/斤)收购量(万斤)收购额(万元)一级品1.220002400二级品1.0530003150三级品0.940003600要求:(1)按加权算术平均数公式计算稻米的平均收购价格;(2)按加权调和平均数公式计算稻米的平均收购价格。【解】(1)(2)【4.8】已知我国1995年1999年末总人口及人口增长率资料:年份199
18、419951996199719981999年末总人口(万人)119850121121122389123626124810125909人口增长率()11.610.4710.1110.19.588.81试计算该期间我国人口平均增长率。【解】计算过程如下:年份199419951996199719981999年末总人口(万人)119850121121122389123626124810125909年内总人口数(万人)120486121755123008124218125360按照平均增长率的公式可知:所以,1995年1999年期间我国人口平均增长率=【4.9】某单位职工按月工资额分组资料如下:按月工资
19、额分组(元)职工人数(人)人数所占比重(%) 4000元以下2510.59 4000-50003715.68 5000-600013456.78 6000-70003012.71 7000以上104.24 总计236100.00 根据资料回答问题并计算:(1)它是一个什么数列?(2)计算工资额的众数和中位数;(3)分别用职工人数和人数所占比重计算平均工资。结果一样吗?(4)分别计算工资的平均差和标准差。【解】(1)是等距分组数列(2)即:(注:用上限公式算出的结果与上述结果相同)(注:用上限公式算出的结果与上述结果相同)(3)两者结果一样。(忽略小数点位数的保留对结果造成的影响)(4)平均差
20、标准差 【4.10】某市甲、乙两商店把售货员按其人均年销售额分组,具体资料如下:甲商场乙商场按销售额分组(万元)售货员人数(人)按销售额分组(万元)售货员人数(人)20-303030-402030-4011040-508040-509050-605550-606060-704060以上1070以上5合计300合计200要求:(1)分别计算这两个商场售货员的人均销售额;(2)通过计算说明哪个商场人均销售额的代表性大?【解】(1) (2),乙商场销售额的代表性大。第五章 统计抽样【5.1】袋中装有5只同样大小的球,编号为1,2,3,4,5,从中同时取出3只球,求取出的最大号的分布律及其分布函数并画
21、出其图形。 【解】先求的分布律:由题知,的可能取值为3,4,5,且 ,的分布律为:,由得:【5.2】设的密度函数为求: (1)常数c;(2)的分布函数;(3)。【解】(1)(2)当时,; 当时, 当时,.故分布函数(3)【5.3】随机变量相互独立,又,,试求和。【解】【5.4】一本书排版后一校时出现错误处数服从正态分布,求: (1)出现错误处数不超过230的概率;(2)出现错误处数在190210的概率。【解】(1) (2) 【5.5】某地区职工家庭的人均年收入平均为12000元,标准差为2000元。若知该地区家庭的人均年收入服从正态分布,现采用重复抽样从总体中随机抽取25户进行调查,问出现样本
22、均值等于或超过12500元的可能性有多大?【解】对总体而言,样本均值 【5.6】某商场推销一种洗发水。据统计,本年度购买此种洗发水的有10万人,其中3万6千人是女性。如果按重复抽样方法,从购买者中抽出100人进行调查,问样本中女性比例超过50%的可能性有多大?【解】总体比例即第六章 统计推断【6.1】采取重复抽样的方法,从某总体中抽取样本容量为250的一组样本,已知样本成数(比例)p=0.38,试计算样本成数(比例)的估计误差及抽样标准差。【解】样本比例的估计误差为:抽样标准差为:【6.2】抽取一个样本容量为100的随机样本,其均值为36,标准差为7。试求总体均值95%的置信区间。【解】因为是
23、大样本,总体方差未知,所以总体均值95%的置信区间为:【6.3】随机抽取一个由360名教师组成的样本,让每个人对一些说法表明自己的态度。第一种说法是“年龄偏大的学生对班上的讨论比年龄小的学生更积极”。态度按5分制来衡量:1=非常同意;2=同意;3=没有意见 ;4=不同意;5=很不同意。对这一看法,样本的平均态度得分为2.08 ,标准差为0.95。试用98%的置信度估计教师对这一看法的平均态度得分的置信区间。【解】因为是大样本,总体方差未知,所以总体均值的98%的置信区间为:【6.4】税务管理官员认为,大多数企业都有偷税漏税行为。在对由750个企业构成的随机样本的检查中,发现有121个企业有偷税
24、漏税行为。试以90%的置信度估计偷税漏税企业比例的置信区间。【解】因为满足大样本,且样本比例为:所以,偷税漏税企业比例90%的置信区间为:【6.5】为估计自考学生的平均年龄,随机抽取一个样本容量为64的样本,其中平均年龄为26.5岁,标准差为4岁,试求自考学生总体平均年龄的99%的置信区间。【解】因为是大样本,总体方差未知,所以总体均值95%的置信区间为:【6.6】销售公司要求销售人员与顾客经常保持联系。一项由60名销售人员组成的随机样本表明:销售人员每周与顾客保持联系的平均次数为21.5次,样本标准差 为4次。试求销售人员每周与顾客保持联系的总平均次数95%的置信区间。【解】因为是大样本,总
25、体方差未知,所以总体均值95%的置信区间为:【6.7】某地区调查下岗职工中女性的比例,随机抽取了49名下岗职工,其中25人为女性,现以90%的置信度估计该地区下岗职工中女性比例的置信区间。【解】因为满足大样本,且样本比例为:所以,该地区下岗职工中女性比例的90%的置信区间为:【6.8】某健康机构想估计现代白领员工平均每天参加体育锻炼的时间。从16家公司中随机抽取25名白领员工,得知:其平均每天锻炼的时间为54分钟,标准差为30分钟。假设白领员工每天参加体育锻炼的时间服从正态分布。试求在95%的置信度下白领员工平均每天参加体育锻炼时间的置信区间。【解】因为是正态总体、小样本、方差未知所以,白领员
26、工平均每天参加体育锻炼时间的95%的置信区间为:【6.9】某县城妇联要估计该地区职业女性平均每天的家务劳动时间,根据以往数据显示,该地区职业女性平均每天家务劳动时间的标准差为2小时。已知该地区的职业女性共有5000名,要求估计误差不超过1.5小时,假设采取不重复抽样,问:在95%的置信度下应该抽取多大的样本?【解】不重复抽样条件下,关于均值的样本量确定公式为:(注:将题目中的估计误差1.5小时改为0.5小时)【6.10】某省进行人口出生率的调查,根据以往的资料,该省的人口出生率约为10。若要求估计误差不超过5%,置信度为95%,在重复抽样条件下,应该抽取多大的样本?【解】重复抽样条件下,关于比
27、例的样本量确定公式为:(注:将题目中的估计误差5%改为5)【6.11】设某厂生产的一种灯管的寿命,从过去较长一段时间的生产情况来看,灯管的平均寿命小时,现在采用新工艺后,在所生产的灯管中抽取36只,测得平均寿命小时,问采用新工艺后,灯管寿命是否有显著提高?()【解】根据题意,要检验采用新工艺后,灯管寿命是否有显著提高,因此采用单侧检验。建立的假设为:已知,因为是大样本,所以采用z检验统计量。,因为,所以拒绝原假设,即采用新工艺后,灯管寿命有显著提高。【6.12】已知普通成年人安静时的心率服从正态分布,其平均数是72次min。现从某体院随机抽测64名男生,测得安静时心率平均数为68次min,标准
28、差为6.4次/min,试问某体院男生安静时心率与普通成年人的心率有无差异?()【解】根据题意,要检验体院男生安静时心率与普通成年人的心率有无差异,即平均数是否达到72次min,因此采用双侧检验。建立的假设为: 已知,因为是大样本,所以采用z检验统计量。,因为,所以拒绝原假设,即体院男生安静时心率与普通成年人的心率有差异。【6.13】某车间用一台包装机包装葡萄糖, 包得的袋装糖重是一个随机变量, 它服从正态分布。当机器正常时, 其均值为0.5千克, 标准差为0.015千克.某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重为(千克): 0.498 0.508 0.518 0
29、.524 0.499 0.513 0.521 0.515 0.512, 问机器是否正常? ()【解】根据题意,要检验机器是否正常工作,即袋装糖重是否为0.5千克,因此采用双侧检验。建立的假设为:已知,因为是小样本,已知,所以采用z检验统计量。 ,因为,所以拒绝原假设,即机器工作不正常。【6.14】四步助跑摸高成绩服从正态分布。我国女子优秀跳高运动员平均成绩为3.10米,某省6名女运动员的平均成绩为2.95米,标准差0.36米,问该省运动员的成绩是否低于我国优秀运动员?【解】根据题意,要检验该省运动员的成绩是否低于我国优秀运动员,因此采用单侧检验。建立的假设为:已知,因为是小样本,未知,所以采用
30、检验统计量。 ,因为,所以不能拒绝原假设,即该省运动员的成绩不低于我国优秀运动员的成绩。【6.15】某厂家向一百货商店长期供应某种货物,双方根据厂家的传统生产水平,定出质量标准,即若次品率超过3%,则百货商店拒收该批货物。今有一批货物,随机抽43件检验,发现有次品2件,问应如何处理这批货物?【解】根据题意,要决定如何处理这批货物,也就是该百货商店要不要收这批货物,由次品率是否超过3%来决定,因此采用单侧检验。建立的假设为:已知,采用检验统计量。 ,因为,所以不能拒绝原假设,即百货商店可以接受这批货物。【6.16】某厂生产的某种型号电池,其寿命长期以来服从方差的正态分布。今有一批这种电池,从它的
31、生产情况来看,寿命波动性比较大。为判断这种想法是否合乎实际,随机抽取了26只电池,测出其寿命的样本方差为。问根据这个数据能否判定这批电池的波动性较以往的有显著的变化(取)? 【解】根据题意,要判定这批电池的波动性较以往是否有显著的变化,就是要检验这批电池的方差是否为5000,因为采用双侧检验。建立的假设为: 已知,采用检验统计量。,因为,所以拒绝原假设,即这批电池的波动性较以往是有显著的变化。第七章 方差分析(以下均为excel输出结果)【7.1】有某种型号的电池,他们分别为甲、乙、丙三个工厂所生产的。为评比其质量,各随机抽取5只电池为样本,经试验测得其寿命(单位:小时)如下:试验号电池生产企
32、业甲乙丙12345495039404328323026343840454248要求:检验三个工厂的电池平均寿命有无显著的差异?()【解】方差分析表差异源ssdfmsfp-valuef crit组间604.93332302.466717.619420.0002693.885294组内2061217.16667总计810.933314由于p-value=0.0002690.05,说明拒绝原假设,表明三个工厂的电池平均寿命有显著差异。【7.2】某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了20名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数
33、进行方差分析得到下表的结果。差异源ssdfmsfp-valuef crit组间4350.03253.592组内1904总计19要求:完成上面的方差分析表,并检验三种方法组装的产品数量之间是否有显著差异?() 【解】差异源ssdfmsfp-valuef crit组间87024353.81180.03253.592组内190417114.118总计19由于p-value=0.03250.05,说明拒绝原假设,表明三种方法组装的产品数量之间有显著差异。【7.3】为比较四种不同品牌的汽车使用相同类型汽油时的耗油量,在相同的行驶条件下,不同品牌汽车测得每加仑汽油所行使的里程数如下表:品牌1品牌2品牌3品
34、牌4151214151211121391413111718161415要求:分析四种不同品牌的车耗油量是否有显著差异?()【解】方差分析表差异源ssdfmsfp-valuef crit组间53.50098317.833667.1079480.0045233.410534组内32.61667132.508974总计86.1176516由于p-value=0.0045230.05,说明不能拒绝原假设,表明没有证据证明不同品种的种子对收获量有显著的影响;由于列因素的p-value=0.0557590.05,说明不能拒绝原假设,表明没有证据证明不同施肥量方案对收获量有显著的影响。【7.5】某金属材料生
35、产过程中,为提高其强度,需要进行热处理。热处理的温度和时间是影响该材料强度的两个主要因素。现取三个温度水平和四个时间水平,各个不同水平的每一组合都进行了二次试验,测得该材料在各种热处理方式下的强度数据如下表。试分析温度、时间两个因素各自以及两个因素的交互作用对材料强度是否显著地影响。() 时间bb1b2b3b4温度aa15356697163645659a27168777869705859a37576727168665658【解】方差分析差异源ssdfmsfp-valuef crit样本256.08332128.041768.288892.78e-073.885294列714.79173238.
36、2639127.07412.34e-093.490295交互313.5833652.2638927.874072.24e-062.99612内部22.5121.875总计1306.95823由于行因素的p-value=2.78e-070.05,说明拒绝原假设,表明温度因素对材料强度有显著的影响;由于列因素的p-value=2.34e-090.05,说明拒绝原假设,表明时间因素对材料强度有显著的影响;交互作用的p-value=2.24e-060.05,说明拒绝原假设,表明温度和时间两个因素的交互作用对材料的强度有显著影响。第八章 相关分析和回归分析*【8.1】某店主分析其店面的经营情况时,收集了
37、连续10天的访问量数据(单位:天)和当天营业额数据(单位:元)如下。编号访问量营业额编号访问量营业额1741306739026610076670388130896140469110958505911601073100对以上访问量和营业额数据作相关分析。【解】相关分析 (1)画访问量和营业额数据的散点图,如下所示从图上可以看出,访问量和营业额数据是简单线性正的不完全相关。(2)计算相关系数计算访问量和营业额的简单线性相关系数为0.871508,大于0.8,说明访问量和营业额之间存在较高的线性关系。【8.2】某饮料广告费投入为x,产品销售数量为y,根据收集2年的月度数据资料,计算得到以下结果:,(
38、1)计算相关系数,并初步判断x与y之间的关系;(2)用最小二乘法估计模型回归系数,并写出模型结果;(3)说明所计算的回归系数的经济意义;(4)计算模型可决系数,并用其说明模型的拟合效果。【解】最小二乘法的计算(一元)(1)计算相关系数,并初步判断x与y之间的关系;计算x与y相关系数为r=0.996268,说明两者的简单线性相关程度非常高,因此可以初步判断x与y呈现线性关系。(2)用最小二乘法估计模型回归系数,并写出模型结果;记模型为:,将以上结果代入最小二乘法的计算公式,得到0.92484,151.1852。因此,产品销售数量为y对广告费投入为x的模型为(3)说明所计算的回归系数的经济意义;0
39、.92484表示当广告费投入每增加1个单位,产品销售数量会增加0.92484个单位。(4)计算模型可决系数,并用其说明模型的拟合效果。由于模型为一元线性回归模型,根据一元线性回归模型中可决系数为模型因变量和自变量简单线性相关系数的平方的关系,可得模型的可决系数r2=(r)2=(0.996268)2=0.99255。可决系数接近1,说明模型拟合的非常好。【8.3】人们的收入期望往往受其教育程度和工作经验的影响,随机抽取了50名25-40岁之间的社会工作人员,收集了他们的月工资(单位:元)、受教育年限(单位:年,从小学开始计算,到最高学历为止,并扣除中间间断的时间)和工作年限(单位:年,按照毕业之
40、后,开始工作时计算起)的数据,进行计算得到方差分析表和参数估计的结果如下所示。方差分析表误差来源dfssmsfsignificance f回归分析6703残差总计6745参数估计表变量系数标准误差t统计量prob.受教育年限339.57 22.20 15.29 0.0000工作年限127.29 9.23 13.79 0.0000常数项1278.78 23.03 55.52 0.0000要求:(1)根据参数估计表,说明收入期望与受教育程度和工作经验的关系;(2)根据参数估计表,说明受教育程度和工作经验对收入期望是否有显著影响;(2)完成以上方差分析表,对模型进行f检验;(3)计算模型的多重可决系
41、数,并进行修正,说明模型的拟合效果。【解】最小二乘法的计算(多元)(1)根据参数估计表,说明收入期望与受教育程度和工作经验的关系;从参数估计表可以看出,收入期望(y)与受教育程度(x1)和工作经验(x2)模型为:该模型表示在受教育程度不变时,工作经验每增加1个单位,收入的期望会增加339.57个单位;在工作经验不变时,受教育程度每增加1个单位,收入的期望会增加127.29个单位。(2)根据参数估计表,说明受教育程度和工作经验对收入期望是否有显著影响;从参数估计表可以看出,受教育程度和工作经验的t统计量都大于2,说明受教育程度和工作经验对收入期望都是显著的。(2)完成以上方差分析表,对模型进行f
42、检验;误差来源dfssmsfsignificance f回归分析267033351.53750.488残差47420.8936总计496745给定显著性水平查f统计量的表,3.195056,从方差分析表可以看出,f为3750.488,远远大于临界值,说明模型通过检验,认为模型整体是显著的,受教育程度和工作经验对收入期望有显著影响。(3)计算模型的多重可决系数,并进行修正,说明模型的拟合效果。从方差分析表中看出,模型解释的变差ssr=6703,模型的总变差sst=6745,所以模型的多重可决系数=0.993773。根据修正的多重可决系数=0.993508。模型多重可决系数和修正的多重可决系数均接
43、近于1,说明模型拟合效果非常好。【8.4】国家财政收入来源于国民总收入。分析财政收入如何受国民总收入变化的影响,可以预测国家财政收入的规模,为国家的经济发展作规划。收集我国1990年到2010年的财政收入和国民总收入数据,如下表所示。 我国1990年到2010年的财政收入和国民总收入数据表 单位:亿元年份国民总收入x财政收入y年份国民总收入x财政收入y199018718.32 2937.10 2001108068.22 16386.04 199121826.20 3149.48 2002119095.69 18903.64 199226937.28 3483.37 2003135173.98
44、21715.25 199335260.02 4348.95 2004159586.77 26396.47 199448108.46 5218.10 2005183618.51 31649.29 199559810.53 6242.20 2006215883.95 38760.20 199670142.49 7407.99 2007266411.02 51321.78 199778060.85 8651.14 2008315274.71 61330.35 199883024.28 9875.95 2009341401.48 68518.30 199988479.15 11444.08 20104
45、03259.96 83101.51 200098000.45 13395.23 资料来源:中国统计年鉴2011试通过建立财政收入对国民总收入的一元线性回归模型来分析财政收入和国民总收入之间的关系。【解】一元线性回归模型(1)设定模型:记财政收入为y,国民总收入为x,设定财政收入对国民总收入的一元线性回归模型为。(2)使用excel,根据最小二乘法得到以下估计的结果。根据以上结果,得到财政收入对国民总收入的一元线性回归模型为(3)模型检验根据excel输出的结果,可以看到模型可决系数为0.991116098,非常接近于1,说明模型拟合很好。回归系数的t值分别为-6.821029和46.04019
46、9,绝对值都超过临界值,说明t检验通过,认为模型自变量对因变量的影响是显著的。模型的f值为211.6999,对应的p值为5.89*10-21,小于0.05,说明f检验通过,认为模型整体是显著的。(4)模型应用国民总收入x的回归系数为0.211980373,说明当国民总收入每增加1个单位,财政收入会增加0.211980373个单位。【8.5】消费问题是一个与我们的日常生活密切相关、大众普遍关注的问题。影响消费的因素有很多,主要的有收入和价格两大因素,分析消费受收入和价格影响的关系,是研究消费问题的基础。现研究某城镇居民耐用品的消费,收集其人均全年耐用消费品支出、人均年可支配收入和耐用消费品价格指数的统计资料如下表所示。年份人均耐用消费品支出y(元)人均年可支配收入x1(元)耐用消费品价格指数x2(2000年=100)2000137.161181.4115.962001124.561375.7133.352002107.911501.2128.212003102.961700.6124.85
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 天津滨海职业学院《生物育种综合实验技术》2023-2024学年第一学期期末试卷
- ktv维护费合同范例
- 天津滨海汽车工程职业学院《社会调查理论与方法》2023-2024学年第一学期期末试卷
- 天津滨海汽车工程职业学院《弧焊电源》2023-2024学年第一学期期末试卷
- 天府新区信息职业学院《人物画写生》2023-2024学年第一学期期末试卷
- 公路总价合同范例
- 延续工程合同范例
- 服装样式定制合同范例
- 土地棚架转让合同范例
- 加工安装制作合同范例
- 方案的构思过程 课件-2023-2024学年高中通用技术苏教版(2019)技术与设计1
- Mysql 8.0 OCP 1Z0-908 CN-total认证备考题库(含答案)
- 手拉葫芦安全使用培训课件
- 广东省春季高考语文必背古诗文19篇
- 苏教六年级数学上册百分数整理与复习课件
- 2023年南京银行招聘人员笔试历年难、易错考点试题含答案附详解
- 化学中考模拟试题双向细目表
- 乔木、灌木种植专项施工方案
- 认识智能手机(老年人智能手机培训)
- 八年级英语上册动词形专练
- 宜昌市建设工程文件归档内容及排列顺序
评论
0/150
提交评论