




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章 数据的图表展示1、为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A好;B较好;C一般;D较差;E.差。调查结果3.1。要求:(1)指出上面的数据属于什么类型? 答:顺序数据(2)用EXCEL或SPSS制作一张频数分布表?(3)绘制一张条形图,反映评价等级的分布?(4)绘制评价等级的帕累托图?2、为了确定灯泡的使用寿命,在一批灯泡中随机抽取100个进行观测,所得结果如下3.5,要求:(1)利用计算机对上面的数据进行排序?(2)以组距为10进行等距分组,整理成频数分布表?(3)根据分组数据绘制直方图,说明数据分布特点?呈正态分布。(4)制作
2、茎叶图,并与直方图进行对比。茎叶图与直方图十分相似。3、2005年4月北京亚运村汽车交易市场的汽车销售数据如下3.13,要求:(1)画出国产汽车和进口汽车销售量的对比条形图;(2)画出国产汽车和进口汽车销售量的环形图。4、已知1995-2004年我国国内生产总值指标数据如下3.14,要求:(1)用EXCEL绘制国内生产总值的线图?(2)绘制第一、第二、第三产业国内生产总值线图?(3)根据2004年的国内生产总值及其构成数据,绘制饼图。第四章 数据的概括性度量1、随机抽取25个网络用户,得到他们的年龄数据如4.2。要求:(1)计算众数、中位数;(2)计算四分位数、平均数和标准差;(3)计算偏态系
3、数和峰态系数;(4)对网民年龄的分布特征进行综合分析;答:从众数、中位数和平均数来看,网民年龄在2324岁的人占大多数。由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。由于偏态系数为正值,所以为尖峰分布。2、一种产品需要人工组装,现有三种可供选择的组装方法。为检验那种方法更好,随机抽取15个工人,让他们分别用三种方法组装,下面是15个工人分别用三种方法在相同的时间内组装的产品数量,如4.12.要求(1)你准备采用什么样的方法来评价组装方法的优劣?答:应该分别从平均值和标准差两个方面进行评价。在对各种方法的离散程度进行比较时,则
4、应采用离散系数。(2)如果让你选择一种方法,你会作出怎样的选择并说明理由?答: 从三种方法的集中趋势来看,方法A的平均产量最高,中位数和众数也都高于其他两种方法。从离散程度来看,三种方法的离散程度分别为:vA=2.1314165.6=0.01287,vB=1.7512128.73=0.01360,vC=2.7740125.53=0.02210。方法A的离散程度最小,因此,应选择方法A。第五章 方差分析1、从3个总体中各抽取容量不同的样本数据,结果如10.1。检验3个总体的均值是否有显著差异(a=0.01)。答:单因素方差分析,如下图:检验:假设:H0:u1=u2=u3 总体均值之间没有显著影响
5、 H1:u1,u2,u3不全相等,总体均值之间有显著影响检验结果由图表可知:因为F=4.6574<F=8.021517,不拒绝原假设,所以总体的均值之间没有显著影响。2、一家超市连锁店进行一项研究,确定超市所在的位置和竞争者的数量对销售额是否有显著影响。获得的月销售额数据如10.11.取显著性水平a=0.01,检验:(1)竞争者的数量对销售额是否有显著影响?(2)操守的位置对销售额的影响是否显著?(3)竞争者的数量和超市位置对销售额是否有交互影响?解:计算统计量方差分析表如下:得出结论:(1)F1=11.07113>F1=8.28542,即竞争者的数量对销售额有显著影响。(2)F2
6、=5.221757<F2=6.012905,即超市的位置对销售量没有显著影响,(3)F3=0.476987<F3=6.012905,即竞争者数量和超市位置对销售额没有交互影响。第六章 一元线性回归1、从物流机械行业中随机抽取12家企业,所得产量与生产费用的数据如表11.1.要求:(1)绘制产量与生产费用的散点图,判断而这之间的关系形态。产量与生产费用之间为正的线性相关关系。(2)计算产量与生产费用之间的线性相关系数;对产量和生产费用进行回归分析,如下表:由上表可知,相关系数r=0.9202(3)对相关系数的显著性进行检验(a=0.05),并说明二者之间的关系强度。答:检验统计量t=
7、23.8200,P=2.2220E-05<=0.05,所以产量和生产费用之间有显著的正线性关系。2、11.6是7个地区的人均国民生产总值GDP和人均消费水平的统计数据,要求:(1)用人均GDP作为自变量,人均消费水平为因变量,绘制散点图,说明关系态势。两者之间为高度的正线性相关关系。(2)计算该2个变量之间的线性相关系数,并说明变量之间的关系强度;由上表可知,r=0.9981,二者之间为高度的正线性相关关系。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义;回归方程为:y=734.6928+0.3087x。回归系数1=0.3087表示人均GDP每变动1元,人均消费水平平均
8、变动0.3087元。(4)计算判定系数,并解释其意义。判定系数R2=99.63%。表明在人均消费水平的变差中,有99.63%是由人均GDP与消费水平之间的关系决定的,估计标准误差se=247.3035,表示人均GDP预测人均消费水平的平均误差为247.3035元。(5)检验回归方程线性关系的显著性(a=0.05)检验统计量F=133.692,P=2.91E-07<=0.05,拒绝原假设,线性关系显著。(6)若某地区人均GDP为5000元,预测相应的人均消费水平。以及95%的置信区间和预测区间。y5000=734.6928+0.3087×5000=2278.1078元。置信区间:
9、公式:y0±t2(n-2)se1n+(x0-x)2i=1n(xi-x)2 区间: 1990.749 , 2565.464;预测区间:公式:y0±t2(n-2)se1+1n+(x0-x)2i=1n(xi-x)2区间1580.463 , 2975.750 。第七章 多元线性回归1、根据12.1数据,用EXCEL进行回归,并对回归结果进行讨论,计算X1=200,X2=7的预测值。答:b1=-0.04971表示,在X2不变的条件下,每变化一个单位,y平均下降0.04971个单位;b2=1.928169表示,在不变的条件下,每变化一个单位,y平均增加1.928169个单位。判定系数r
10、2=21.0896%,表示在因变量y的变差中能够被y与和之间的线性关系所解释的比例为21.0896%。由于这一比例很低,表明回归方程的拟合程度很差。估计标准误差s=13.34122,预测误差也较大。方差分析表显示,Significance F=0.436485>a=0.05,表明y与和之间的线性关系不显著。用于回归系数检验的P均大于a=0.05,两个回归系数均不显著。y=25.0287-0.04971x1+1.928169x2当x1=200,x2=7时,y= 28.583022、根据12.9数据,其为随机抽取的15家大型商场销售的同类产品的有关数据,要求:(1)计算Y与X1,Y与X2,之
11、间的相关系数,是否有证据表明销售价格与购进价格、销售价格与销售费用之间存在线性相关?销售价格与购进价格:销售价格与销售费用:y与x1的相关系数为0.308952,与x2的相关系数为0.001214,所以相关系数的p值都较小,总体上线性关系不显著。(2)根据数据结果,你认为用购进价格和销售费用来预测销售价格是否有用?无用。(3)用EXCEL进行回归,并检验模型的线性关系是否显著(a=0.05)。答:因为F=0.073722>0.05,,所以,线性关系不显著(4)解释判定系数R2,所得结论与第二问是否一致?调整后的R为0.244537073,说明自变量对因变量无影响,所得的结论与(2)一致。
12、(5)计算X1 与X2之间的相关系数,所得结果意味着什么?X2的P值为-0.85286,Sig为0,方程不显著,但回归系数显著,因此意味着负的多重线性。(6)模型中是否存在多重共线性,对模型改进有何建议?存在多重线性。第八章 时间序列预测1、依据13.3表格,其为某物流公司18个月的营业额数据。要求:(1)绘制时间序列描述其形态;从时间序列图可知,该物流公司18个月的营业额大体上呈指数上升趋势。(2)用3期移动平均法预测第19个月营业额由上表可知,第19个月的营业额为630.33万元。(3)采用指数平滑法,分别用平滑系数0.3、0.4、0.5预测各月的营业额,分析预测误差,说明用哪一个平滑系数
13、更合适。比较误差方差可知:a=0.5更适合。(4)建立一个趋势方程预测各个月的营业额,计算出估计标准误差。估计标准误差为:31.6628。2、对13.6数据,分别拟合一阶曲线、二阶曲线和三阶曲线方程,并对结果进行比较分析。曲线拟合附注创建的输出26-十月-2014 21时42分03秒注释输入活动的数据集数据集0过滤器<none>权重<none>拆分文件<none>工作数据文件中的 N 行35缺失值处理对缺失的定义用户自定义缺失值被视为已缺失。使用的案例分析中不使用在任何变量中带有缺失值的个案。语法CURVEFIT /VARIABLES=VAR00002 /C
14、ONSTANT /MODEL=LINEAR /PLOT FIT.资源处理器时间0:00:01.295已用时间0:00:01.578使用从第一个观测值至最后一个观测值预测从第一个观测值在使用周期之后至最后一个观测值时间序列设置 (TSET)输出量PRINT = DEFAULT 保存新变量NEWVAR = NONE 自相关和偏自相关图中的最大滞后数MXAUTO = 16每个互相关图中的最大滞后数MXCROSS = 7每个过程生成的最大新变量数MXNEWVAR = 60每个过程的最大新个案数MXPREDICT = 1000用户自定义缺失值的处理MISSING = EXCLUDE 置信区间百分比值CI
15、N = 95用于在回归方程中输入变量的容差TOLER = .0001最大迭代参数更改CNVERGE = .001计算 自相关标准误的方法ACFSE = IND 季节性周期的长度未指定其值在图中标记为观测值的变量未指定方程包含CONSTANT模型描述模型名称MOD_1因变量1VAR00002方程1线性自变量个案顺序常数包含其值在图中标记为观测值的变量未指定个案处理摘要N个案总数35已排除的个案a0已预测的个案0新创建的个案0a. 从分析中排除任何变量中带有缺失值的个案。变量处理摘要变量因变量VAR00002正值数35零的个数0负值数0缺失值数用户自定义缺失0系统缺失0模型汇总和参数估计值因变量:
16、VAR00002方程模型汇总参数估计值R 方Fdf1df2Sig.常数b1线性.61151.908133.000374.161-.614一阶曲线:模型描述模型名称MOD_2因变量1VAR00002方程1二次自变量个案顺序常数包含其值在图中标记为观测值的变量未指定用于在方程中输入项的容差.0001个案处理摘要N个案总数35已排除的个案a0已预测的个案0新创建的个案0a. 从分析中排除任何变量中带有缺失值的个案。变量处理摘要变量因变量VAR00002正值数35零的个数0负值数0缺失值数用户自定义缺失0系统缺失0模型汇总和参数估计值因变量:VAR00002方程模型汇总参数估计值R 方Fdf1df2S
17、ig.常数b1b2二次.76151.070232.000381.644-1.827.034二阶曲线:附注创建的输出26-十月-2014 21时42分46秒注释输入活动的数据集数据集0过滤器<none>权重<none>拆分文件<none>工作数据文件中的 N 行35缺失值处理对缺失的定义用户自定义缺失值被视为已缺失。使用的案例分析中不使用在任何变量中带有缺失值的个案。语法CURVEFIT /VARIABLES=VAR00002 /CONSTANT /MODEL=CUBIC /PLOT FIT.资源处理器时间0:00:00.327已用时间0:00:00.370使
18、用从第一个观测值至最后一个观测值预测从第一个观测值在使用周期之后至最后一个观测值时间序列设置 (TSET)输出量PRINT = DEFAULT 保存新变量NEWVAR = NONE 自相关和偏自相关图中的最大滞后数MXAUTO = 16每个互相关图中的最大滞后数MXCROSS = 7每个过程生成的最大新变量数MXNEWVAR = 60每个过程的最大新个案数MXPREDICT = 1000用户自定义缺失值的处理MISSING = EXCLUDE 置信区间百分比值CIN = 95用于在回归方程中输入变量的容差TOLER = .0001最大迭代参数更改CNVERGE = .001计算 自相关标准误的
19、方法ACFSE = IND 季节性周期的长度未指定其值在图中标记为观测值的变量未指定方程包含CONSTANT数据集0 模型描述模型名称MOD_3因变量1VAR00002方程1三次自变量个案顺序常数包含其值在图中标记为观测值的变量未指定用于在方程中输入项的容差.0001个案处理摘要N个案总数35已排除的个案a0已预测的个案0新创建的个案0a. 从分析中排除任何变量中带有缺失值的个案。变量处理摘要变量因变量VAR00002正值数35零的个数0负值数0缺失值数用户自定义缺失0系统缺失0模型汇总和参数估计值因变量:VAR00002方程模型汇总R 方Fdf1df2Sig.三次.89487.574331.
20、000模型汇总和参数估计值因变量:VAR00002方程参数估计值常数b1b2b3三次372.5621.003-.160.004三阶曲线:由以上三个图可以看出,三阶曲线的拟合更符合所给的数据,所以三阶曲线更适合。3、表13.11为某第三方物流公司近年来业绩,对这一时间序列的构成要素进行分解,并计算季节指数,剔除季节变动后,计算剔除季节变动后的趋势方程。第九章 聚类分析1、根据提供数据14.1,利用层次聚类分析法,采用SPSS,对各个省市的高校科研情况进行层次聚类分析。(1)依据聚类状态表,利用碎石图对聚类类似进行研究;聚类表阶群集组合系数首次出现阶群集下一阶群集 1群集 2群集 1群集 214223240.000008221309785.0000053141616925.0000074203120889.0000085212921470.50020146101526486.00000247121435225.500032084
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论