上海工程技术大学统计学实验报告回归分析_第1页
上海工程技术大学统计学实验报告回归分析_第2页
上海工程技术大学统计学实验报告回归分析_第3页
上海工程技术大学统计学实验报告回归分析_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、相关与回归分析实验报告 学号: 0131212* 姓名:邹 * 白玉新 一、实验目的: 利用 Excel 对数据资料进行描述性统计分析;利用 Excel 进行相关分析和单变 量、多变量回归分析。掌握利用软件对原始数据进行相关分析和回归分析的方 法,重点掌握 Excel 的使用。本实验处理的数据集的特征及数据来源;描述性 统计分析采用的方法;要求输出对原始数据进行描述性统计分析的结果; 应 说明本实验处理的数据集的特征及数据来源;对数据进行相关分析的作用及实 现方法;对数据进行单变量回归分析的作用及实现方法;要求输出对所处理数 据集进行分析后的结果。 二、实验环境 ( 1)地点:实训楼 1551

2、 (2)时间: 2014年 12月 1日 ( 3)软件: Excel 2007 三、实验内容 1、为研究某内陆湖的湖水的含盐量,随机地从该湖的32 个取样点采了 32 个湖水样本, 测得它们的含钠量 (单位: ppm) 分别为: 13.0 18.5 16.4 14.8 19.4 17.3 23.2 24.9 20.8 19.3 18.8 23.1 15.2 19.9 19.1 18.1 25.1 16.8 20.4 17.4 25.2 23.1 15.3 19.4 16.0 21.7 15.2 21.3 21.5 16.8 15.6 17.6 将数据输入工作表中; 选择菜单 工具”一数据分析”

3、,打开 数据分析”对话框 选择其中的 描述统计”,打开对话框 正确填写相关信息后,点 确定”,结果在C1 到D16这个区域内显示; 在F12中输入=TINV(0.05,31)*D7/SQRT(D15)按ENTER键即 可计算得tf_i)i的值; .qn 在 F10 中输入=D3-TINV(0.05,32-1)*D7/SQRT(D15)按 ENTER 键即可计算得 又t-(n-1) I 的值; 在 G10 中输入=D3+TINV(0.05,32-1)*D7/SQRT(D15)按 ENTER 键即可计算得 X 以n -1) 的值 数据分析对话框 描述统计对话框 区间估计结果 2、某公司想知道产品销

4、售量与销售方式及销售地点是否有关,随机抽样得以下,以 0.05的显着性水平进行检验。 某公司产品销售方式及销售地点所对应的销售量 地点一 地点二 地点三 地点四 地点五 方式一 77 86 81 88 83 方式二 95 92 78 96 89 方式三 71 76 68 81 74 方式四 80 84 79 70 82 我们利用Excel的分析工具。 将数据输入工作表中 选择菜单 工具”一数据分析”,打开 数据分析”对话框。 选择其中的 方差分析:无重复双因素方差分析”,打开对话框 正确填写相关信息后,点 确定”,结果在I1到022这个区域内显示 “方差分析:无重复双因素方差分析”分析工具对话

5、框 “方差分析:无重复双因素方差分析”结果图 结论:VFa .,拒绝原假设H1,即销售方式对销售量有影响; Fb F,.不能拒绝原假设H2,即销售地点对销售量的影响不显着。 3、在研究我国人均消费水平的问题时,把全国人均消费记为y,把人均国内生产总 值(人均GDP记为X。根据数据集01摘录样本数据(Xi, yi), i =1,2,;如表9.1所示, 问两者之间存在什么样的相关关系。 表9.1我国人均国内生产总值与人均消费金额数据单位:元 年份 人均国内生产总值 人均消费金额 1995 4854 2236 1996 5576 2641 1997 6054 2834 1998 6308 2972

6、1999 6551 3138 2000 7086 3397 2001 7651 3609 2002 8214 3818 2003 9101 4089 计算可决系数、估计标准误差,并对回归方程进行检验。 将数据输入工作表中选择菜单“工具” 一“数据分析”,打开“数据分析” 对话框。 选择其中的“回归”,打开对话框 正确填写相关信息后,点“确定”, 结果在H1到N18这个区域内显示。 “回归”分析工具对话框 “回归”分析结果图 四、分析 第一个试验中,置信区间越小,说明估计的精度越高,即我们对未知参数的了解越多、 越具体;置信水平越大,估计可靠性就越大。一般说来,在样本容量一定的前提下,精度 与置

7、信度往往是相互矛盾的;若置信水平增加,则置信区间必然增大,降低了精度;若精 度提高,则区间缩小,置信水平必然减小。要同时提高估计的置信水平和精度,就要增加 样本容量。 置信区间的构造或区间估计和第六章的假设检验关系密切,两者有着对偶的关系,只 要有一种假设检验就可以根据该假设检验构造相应的置信区间,反之亦然;另外置信区间 的构建往往要借助于未知参数点估计或其函数的抽样分布来进行。 第二个试验中,一是推销方式的影响,不同的方式会使人们产生不同消费冲动和购买 欲望,从而产生不同的购买行动;这种由不同水平造成的差异,我们称为系统性差异;另 一是随机因素的影响,同一种推销方式在不同的工作日销量也会不同

8、,因为来商店的人群 数量不一,经济收入不一,当班服务员态度不一,这种由随机因素造成的差异,我们称为 随机性差异。两个方面产生的差异用两个方差来计量:一是、2、丿3、丿4之间的总体 差异,即水平之间的方差,一是水平内部的方差。前者既包括系统性差异,也包括随机性 差异;后者仅包括随机性差异。如果不同的水平对结果没有影响,如推销方式对销售量不 产生影响,那么在水平之间的方差中,也就仅仅有随机性差异,而没有系统性差异,它与 水平内部方差就应该接近,两个方差的比值就会接近于1;反之,如果不同的水平对结果 产生影响,在水平之间的方差中就不仅包括了随机性差异,也包括了系统性差异。这时, 该方差就会大于水平内方差,两个方差的比值就会比 1大,当这个比值大到某个程度时, 即达到某临界点,我们就作出判断,不同的水平之间存在着显着性差异。因此,方差分析 就是通过对水平之间的方差和水平内部的方差的比较,做出拒绝还是不能拒绝原假设的判 断。 第三个试验中,对线性回归模型的显着性检验包括两个方面的内容:一是对整个回归 方程的显着性检验(F检验),另一个是对各回归系数的显着性检验(t检验)。就一元线 性回归模型而言,上述两个检验是等价的 五、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论