中央财经大学统计学作业2_第1页
中央财经大学统计学作业2_第2页
中央财经大学统计学作业2_第3页
中央财经大学统计学作业2_第4页
中央财经大学统计学作业2_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、中央财经大学实 验 报 告实验项目名称 方差分析、回归分析、时间序列分析所属课程名称 统计学 实 验 类 型 设计型、综合型实验 实 验 日 期 2011年5月 班 级 任课教师 王会娟 学 号 姓 名 学 号 姓 名 学 号 姓 名 成 绩 实 验 报 告1、方差分析。(1)使用单因素方差分析的方法检验:能否认为不同学科的上月平均工资相等。如果不能认为全相等,请做多重比较。不同学科上月工资的描述统计上月工资N均值标准差标准误均值的 95% 置信区间极小值极大值下限上限1462326.09511.83175.4652174.092478.08130035002422304.76514.6407

2、9.4112144.392465.14110033003552274.55476.18064.2082145.822403.2714003400总数1432300.00496.18341.4932217.982382.0211003500表1-1 不同学科上月工资的描述统计学科与工资研究的方差分析表 上月工资平方和df均方F显著性组间67893.092233946.546.136.873组内34892106.908140249229.335总数34960000.000142表1-2 学科与工资研究的方差分析表方差齐性检验上月工资Levene 统计量df1df2显著性.0972140.908表1

3、-3 学科与工资研究的方差齐性检验图1-1 学科与工资研究方差分析基本假设的检验1、关于正态性的分析。使用spss软件得出的分组直方图如图1-1所示,该图表明,在各个水平下上月工资都呈对称分布,没有极端值出现,因此可以认为不违背正态性假设。根据表1-3的Levene检验的结果,由于表中的p值等于0.908,是个非常大的值,因此也不能拒绝等方差的原假设。2、方差齐性检验。表1-1表明,各组标准差差异不大,最大值与最小值之比等于1.081,明显小于2,因此可以认为是等方差的。3、方差分析的结果分析。检验中零假设和备择假设为:H0:1=2=3H1:1、2、3不全相等表1-2中给出的p值等于0.873

4、,大于我们通常要求的=0.05,因此我们不能拒绝原假设,不能得出学科对上月工资有显著影响的结论,也就是说我们可能认为三个学科的上月工资相等。(2)在方差分析中同时考虑学科和性别因素,用双因素方差分析模型分析学科和性别对上月平均工资的影响。图1-2 学科和性别与工资研究方差分析基本假设的检验学科、性别与工资的无交互作用的双因素方差分析表因变量:上月工资源III 型平方和df均方FSig.校正模型6540680.489a32180226.83010.664.000截距7.434E817.434E83635.933.000性别6472787.39616472787.39631.659.000学科24

5、4202.9942122101.497.597.552误差28419319.511139204455.536总计7.914E8143校正的总计34960000.000142a. R 方 = .187(调整 R 方 = .170)表1-4 学科、性别与工资的无交互作用的双因素方差分析表学科、性别与工资的有交互作用的双因素方差分析表因变量:上月工资源III 型平方和df均方FSig.校正模型6775774.725a51355154.9456.587.000截距7.277E817.277E83537.387.000性别6185326.72316185326.72330.066.000学科228658

6、.8652114329.433.556.575性别 * 学科235094.2372117547.118.571.566误差28184225.275137205724.272总计7.914E8143校正的总计34960000.000142a. R 方 = .194(调整 R 方 = .164)表1-5 学科、性别与工资的有交互作用的双因素方差分析表1、关于正态性的分析。使用spss软件得出的分组直方图如图1-2所示,该图表明,在各个水平各个性别下上月工资都呈对称分布,没有极端值出现,因此可以认为不违背正态性假设。2、方差分析的结果分析检验中零假设和备择假设为:H0:1=2=3=0(学科)H0:1

7、=2=0H1:1、2、3不全为零H1:1、2不全为零由表1-4学科一栏的p值等于0.552,说明在考虑了性别因素后,我们仍然不能拒绝原假设、认为不同学科之间的工资差异是显著的。从性别对上月工资的影响来看,该变量对应的p值等于0.000,小于通常使用的值,说明性别对于月工资的影响是显著的。又由表1-5,我们发现其交互作用的p值等于0.566,大于通常的,因此我们认为其交互作用对于工资的影响是显著的。2、非参数检验。(1)用非参数检验方法检验能否认为男生和女生上月工资的中位数相等。Wilcoxon秩和检验中秩和的计算结果性别N秩均值秩和上月工资07388.516461.0017054.793835

8、.00总数143表2-1 Wilcoxon秩和检验中秩和的计算结果Wilcoxon秩和检验的检验统计量和p值上月工资Mann-Whitney U1350.000Wilcoxon W3835.000Z-4.877渐近显著性(双侧).000精确显著性(双侧).000精确显著性(单侧).000点概率.000a. 分组变量: 性别表2-2 Wilcoxon秩和检验的检验统计量和p值1、我们用Wilcoxon秩和检验来比较中位数。检验的零假设和备择假设如下所示:零假设:女生上月工资和男生上月工资的中位数相等。备择假设:女生上月工资和男生上月工资的中位数不相等。2、两个独立样本秩和检验结果分析根据表2-1

9、,男生工资的平均秩为88.51,女生工资的平均秩为54.79,说明从样本看男生的收入中位数要高于女生的收入中位数。从表2-2看,Wilcoxon W统计量为3835,用正态分布近似计算时的Z值为-4.877。表中显示用正态分布计算时的p值(双侧检验)为0.000,与精确计算的p值0.000没有显著差异。我们应该拒绝原假设,结论为男生和女生的工资中位数并不相等。(2)用非参数检验方法检验学生上月工资和去年同月工资的中位数是否有显著变化。Wilcoxon符号秩检验的p值去年同月工资 - 上月工资Z-1.336a渐近显著性(双侧).181精确显著性(双侧).183精确显著性(单侧).092点概率.0

10、01a. 基于正秩。b. Wilcoxon 带符号秩检验表2-3 Wilcoxon符号秩检验的p值差值序列中的正数和负数的个数汇总表N去年同月工资 - 上月工资负差分a69正差分b54结c20总数143a. 去年同月工资 < 上月工资b. 去年同月工资 > 上月工资c. 去年同月工资 = 上月工资表2-4 差值序列中的正数和负数的个数汇总表匹配样本符号检验的检验结果去年同月工资 - 上月工资Z-1.262渐近显著性(双侧).207精确显著性(双侧).207精确显著性(单侧).103点概率.029a. 符号检验表2-5 匹配样本符号检验的检验结果1、根据题目,我们采取Wilcoxon

11、符号秩检验的方法进行分析,确定原假设和备择假设为:H0:差值总体的中位数=0H1:差值总体的中位数02、分析Wilcoxon符号秩检验的结果如下:由表2-3可知,精确检验的p值等于0.183,远大于我们通常采用的=0.05,故不能拒绝原假设,也就是说没有明显证据表明去年同月工资和今年工资有显著性的差异。表2-4和表2-5是符号检验的结果。表2-4表明差值序列中有69个负数,54个正数,表2-5表明采用精确检验(二项分布)计算的双侧检验值为0.207,也不能够拒绝原假设。(3)用非参数检验方法不同学科学生平均学分绩点的中位数是否相等。Kruskal-Wallis检验中计算的各组平均秩学科N秩均值

12、平均学分绩点14676.9624267.6035571.22总数143表2-6 Kruskal-Wallis检验中计算的各组平均秩Kruskal-Wallis检验的检验统计量和p值a,b,c平均学分绩点卡方1.153df2渐近显著性.562a. Kruskal Wallis 检验b. 分组变量: 学科c. 由于没有足够内存,无法计算某些或所有精确显著性。表2-7 Kruskal-Wallis检验的检验统计量和p值1、选择多个独立样本的Kruskal-Wallis检验进行分析。根据题目我们的原假设和备择假设为:H0:M1=M2=M3H1:M1、M2、M3不完全相等2、由表2-6,各组的平均秩处于

13、67.6-76.96之间。表2-7表明,Kruskal-Wallis检验中使用卡方分布进行近似计算时的卡方统计量为1.153,自由度为2,相应的p值为0.562。由于p值远大于,所以没有足够证据证明原假设不成立,因此我们可能认为几个学科的平均绩点的中位数是相等的。(4)检验学生的上月工资是否服从正态分布。单样本 Kolmogorov-Smirnov 检验上月工资N143正态参数a,b均值2300.00标准差496.183最极端差别绝对值.083正.083负-.045Kolmogorov-Smirnov Z.997渐近显著性(双侧).273精确显著性(双侧).259点概率.000a. 检验分布为

14、正态分布。b. 根据数据计算得到。表2-8 单样本K-S检验的计算结果和相应的p值1、我们采取单样本K-S检验进行分析,根据题目,我们的原假设和备择假设为:H0:学生的上月工资服从正态分布H1:学生的上月工资不服从正态分布2、由表2-8,计算出的Dmax统计量的值为0.997,相对应的p值为0.273,远大于我们通常选取的值,因此我们没有足够理由拒绝原假设,也就是说根据样本数据我们不能认为总体是非正态的。(5)检验学生对专业的满意程度是否为离散的均匀分布。对专业的满意度观察数期望数残差14101.2-97.2232101.2-69.23138101.236.84212101.2110.8512

15、0101.218.8总数506表2-9 各组的频数和期望频数检验统计量对专业的满意度卡方278.862adf4渐近显著性.000精确显著性.000点概率.000a. 0 个单元 (.0%) 具有小于 5 的期望频率。单元最小期望频率为 101.2。表2-10 统计量计算结果和相应的p值1、根据题意,我们采取卡方拟合优度检验进行分析;我们的原假设和备择假设是:H0:学生对专业的满意程度是离散的均匀分布H1:学生对专业的满意程度不是离散的均匀分布2、表2-9中是各组的频数和期望频数,表2-10是统计量的计算结果和相应的p值。根据表2-10,卡方等于278.962,自由度为4,对应的p值为0.000

16、,远小于我们通常采用的值,因此我们可以拒绝原假设,即认为学生对专业的满意程度不是离散的均匀分布。3、回归分析。(1)计算上月工资与平均学分绩点的相关系数并作假设检验。相关性上月工资平均学分绩点上月工资Pearson 相关性1.762*显著性(双侧).000N506506平均学分绩点Pearson 相关性.762*1显著性(双侧).000N506506 *. 在 .01 水平(双侧)上显著相关。表3-1 相关系数的输出结果如表3-1所示,上月工资和平均学分绩点的相关系数为0.762,与此同时,其p值为0.000,远小于我们通常选用的值,通过了显著性检验。(2)以上月工资为因变量,平均学分绩点为自

17、变量做回归分析,分析模型的拟合效果和假设检验的结果。系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-1034.007126.581-8.169.000平均学分绩点1075.26040.706.76226.415.000a. 因变量: 上月工资表3-2 输出的回归系数Anovab模型平方和df均方FSig.1回归78519984.584178519984.584697.759.000a残差56715924.507504112531.596总计1.352E8505a. 预测变量: (常量), 平均学分绩点。b. 因变量: 上月工资表3-3 方差分析表模型汇总模型RR 方调整

18、R 方标准 估计的误差1.762a.581.580335.457表3-4 输出的拟合优度原假设H0:两个变量之间的相关性并不显著备择假设H1:两个变量之间的相关性显著1、SPSS输出的回归系数及t统计量值,有表3-2中的数据可知一元线性回归方程:Yt=-1034.007+1075.26Xtt统计量为26.415,如果显著性水平为0.05,自由度为504,相应的t/2临界值在1.96-1.972之间。由于t的绝对值大于t/2,则能够拒绝原假设,表明自变量X对因变量Y的影响是显著的,二者之间存在显著的线性关系。sig.即为双侧检验的P值,其0.000的取值同样说明有相当大的把握拒绝原假设,表明自变

19、量对因变量的影响是显著的。2、F检验结果,如表3-3得到的F统计量为697.759,如果显著性水平=0.05,分子自由度为1,分母自由度为504时,F的临界值在3.84-3.92之间。由于F大于F,可以拒绝原假设F检验的边际概率为0.000,同样表明方程整体线性关系显著。3、拟合优度检验,由表3-4可知表中R为R的平方的正根,由于r的绝对值等于0.762,所以工资Y和绩点X的相关系数为0.762判定系数R的平方为0.581,其统计含义为:在工资的离差中,有58.1%可以由工资与绩点之间的线性关系解释。拟合程度一般。估计标准误等于335.475,其统计含义:根据绩点对工资进行估计时,平均的估计误

20、差为335.475元。(3)以上月工资为因变量,平均学分绩点和性别为自变量做回归分析,分析模型的拟合效果和假设检验的结果。系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-977.68681.945-11.931.000平均学分绩点1138.77326.452.80743.050.000性别-513.00919.384-.496-26.465.000a. 因变量: 上月工资表3-5 回归系数及t统计量Anovab模型平方和df均方FSig.1回归1.115E8255764862.6331183.224.000a残差23706183.82550347129.590总计1.35

21、2E8505a. 预测变量: (常量), 性别, 平均学分绩点。b. 因变量: 上月工资表3-6 方差分析表拟合优度数据模型RR 方调整 R 方标准 估计的误差1.908a.825.824217.094表3-7 输出的拟合优度原假设H0:学分绩点与工资之间的相关性并不显著备择假设H1:学分绩点与工资之间的相关性显著原假设H0:性别与工资之间的相关性并不显著备择假设H1:性别与工资之间的相关性显著1、SPSS输出的回归系数及t统计量值,有表3-5中的数据可知二元线性回归方程:Yt=-977.686+1138.773X-513.009S变量X的回归系数为1138.773,其统计含义为在性别一致的情

22、况下,绩点每高1,月均工资升高1138.773:变量S的回归系数为513.009,其统计含义为在绩点一致的情况下,女生工资会比男生低513.009变量X的t统计量为43.050,必然大于相应的t临界值,可拒绝原假设,认为自变量X与因变量Y显著相关。变量S的t统计量的绝对值为26.465,必然大于相应的t临界值,可拒绝原假设,认为自变量S与因变量Y显著相关。2、F检验结果,如表3-3得到的F统计量为1183.224,如果显著性水平=0.05,分子自由度为2,分母自由度为503时,F的临界值在3.84-3.92之间。由于F大于F,可以拒绝原假设F检验的边际概率为0.000,同样表明方程整体线性关系

23、显著。3、拟合优度检验,由表3-4可知表中R为R的平方的正根,由于r的绝对值等于0.908,所以工资Y和绩点X以及性别S有着很强的相关性。判定系数R的平方为0.825,其统计含义为:在工资的离差中,有82.5%可以由绩点和性别的二元线性回归方程所解释。拟合程度较好。估计标准误等于217.094,其统计含义:根据绩点和性别对工资进行估计时,平均的估计误差为217.094元。(4)、(2)和(3)中的模型你会选择哪一个模型用于预测?为什么?假设一名男生的平均学分绩点为3.5,试预测他的上月工资的点估计值和区间估计。【*区间估计为选做】答:我会选择3的模型进行预测,因为3的拟合程度要好于2。点估计:

24、Y=3008.0195区间估计:取置信度为95%,样本容量为143,区间估计结果为(2972.4395,3043.5995)4、时间序列分析。使用1998年-2007年我国的月度社会商品零售额(sale.xls)。要求使用前9年的数据建立模型预测2007年的月度数值,并根据2007年的实际值和预测值分析预测效果。要求:5、时间序列分析(1)该时间序列的季节指数表5-1期间季节性因素 (%)1108.82101.0394.9492.3594.5694.4792.3892.4999.510104.311105.212120.5(2)使用时间序列的分解模型进行预测在SPSS中,对季节性分解后得到的STC项的数据对t建立合适的趋势模型。表5-2方程模型汇总R 方Fdf1df2Sig.线性.9141125.27

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论