统计学课程实验报告-2013._第1页
统计学课程实验报告-2013._第2页
统计学课程实验报告-2013._第3页
统计学课程实验报告-2013._第4页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、课程实验报告题目:社会经济统计学课程实验学生姓名:学号:专业:会计学年级:2011 级学院:管理学院指导教师:杜德权教务处制实验一: EXCEL 的数据整理与显示一、实验目的及要求:(一)目的1了解 EXCEL 的基本命令与操作、熟悉EXCEL 数据输入、输出与编辑方法;2熟悉 EXCEL 用于预处理的基本菜单操作及命令;3熟悉 EXCEL 用于整理与显示的基本菜单操作及命令。( 二 ) 内容及要求1根据下面的数据。1.1 用 Excel 制作一张组距式次数分布表,并绘制一张条形图( 或柱状图 ) ,反映工人加工零件的人数分布情况。从某企业中按随即抽样的原则抽出50 名工人,以了解该企业工人生

2、产状况(日加工零件数):1171081101121371221311181341141241251231271201291171261231281391221331191241071331341131151171261271201391301221231231281221181181271241251081121355091.2 整理成频数分布表,并绘制直方图。1.3假设日加工零件数大于等于130 为优秀。二、仪器用具硬件:计算机(安装Windows2003 、 Windows2007 或 Windows XP 或以上)软件: EXCEL三、实验原理统计中数据整理与显示的相关理论。四、实验方法

3、与步骤1点击“数据”“透视图”,选定区域为日加工零件数一列,输出区域为空白地方,完成,修改一下形成。2点击“图表向导”“条形图” ,数据区域为复制的数据,再修改系列、名称、X 轴、 Y轴,完成,再修改一下图表。3分组后,点击“工具”“数据分析”“直方图” ,输入区域为体育一列,接受区域为分好的组,标志打钩,输出区域为空白地方,累计百分比和图表输出打钩,完成,在对表和图进行一系列的修改,形成所需要的表和图。五、实验结果与数据处1.150 名工人加工零件的人数分布表按零件数分组(个) 工人数(人) 工人数比重(%)100-11036110-1201326120-1302346130-1401020

4、140 及以上12合计5010050名工人加工零件的人数柱状图504030201000000上100-11110-12120-13130-14以0及14工人数(人)工人数比重( %)1.250 名工人加工零件的人数频数分布表组别频数(人)频率( %)10-11036110-1201326120-1302346130-1401020140 及以上12合计50100工人加工零件分布情况直方图601205010040803060频数(人)频率( %)204010200010-110110-120120-130130-140140及以上合计1.3零件数(个)人数(人)1301113039优秀率 =11

5、50100%=22%六、讨论与结论该实验主要是通过EXCEL 软件的相关运用来对50 名工人的日零件加工数进行分析,首先是制作组距式分布表并绘制柱状图。相对而言,这部分的操作难度不是很大,通过对这50 个数据的观察, 除了一个极端值外其余数据的分布都比较集中,最小值为107,最小值为139。我假设的组距为 10,则组数 =全距组距 =32 10=3.2 组,化整可取为4组,另外将极端值 509 单独归入开口组。 然后通过统计数据便可的到每组的工人人数及其比重。在制作好的组距式分布表的基础上便可很容易的绘制出柱状图。把分布表与柱状图结合起来,我们可以对工人的日零件加工数的分布情况有一个大致的了解

6、。其主要表现为集中分布在120-130 之间, 110-120 和 130-140 之间的分布大致持平,而两端的数据都比较少。接下来是制作频数分布表和绘制直方图,这部分和上面的操作有很大类似的地方,并且通过这部分的操作我们可以更直观的看出工人日加工零件数的分布情况。如果日加工零件数大于等于130 为优秀,那么这50 个数据中符合条件的有11 个,对应的优秀率为11 50100 =22 ,所以从优秀率上看,这50 名工人的技能水平还有待提高。通过这个实验的操作,我EXCEL 的基本命令与操作也有了一定的接触,在某种程度上熟悉了 EXCEL 数据输入、输出与编辑方法,这是对我们平日的学习工作很有帮

7、助的。实验二: EXCEL 的数据特征描述、抽样推断一、实验目的及要求:(一)目的熟悉 EXCEL用于数据描述统计、列联分析、多元回归的基本菜单操作及命令。( 二 ) 内容及要求根据实验1 的数据,( 1)计算特征值; ( 2)判断该企业职工的平均日加工零件数及优秀率的区间;( 3)假设检验(如果以往该企业的工人日加工零件数为115 ,优秀率为5% ,显著性水平为5% )。二、仪器用具硬件:计算机(安装Windows2003 、 Windows2007 或 Windows XP 或以上)软件: EXCEL三、实验原理统计中数据整理与显示的相关理论。四、实验方法与步骤1、 在相应方格中输入命令,

8、得到各特征值。COUNT ( B4:B53 )并回车,得到50个数据中的单位总量。SUM ( B4:B53 )并回车,得到50个数据中的标志总量。MAX ( B4:B53 )并回车,得到50 个数据中的最大值。MIN ( B4:B53 )并回车,得到50个数据中的最小值。AVERAGE ( B4:B53 )并回车,得到50个数据中的平均值。MEDIAN ( B4:B53 )并回车,得到50 个数据中的中位数。GEOMEAN ( B4:B53 )并回车,得到50 个数据中的几何平均数。HARMEAN ( B4:B53 )并回车,得到50 个数据中的调和平均数。AVEDEV ( B4:B53 )并

9、回车,得到50个数据中的变异统计的平均差。STDEV ( B4:B53 )并回车,得到50 个数据中的变异统计的标准差。VAR ( B4:B53 )并回车,得到50 个数据中的变异统计中的方差。KURT ( B4:B53 )并回车,得到50 个数据中的变异统计中的峰度。SKEW (B4:B53 )并回车,得到50 个数据中的变异统计中的偏度。2、 抽样推断在单元格中输入 CONFIDENCE( 所在单元格, 标准差所在单元格, 样本容量单元格 ),点得到极限误差,从而得到日价格零件数和优秀率的置信区间。单元格中键入“ =(样本均值单元格 -115 ) /( 样本标准差单元格 /SQRT (样本

10、容量单元格) )”,得到 t 值;单元格中键入“ =TINA(0.05,49) ”得到 =0.05 ,自由度为 49的临界值。五、实验结果与数据处理1. 特征值单位总量50标志总量6537最大值509最小值107平均值130.74中位数123几何平均数126.2996调和平均数124.3825变异统计的平均差16.664变异统计的标准差55.17202变异统计中的方差3043.951变异统计中的峰度47.77895变异统计中的偏度6.8387522.抽样推断a0.05极限误差15.29262日加工零件数的置信区间 115.44738146.03262 ,优秀率的置信区间 0.172436 0.

11、334821t2.0173018a0.05自信度49临界值2.0095752由题可知待设检验 ho:u115T=(样本均值单元格 -115)/ 样本标准单元格 / (样本容量单元格) =2.0173018由于 TINA(0.05,49)=2.009575237,TTINA(0.05,49). 所以拒绝 ho 接受 hi六、讨论与结论这个实验首先是要求我们计算这 50个数据的特征值, 然后运用所学知识求企业职工的平均日加工零件数及优秀率的区间, 并且进行假设检验。 在所给的实验步骤的指导下, 首先我将这 50个数据在 excel 表中从按照纵排依次排序, 然后用实验给定的函数: COUNT(B4

12、:B53)等,分别输入,得到 50个数据的单位总量,标志总量等特征值。 其实在掌握方法后这部分的操作并没有太大的难度。 在算出了相应特征值后,由于要计算置信区间,我用 CONFIDENCE( 所在单元格,标准差所在单元格,样本容量单元格) ,得到了极限误差,并且有知道日加工零件数的平均值是130.74 ,优秀率是 22%,所以根据这些数据从而得到日价格零件数和优秀率的置信区间。 然后是根据公式我们可以得到 t 值,由 t 值和极限误差,由于实验已经告诉我们以往该企业的工人加工零件数, 优秀率和显著性水平, 则我们用总体比例的区间估计来求得优秀率的区间, 假设检验阶段用总体比率的假设检验来判断工

13、人平均日加工零件数是否下降。 tt (n-1 ),所以拒绝 h0,接受 h1,即工人平均日加工零件数比以前有所上升。假设检验是用来检验总体的, 样本与总体的差异是由抽样误差引起还是本质差别引起的统计推断方法, 实验二主要是在 excel 中运用各种命令进行计算大大的减少我们的工作量 同时能够更加准确。实验三:时间序列分析一、实验目的及要求:(一)目的掌握 EXCEL用于移动平均、线性趋势分析的基本菜单操作及命令。( 二 ) 内容及要求综合运用统计学时间序列中的移动平均、季节指数运算、 时间序列因素分解、图形展示等知识, 对某小区居民用电量(千度)季节数据的构成要素进行分解,并作出图形进行分析。

14、月度第一年第二年第三年第四年155957458554224474694554383345366352341435432734142753744123883586359353332355736538139237684374604294419353344361382102953112913771145445339539812457486491409二、仪器用具硬件:计算机(安装Windows2003 、 Windows2007 或 Windows XP 或以上)软件: EXCEL三、实验原理时间序列分析中的移动平均分析原理、季节指数原理等。四、实验方法与步骤1( 1)输入“年 / 月度”、“时间标

15、号”,复制各月度销售额到“用电量”。( 2)点击“数据分析”“移动平均”,输入区域为“销售额”,间隔4,输出“移动平均值” ;同样的办法对 “移动平均值” 进行 2 步平均, 输出“中心化后的移动平均值”。( 3)对称一下 “移动平均值”和“中心化后的移动平均值”,然后用“用电量”除以“中心化后的移动平均值”求出“比值”。( 4)将“比值”中的数据复制到“季节指数计算表”中,计算完成表。( 5)点击 “图标向导” “折线图” ,输入区域为季节指数中的数值,修改完成图表。2 (1)完善“用电量”和“季节指数”并计算“用电量”/ “季节指数” ,完成季节分离后的时间序列。( 2)点击“数据分析”“

16、回归”, Y 值输入区域为季节分离后的时间序列,X 值输入区域为时间标号,输出。( 3)利用计算出的趋势模型和季节比率,对该小区第五年用电量数据进行预测。3点击“图表向导”“折线图”,数据区域为“用电量” 、“季节分离后的时间序列”和“回归后的趋势” ,系列产生在“列” ,完善标题、 X 轴、 Y 轴,完成,再修改完成图。4用与图3 相同的方法绘制销售额预测图。五、实验结果与数据处理1年月份时间标用电量移动平均中心化的移动比值号平均1115592244733345426.25403.1250.85581395443543803690.959349595566778899101011111212

17、21132143154165176187198209211022112312243125226327428529630731832933103411351236413723833944054164274384494510461147374359365437353295454457574469366327412353381460344311453486585455352341388332392429361291395491542438341427358355376441382377398358360.51.03744799363373.3750.96149983383.75381.1250.95

18、769105378.5370.515373.6250.94479759384.75387.250.76178179389.75417.3751.08775082445466.750.97911087488.5477.51.20209424466.5450.251.04164353434413.750.88459215393.53790.86279683364.5366.3751.12453088368.25384.8750.9171809401.53930.96946565384.5379.251.212920243743830.89817232392395.250.

19、78684377398.5428.6251.05686789458.75476.751.0194022494.75482.1251.21337827469.5451.3751.00803102433.25408.6250.86142551384368.6250.92505934353.25358.251.08304257363.25374.250.88710755385.25381.8751.02651391378.5373.375125368.6250.97931502369376.750.77239549384.5407.1250.97021799429.7544

20、8.1251.09567643466.5459.751.178901584534450.984269664374140.8236715391380.6251.12183908370.25374.6250.95562229379380.750.93237032382.5385.50.97535668388.5391.251.12715655394396.750.96282294399.5395.50.95322377391.51248409季节指数折线图1.41.210.8系列10.60.40.201234567891011122. 季节分离后的时间序列1234合计月平均季节指数11.20209

21、41.2133781.178901583.594374091.19812471.1921.0416441.0080310.984269663.033944211.011314741.0130.8558140.8845920.8614260.82367153.425503110.856375780.8540.959350.8627970.9250591.121839083.869044840.967261210.9651.0374481.1245311.0830430.955622294.200643731.050160931.0560.96150.9171810.8871080.9323703

22、23.69815860.924539650.9270.9576910.9694661.0265140.975356683.929027290.982256820.9881.1794871.212921.1489791.127156554.668542881.167135721.1690.9447980.8981720.9793150.962822943.785107870.946276970.94100.7617820.7868440.7723950.953223773.274244820.818561210.81111.0877511.0568680.9702183.11483671.038

23、27891.120.9791111.0194021.0956763.09418951.03139651.03合计11.9916831时间标用电量季节指数季节分离后的时间序号列15591.19895566466.239093424471.01201614441.692560433450.85696972402.581318743540.96793206365.728148353741.05088928355.889061963590.92518087388.032234273650.98293807371.335703884371.16794519374.161393793530.9469332

24、6372.7823437102950.81912892360.138670211121314151617181920212223242526272829303132333435363738394041424344454647484544575744693663274123533814603443114534865854553523413883323924293612913954915424383414273583553764413823773984091.038999436.95903461.03211183442.78147651.19895566478.74998151.012016144

25、63.43134410.85696972427.08626860.96793206337.83362851.05088928392.04891310.92518087381.54701580.98293807387.61343331.16794519393.85409860.94693326363.2779780.81912892379.67161511.038999435.99656981.03211183470.8792071.19895566487.92463271.01201614449.59757260.85696972410.74963540.96793206352.2974536

26、1.05088928369.21111230.92518087358.84875140.98293807398.80437231.16794519367.31175720.94693326381.23066880.81912892355.2554341.038999380.17360941.03211183475.72364321.19895566452.0600871.01201614432.79942160.85696972397.91370920.96793206441.14666481.05088928340.66386140.92518087383.70875520.98293807

27、382.52664281.16794519377.58621190.94693326403.40752210.81912892460.24501251.038999383.06100391.03211183396.2748882X Variable 1 Line Fit Plot600Y 400200002040X Variable 1该小区第五年用电量数据进行预测SUMMARY OUTPUT回归统计Multiple R0.029616R Square0.000877Adjusted R-0.02084Square标准误差41.25487观测值48方差分析dfSSMS回归分析168.72873

28、68.72873残差4678290.341701.964总计4778359.07Coefficients标准误差t StatIntercept404.800212.097833.46064X Variable 1-0.086380.429831-0.20095月份时间标号预测149402.967721250403.0262657351403.7455592452405.4158069553404.6588679654410.4380862755398.3653493Y预测 Y60SignificanceFF0.0403820.841621P-valueLower 95%Upper95%6.16

29、E-34380.4486429.15190.841621-0.951580.77883856402.2559297957411.7277861058428.69881811159407.2115251260386.2072198第五年预测值500450400350300250第五年预测值200150100500份123456789101112月六、讨论与结论从这个实验开始就显得难度系数比较大了,实验的目的主要是掌握EXCEL用于移动平均、线性趋势分析的基本菜单操作及命令。所谓的季节变动是指一些现象由于受到自然条件或经济条件的影响在一个年度内随着季节的更替而发生的比较有规律的变动。而测定季节变动

30、的方法从是否排除长期趋势的影响看,分为两种:第一种是不排除长期趋势的影响,直接根据原始时间数列来测定,二是先采用移动平均法剔除长期趋后再根据消除长期趋势后的时间数列来测定季节变动。根据实验步骤,我首先算出了用电量的移动平均值和中心化的移动平均值。然后用“用电量”除以“中心化后的移动平均值”求出“比值”,得出季节指数表。再根据季节指数表绘制出季节指数折线图。用用电量中心化的移动平均值得到月比值,从数据可以得到比值受到长期趋势和不规则变动的影响,因为比值的最小值是0.8236715 ,最大值是 1.21337827,并且十二个月的数值都在之间变动,没有规律, 在进行季节分离后的表中,得到第五年的预

31、测值。通过这个实验, 我学到了很多, 比如怎样求季节比率, 怎样进行移动平均。在刚准备开始做的时候,我完全不知道怎么做,然后我就像会做的同学请教,之后略懂了一些。 同时学会如何画折线图和进行回归分析。同时掌握回归分析和预测方法,通过这个实验,我对EXCEL软件的运用又有了更多的认识,同时,我也更加清晰的意识到了这个软件的重要性,所以在平时的空余时间里,我一定要多用时间进行研究这个软件。实验四:一元线性回归分析一、实验目的及要求:(一)目的掌握 SPSS用于相关与回归分析的基本操作及命令。( 二 ) 内容及要求综合运用统计学中相关与回归分析的内容,根据下列数据作出一个。我国 1990 2005

32、年国民生产总值和财政收入资料年份国内生产总值财政收入199018667.822937.1199121781.53149.48199226923.483483.37199335333.924348.95199448197.865218.1199560793.736242.2199671176.597407.99199778973.048651289875.95199989677.0511444.08200099214.5513395.232001109655.216386.042002120332.718903.642003135822.821715.252004159

33、878.326396.472005183084.831649.29二、仪器用具硬件:计算机(安装Windows2003 、 Windows2007 或 Windows XP 或以上)软件: SPSS三、实验原理相关与回归分析的原理等。四、实验方法与步骤按照附件中的一元线性回归方程的建立与检验方式利用上述数据运行程序。五、实验结果与数据处理(1)4.1 表:表 4-1 给出了回归的方法是全回归模式,模型编号为1,自变量是 “国内生产总值 ”,因变量是 “财政收入 ”。Variables Entered/Removed(b,c)VariablesVariablesModelEnteredRemov

34、edMethod1 国内生产总.Enter值a All requested variables entered.b Dependent Variable: 财政收入cModels are based only on cases for which计算=1(2)4.2表: 表 4-2是回归模型统计量:R 是相关系数;R Square相关系数的平方,又称判定系数, 判定线性回归的拟合程度: 用来说明用自变量解释因变量变异的程度 (所占比例); Adjusted R Square 调整后的判定系数; Std. Error of the Estimate 估计标准误差。Model Summary b,

35、cRModel1计算=1(Selected)aR Square.952AdjustedR Square.949Std. Error ofthe Estimate1657.23381a. Predictor s: (Constant), 国 内生 产 总 值b. Unless noted otherwise, statistics are based only on cases for which 计 算 = 1.c. Dependent Variable: 财 政收 入( 3 )表 4-3 是回归模型的方差分析表, F值为 260.239,显著性概率是 0.000,表明回归不太显著。ANOVA

36、b,cSum ofModelSquaresdfMean SquareFSig.1Regression7E+0081714726513.5260.239.000aResidual35703511132746423.887Total8E+00814a. Predictors: (Constant), 国 内 生产 总 值b. Dependent Variable: 财 政 收 入c. Selecting only cases for which 计 算 = 1( 4) 表4-4 回归模型系数表,以及 t检验结果。Coefficientsa,bUnstandardizedStandardizedCo

37、efficientsCoefficientsModelBStd. ErrorBetatSig.1(Constant)-2242.353905.815-2.476.028国内生产总值.166.010.97616.132.000a. Dependent Variable:财 政收 入b. Selecting only cases for which 计 算 = 1表 4-4分析:从上面的回归分析结果表明:国内生产总值与财政收入的关系非常密切,相关系数0.981;同时方差分析表明,其显著性水平为0.000。根据回归系数表 6-5,可写出回归方程如下:Y=-2242.353+0.166x其中 x 代表

38、国内生产总值;Y 代表财政收入。预测值的回归误差可用剩余均方估计:= 2746423.887= 六、讨论与结论这个实验与前三个实验在软件的运用方面有一定的不同,相对而言我对于EXCEL还不是很陌生。 SPSS 这个软件我之前从来没有接触过,所以在应用上会有一定的难度, 因为它还牵涉到了有些很复杂的英语。 在做这个实验的时候, 我是和几个同学进行了讨论,然后大家交流了自己的看法,其实在弄懂之后才发现这个软件的操作也没有之前想象的那么复杂。 只需要输入数据和相关的标志, 再对这些数据进行一些设定, 就可以进行分析了,大部分的计算都是由于电脑完成的, 这为我们节约了很多的时间,同时它也不需要像在EX

39、CEL 中做的时候那样需要自己会用一些公式。我们只需要对它产生的相关的实验结果来进行分析即可。第一步是画散点图,由散点图我们可以推测出其具有线性关系,并且可以得出“ 1990-2005”我国的国民生产总值是上升的 随着时间的增加而增加, 但增加的形式是前面增加的慢后面逐渐加快, 因此我在附件中关于一元回归分析的步骤指导下才进行了后面的回归分析, 通过回归分析我们可以清楚的看到关于国内生产总值与财政收入的关系,这也很具有现实意义。通过这个实验,我粗略的了解了 SPSS用于相关与回归分析的基本操作及命令方面的知识,这真的是一个很好用的软件,对于分析数据很有帮助。所以熟练掌握SPSS的相关用法是十分

40、有必要的,而我也一定会在以后的学习中注重这方面能力的培养。附 :一元回归分析(在实验报告中不要打印这部分)在数学关系式中只描述了一个变量与另一个变量之间的数量变化关系,则称其为一元回归分析。其回归模型为y 称为因变量,x 称为自变量,称为随机误差,a, b 称为待估计的回归参数,下标i 表示第i 个观测值。如果给出a 和b 的估计量分别为、,则经验回归方程:一般把称为残差, 残差可视为扰动的 “估计量 ”。例子 :湖北省汉阳县历年越冬代二化螟发蛾盛期与当年三月上旬平均气温的数据如表1-1,分析三月上旬平均温度与越冬代二化螟发蛾盛期的关系。表 1-1 三月上旬平均温度与越冬代二化螟发蛾盛期的情况

41、表年份1961196219631964196519661967196819691970三月上旬平均温度8.68.39.78.57.58.47.39.75.45.5越冬代二化螟发蛾盛期(6月30日为35314452750)1) 准备分析数据在数据编辑窗口中输入数据。建立因变量历期“历期 ”在 SPSS 数据编辑窗口中,创建 “年份”、 “温度 ”和 “发蛾盛期 ”变量,并把数据输入相应的变量中。2) 启动线性回归过程。击SPSS 主菜单的 “ Analyze下”的 “ Regression中 “”Linear项”,将打开如图 1-1 所示的线性回归过程窗口。3) 设置分析变量设置因变量:本例为“发蛾盛期 ”变量,用鼠标选中左边变量列表中的“发蛾盛期 ”变量,然后点击 “Dep

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论