统计分析综合实验答题_第1页
统计分析综合实验答题_第2页
统计分析综合实验答题_第3页
统计分析综合实验答题_第4页
统计分析综合实验答题_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、商学院财务管理专业统计分析综合实验考题一 样本数据特征分析:要求收集国家统计局2011年与2000年全国人口普查相关数据,进行二者的比较,然后写出有说明解释的数据统计分析报告,文字通顺,对统计结果的说明分析重点突出,几条要求如下:1报告必须包含所收集的原始数据表,至少包括总人口,流动人口,城乡、性别、年龄、民族构成,教育程度,家庭户人口八大指标;2报告中必须有针对某些指标的条形图,饼图,直方图以及累计频率条形图,(茎叶图可选作)3采用适当方式分别检验二次调查得到的人口年龄比例以及教育程度这两个指标是否有显著不同,写明检验过程及结论。二 一元线性回归分析:回归模型:自由建立,如将某地人均食品消费

2、支出与人均收入作为因变量与解释变量,或某地家用汽车消费量与人均收入作为因变量与解释变量等均可。统计分析报告必须写明:实际问题的背景,所采用的模型与数据来源,至少有20个原始的样本数据,回归方差分析表以及回归系数及显著性检验表(5%),回归系数的95%置信区间,散点图,分析结论,应用价值等均不可缺少。 特别提醒:按时交打印稿并且附此试题!商学院财务管理专业 统计分析综合实验答题一、样本数据特征分析2000年全国人口普查与2011年全国人口普查相关数据分析报告 2000年与2011年全国人口普查各项指标原始数据 单位(人)年份2000年2011年总人口数12426122261339724852家庭

3、户人口数11782712191244608395流动人口居住地与户口登记地所在的乡镇街道不一致且离开户口登记地半年以上的人口数42418562261386075城乡构成农村居民人口数783841243674149546城镇居民人口数458770983665575306性别构成男性人口数640275969686852572女性人口数602336257652872280年龄构成0-14周岁人口数28452759422245973715-59周岁人口数82810676293961641060周岁及以上人口数129977870177648705民族构成汉族人口数11373861121225932641

4、少数民族人口数105226114113792211教育程度大学(大专及以上)文化程度人口数44020145119636790高中(含中专)文化程度人口数138283459187985979初中文化程度人口数422386607519656445小学文化程度人口数441613351358764003文盲(15岁及以上不识字)人口数8506966754656573(一)总人口2011年第六次全国人口普查数据显示,总人口数为1339724852,比2000年的第五次人口普查的1242612226人次,总人口数增加97112626人,增长7.82%,平均年增长率为0.78%。(二)家庭户人口2000年人

5、口普查家庭户人口数共有1178271219人,有家庭户340491197,平均每个家庭3.46人。2011年增长到1244608395人,平均每个家庭户的人口为3.10人,比2000年减少0.36人。(三)流动人口2011年人口普查数据中,居住地与户口登记地所在的乡镇街道不一致且离开户口登记地半年以上的人口为261386075人,同2000年第五次全国人口普查相比,居住地与户口登记地所在的乡镇街道不一致且离开户口登记地半年以上的人口增加116995327人,增长81.03%。(四)城乡构成2000年农村居民人口数为783841243人,占63.08%;城镇居民则有458770983人,占36.

6、92%。2011年人口普查显示居住在城镇的人口为665575306人,占49.68%;居住在乡村的人口为674149546人,占50.32%。通过下面的条形图可以清楚的看到2000年2011年十年间,农村居民减少而城镇居民增加,通过进一步计算可以得知城镇人口比重上升12.76个百分点。 城乡人口复式条形图 城乡人口堆积面积图(五)性别构成2000年第五次人口普查男性人口为640275969人占51.53%;女性人口为602336257人,占48.47%。2011年第六次人口普查显示男性人口为686852572人,占51.27%;女性人口为652872280人,占48.73%。通过下面的饼图可以

7、放大百分比上些微的变化(两个年份左边较小的部分均为女性人口数),总人口性别比(以女性为100,男性对女性的比例)由2000年第五次全国人口普查的106.31下降为105.20。男女人口数饼图(六)年龄构成根据上面给出的原始数据表,两次普查的年龄构成大致如下。2000年人口普查:0-14岁人口为284527594人,占22.90%;15-59岁人口为828106762人,占66.64%;60岁及以上人口为 129977870人,占10.46%。20011年人口普查:0-14岁人口为222459737人,占16.60%;15-59岁人口为939616410人,占70.14%;60岁及以上人口为17

8、7648705人,占13.26%。 为了进一步分析各年龄段,根据联合国卫生组织的新划分标准将年龄进一步细分,用直方图进行分析。原始数据整理如下:两次人口普查年龄数据 单位(人)年龄段2000年2011年少儿(014岁)284527594221322621青年(1544岁)632911142668233610中年(4559岁)195195620265660198年轻老年人(6074岁)102058457132752961老年人(7589岁)2694818642857259长寿老人(90岁及以上)9712271984220首先利用SPSS软件将六个年龄段分别负值,1为少年,2为青年,3为中年4为年

9、轻老年人,5为老年人,6为长寿老人。然后将描述统计量以400万为一单位分为个体数据,通过直方图显示其分布频数。第五次人口普查年龄构成直方图 第六次人口普查年龄构成直方图 通过直方图的分布可以得出,两次统计结果显示了相似的正态分布。青年人口数量占有绝对较高的比例。具体看到各个年龄段的人口变化(为了方便陈述,以数值代指各年龄段),年龄段1有较明显的人口数量减少,年龄段2、3、4、5在其原有基础上缓慢增长,年龄段3取代年龄段1变为人口数第二的年龄段。由于年龄段6人口数始终较少,在处理数据过程中其特征无法被放大,2000年年龄段6的频数为0.242,2011年增长到0.496,其增长比例是最为显著的,

10、说明随着社会经济的发展高龄老年人数量逐渐增多。(七)民族构成2000年普查,汉族人口为1137386112人,占91.53%;少数民族人口为105226114人,占8.47%。2011年普查,汉族人口为1225932641人,占91.51%;各少数民族人口为113792211人,占8.49%。(八)教育程度2000年人口普查时,具有大学(大专及以上)文化程度的人口为44020145人;具有高中(含中专)文化程度的人口为138283459人;具有初中文化程度的人口为422386607人;具有小学文化程度的人口为441613351人,文盲人口(15岁及以上不识字的人)为85069667人。2011

11、年,具有大学(大专及以上)文化程度的人口为119636790人;具有高中(含中专)文化程度的人口为187985979人;具有初中文化程度的人口为519656445人;具有小学文化程度的人口为358764003人,文盲人口(15岁及以上不识字的人)为54656573人。 以累计频率条形图对教育程度进行进一步分析,类似于年龄构成的数据处理方法,以500万为单位对各个文化段的人口数进行调整,得出具体的个体值,再利用SPSS软件分别作出两次普查教育程度的累计频率条形图。第五次普查教育程度数据累计频率条形图从上图可以看到大学(大专及以上)文化程度的人口占比特别低。累计高中以上文化程度为20%不到,累计初

12、中以上文化程度为50%左右,累计小学以上文化程度为90%左右。通过简单的相减可以得出结论,占比最大的文化段应该在小学文化程度。另外注意到小学文化程度过后的文盲,占比约有10%。第六次普查教育程度数据累计频率条形图看到第六次普查的数据,首先,大学(大专文化及以上)程度人口有显著增长,接近翻倍。其他文化程度(除文盲)也都有所增长,其中累计高中以上文化程度频率约为25%,累计初中以上文化程度频率约65%,累计小学以上文化程度频率约95%。同样可以直观的了解到,占比最大的文化段由小学文化程度移至初中文化程度。最后看到文盲所占比重,相比较十年前,削减了近二分之一。总的来说,对比两次普查,可以很肯定的说十

13、年间我国教育事业取得了较为显著的成绩,国民受教育水平大大提升。(九)对两次普查人口年龄比例这一指标是否有显著不同的检验。单从两次普查三个年龄段的数据来看,表1和表2给出了各自的的均值、标准差、均值标准误差以及两次数据的相关系数,可以看出前后两次统计并没有发生显著的变化。表3配对样本t检验结果,包括配对变量差值的均值、标准差、均值标准误差以及差值的95%置信度下的区间估计,给出了t统计量和p值。结果显示p0.588>0.05,所以,第五次人口普查和第六次人口普查在上述三个年龄段得到的人口数据没有显著不同。表1:两次人口普查三个年龄段(014岁,1559岁,60岁及以上)的描述统计量Pair

14、ed Samples StatisticsMeanNStd. DeviationStd. Error MeanPair 1第五次人口普查4.14E833.667E82.117E8第六次人口普查4.47E834.276E82.469E8表2:两次人口普查三个年龄段(014岁,1559岁,60岁及以上)数据的相关系数Paired Samples CorrelationsNCorrelationSig.Pair 1第五次人口普查 & 第六次人口普查3.987.102表3:配对样本T检验结果Paired Samples TestPaired DifferencestdfSig. (2-tail

15、ed)MeanStd. DeviationStd. Error Mean95% Confidence Interval of the DifferenceLowerUpperPair 1第五次人口普查 - 第六次人口普查-3.237E78.779E75.069E7-2.505E81.857E8-.6392.588(十)对两次普查人口教育程度这一指标是否有显著不同的检验。这一指标下人口数分为五个:大学(大专及以上)文化程度人口数;高中(含中专)文化程度人口数;初中文化程度人口数;小学文化程度人口数;文盲(15岁及以上不识字)人口数。单从两次普查五个分段的教育程度数据来看,表4和表5给出了各自的的

16、均值、标准差、均值标准误差以及两次数据的相关系数,可以看出前后两次统计并没有发生显著的变化。表6配对样本t检验结果,包括配对变量差值的均值、标准差、均值标准误差以及差值的95%置信度下的区间估计,给出了t统计量和p值。结果显示p0.451>0.05,所以,第五次人口普查和第六次人口普查在教育程度得到的人口数据没有显著不同。表4:两次人口普查教育程度的描述统计量Paired Samples StatisticsMeanNStd. DeviationStd. Error MeanPair 1第五次人口普查2.62E842.007E81.003E8第六次人口普查2.97E841.796E88.

17、978E7表5:两次人口普查教育程度数据的相关系数Paired Samples CorrelationsNCorrelationSig.Pair 1第五次人口普查 & 第六次人口普查4.915.085表6:配对样本T检验结果Paired Samples TestPaired DifferencestdfSig. (2-tailed)MeanStd. DeviationStd. Error Mean95% Confidence Interval of the DifferenceLowerUpperPair 1第五次人口普查 - 第六次人口普查-3.493E78.089E74.045E7

18、-1.637E89.379E7-.8643.451二、一元线性回归分析江苏省南通市1993年2006年农村人均收入与人均食品支出之间的关系(一)实际问题背景影响居民消费的因素很多,包括社会的、历史的、经济的、预期收入等多方面因素,但最主要的是经济方面的因素。在市场经济条件下,收入是决定居民消费的最主要原因。而食品支出作为消费中最为基础的生存型消费,具有较高的研究价值。另一方面,消费、投资、净出口是拉动经济增长的“三驾马车”,近年来,国民经济持续快速发展,但居民消费对经济增长贡献却在逐步走低,居民消费的增长低于经济的增长,而其中农村居民的消费又更弱于经济的快速发展。提升农村居民的消费水平,对于增

19、加居民消费对经济增长的贡献份额,提高经济运行质量具有重要的现实意义。本次分析以江苏省南通市农村居民十五年的人均收入和人均食品支出为样本,进行线性回归分析,研究两个变量之间的关系。进而了解该地区农村经济和消费情况,提出合理建议。(二)数据来源从江苏省统计局网站上取得1993年2006年各年江苏省南通市农村的人均收入和人均食品支出的数据,以及中国统计局网站上得到的各年居民消费价格指数(CPI)。为了剔除价格因素对人均消费和人均收入的影响,需要对原始数据进行调整。具体步骤如下:1.以1999年为基期,计算各年CPI值。上年调整后的CPI*当年CPI/100=当年调整后的CPI2.根据调整后的CPI,

20、对各年的人均消费和人均收入数据进行调整。调整后的人均消费=人均消费/调整后的CPI*100;调整后的人均GDP=人均GDP/调整后的CPI*100 原始数据如下表:1993年2006年江苏省南通市农村人均收入和人均食品支出原始数据 单位:(元)年份人均收入食品支出CPICPI(1999)=10019931167483114.763.1918638419941820820124.178.42110303199525471040117.191.83111164199631681274108.399.45309391199733881165102.8102.237780519983504110899

21、.2101.419878319993585101198.610020003710989100.4100.420013926986100.7101.102820024133105099.2100.2939776200343931173101.2101.4975053200449291381103.9105.455908200555011559101.8107.3541144200661061659101.5108.9644261调整后的数据如下表:1993年2006年江苏省南通市农村人均收入和人均食品支出可比数据 单位:(元、%)年份人均收入食品支出占总支出的比重19931846.7567376

22、4.33890545.419942320.803881045.6369146.819952773.569821132.513794719963185.421261281.005944.919973313.843461139.5004842.919983454.9441092.48841.719993585101139.720003695.21912985.05976134.120013883.17633975.24499835.520024120.885521046.9222836.120034328.18521155.6934339.420044673.991331309.5520441.3

23、20055124.163181452.2033140.420065603.663711522.5152538.5(三)数据分析对这两个变量,考虑人均收入对人均食品支出的影响,建立的模型如下:yi=+xi其中,yi是人均食品支出,xi是人均收入1.人均食品支出与人均收入的散点图通过SPSS工具作出人均消费与人均收入的散点图从图上可以直观地看出这两个变量之间存在线性相关关系。2. 人均消费与人均收入相关系数表Correlations人均收入人均食品支出人均收入Pearson Correlation1.768*Sig. (2-tailed).001N1414人均食品支出Pearson Correla

24、tion.768*1Sig. (2-tailed).001N1414*. Correlation is significant at the 0.01 level (2-tailed).从表中可得到两变量之间的皮尔逊相关系数为0.768,双尾检验概率p值尾0.001<0.05,故变量之间显著相关。根据住人均食品支出与人均收入之间的散点图与相关分析显示,人均食品支出与人均收入之间存在显著的正相关关系。在此前提下进一步进行回归分析,建立一元线性回归方程。3.线性回归分析(1)回归模型拟和优度评价Model SummarybModelRR SquareAdjusted R SquareStd.

25、 Error of the Estimate1.768a.590.556133.439461a. Predictors: (Constant), 人均收入b. Dependent Variable: 人均食品支出上表给出了回归模型的拟和优度(R Square)、调整的拟和优度(Adjusted R Square)、估计标准差(Std. Error of the Estimate)。从结果来看,回归的可决系数和调整的可决系数分别为0.768和0.590,即人均消费的60左右的变动可以被该模型所解释。(2)回归模型的方差分析表ANOVAbModelSum of SquaresdfMean SquareFSig.1Regression307633.7851307633.78517.277.001aResidual213673.0751217806.090Total521306.86013a. Predictors: (Constant), 人均收入b. Dependent Variable: 人均食品支出可以看到,F统计量为17.277,对应的p

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论