统计学实习报告_第1页
统计学实习报告_第2页
统计学实习报告_第3页
统计学实习报告_第4页
统计学实习报告_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、 频数分析研究题目:从居民调查问卷中研究“现在买东西合算还是存钱合算和预计未来一两年中居民的收入状况”。数据来源:老师提供的统计学实习居民调查问卷数据。主用的统计值:频率、百分比、累计百分比、均值、四分位值分析方法:频数分析表一Frequency Table(频数分布表)买东西合算还是存钱合算Frequency(频率)Percent(百分比)Valid Percent(有效百分比)Cumulative Percent(累计百分比)Valid(有效)“买东西合算”125448.248.248.2存钱合算135051.851.8100.0Total2604100.0100.0上表表明 :260

2、4名居民中 有1254人认为储蓄用来买东西合算,占总人数的48.2%,累计百分比是48.2% 有1350人认为储蓄用来存钱合算,占总人数的51.8% 预计未来一两年的收入FrequencyPercentValid PercentCumulative PercentValid增加68926.526.526.5基本不变98537.837.864.3减少93035.735.7100.0Total2604100.0100.0上表表明:2604名居民中 有689人预计未来一两年的收入将会增加,占总人数的26.5% 有985人预计未来一两年的收入基本不变,占总人数的37.8%,累计百分比是64.3% 有9

3、30人预计未来一两年的收入将会减少,占总人数的35.7%表二Statistics(统计量)买东西合算还是存钱合算预计未来一两年的收入NValid有效26042604Missing缺失00Mean均值1.522.09Std. Deviation标准差.500.783Range全距12Percentiles分位值251.001.00502.002.00752.003.00上表表明: 至少有四分之一的居民认为储蓄买东西合算,预计未来一两年的收入将会增加; 有一半的居民认为储蓄存钱合算,预计未来一两年的收入基本不变; 有四分之三的居民认为储蓄存钱合算,预计未来一两年的收入将会减少。注:由于变量:“买东

4、西合算还是存钱合算,预计未来一两年中您的收入”是分类数据,所以运用了条形图对其进行分析。Bar Chart(条形图)结合上表和图得:有约48.2%的人认为储蓄用来买东西合算,51.8%的人认为储蓄用来存钱合算。 结合上表和图得:有26.5%的人预计未来一两年的收入将会增加;有37.8%的人预计未来一两年的收入基本不变 ;有35.7%的人预计未来一两年的收入将会减少。二、 列联分析研究题目:从居民调查问卷中研究“现在买东西合算还是存钱合算和预计未来一两年中居民的收入状况”。数据来源:老师提供的统计学实习居民调查问卷数据。主用的统计值:卡方、行百分比、列百分比、总百分比、P值分析方法:列联分析表一

5、买东西合算还是存钱合算 * 预计未来一两年的收入 crosstubu lation 交叉制表预计未来一两年的收入Total合计增加基本不变减少买东西合算还是存钱合算“买东西合算”Count计数3554674321254Expected Count期望计数331.8474.3447.91254.0% within 买东西合算还是存钱合算28.3%37.2%34.4%100.0% within 预计未来一两年的收入51.5%47.4%46.5%48.2% of Total13.6%17.9%16.6%48.2%Residual23.2-7.3-15.9存钱合算Count3345184981350E

6、xpected Count357.2510.7482.11350.0% within 买东西合算还是存钱合算24.7%38.4%36.9%100.0% within 预计未来一两年的收入48.5%52.6%53.5%51.8% of Total12.8%19.9%19.1%51.8%Residual-23.27.315.9TotalCount6899859302604Expected Count689.0985.0930.02604.0% within 买东西合算还是存钱合算26.5%37.8%35.7%100.0% within 预计未来一两年的收入100.0%100.0%100.0%100

7、.0% of Total26.5%37.8%35.7%100.0%由上表得:总体情况:参加调查的居民共有2604人,实际观察频数中 :(1)1254人认为买东西合算,占总人数的48.2%;1350人认为储蓄用来存钱合算,占总人数的51.8%(2)有689人预计未来一两年的收入将会增加,占总人数的26.5%;有985人预计未来一两年的收入基本不变,占总人数的37.8%;有930人预计未来一两年的收入将会减少,占总人数的35.7%具体情况:(1)认为买东西合算的人共1254人,对未来一两年的收入的看法 :355人预计未来一两年的收入将会增加;占买东西合算总人数的28.3%,占增加总人数的51.5%

8、,占总人数的13.6%467人预计未来一两年的收入基本不变;占买东西合算总人数的37.2%,占基本不变总人数的47.4%,占总人数的17.9%432人预计未来一两年的收入减少;占买东西合算总人数的34.4%,占减少总人数的46.5%,占总人数的16.6%(2)认为用来存钱合算的人共1350人,对未来一两年的收入的看法 :334人预计未来一两年的收入将会增加;占存钱合算总人数的24.7%,占增加总人数的48.5%,占总人数的12.8% 。518人预计未来一两年的收入基本不变;占存钱合算总人数的38.4%,占基本不变总人数的52.6%,占总人数的19.9% 。498人预计未来一两年的收入减少;占存

9、钱合算总人数的36.9%,占减少总人数的53.5%,占总人数的19.1% 。(3) 由此可见 : 认为买东西合算的人中觉得“未来一两年的收入基本不变”的比例(37.2%)高于觉得“未来一两年收入将会增加(28.3%)或减少(34.4%)”的比例;认为存钱合算的人中觉得“未来一两年的收入基本不变”的比例(38.4%)高于觉得“未来一两年收入将会增加(24.7%)或减少(36.9%)”的比例。 说明认为存钱核算的人比认为买东西合算的人更觉“得未来一两年的收入基本不变”且减少的可能性比增加的可能性大。表二卡方检验Chi-Square TestsValuedfAsymp. Sig. (2-sided)

10、渐近sig(双侧)Pearson Chi-Square卡方4.431a2.109Likelihood Ratio似然比4.4302.109Linear-by-Linear Association线性和线性组合3.8251.050N of Valid Cases有效案例中的n2604a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 331.80.此检验有效,a. 0单元格的期望计数少于5,最小期望数位331.80. 由卡方检验表得: 卡方概率p值大于显著性水平(0.05或0.01)接受零

11、假设,即认为“买东西合算还是存钱合算”对“预计未来一两年中的收入”无显著影响。三、 单因素方差分析研究题目:管理者的不同水平是否会导致讲座的满意度评分的显著性差异。数据来源:见附录1主用统计值:F统计量、P值、LSD值、均值差分析方法:单因素方差分析表一Test of Homogeneity of Variances方差奇性检验满意度平分Levene Statisticdf1df2Sig.1.324215.296由以上检验的结果知: 检验的P值为0.296,大于显著性水平0.05 。则应接受原假设,即各水平下的总体方差无显著差异,满足方差分析的前提。表二ANOVA满意度平分Sum of Squ

12、aresdfMean SquareFSig.Between Groups组间29.610214.80511.756.001Within Groups组内18.890151.259Total48.50017由方差分析的结果可知 F检验的P值为0.001,小于显著性水平0.05 。拒绝原假设,即管理者的水平对评分有显著影响。表三Multiple Comparisons多重比较满意度平分LSD(I) 管理者层次(J) 管理者层次Mean Difference均值差 (I-J)Std. Error标准误差显著性Sig.95% Confidence Interval置信区间Lower Bound下限Up

13、per Bounddimension2高级管理者dimension3中级管理者-1.25714.65710.075-2.6577.1434低级管理者1.76667*.67953.020.31833.2151中级管理者dimension3高级管理者1.25714.65710.075-.14342.6577低级管理者3.02381*.62434.0001.69314.3546低级管理者dimension3高级管理者-1.76667*.67953.020-3.2151-.3183中级管理者-3.02381*.62434.000-4.3546-1.6931*. The mean difference

14、is significant at the 0.05 level.显著性水平为0.05由多重比较表可知: 高级管理者与中级管理者的评分之间无显著差异。 高级管理者与低级管理者的评分之间存在显著差异。 中级管理者与低级管理者的评分之间存在显著差异。图一:各个水平下观测变量均值的折线图 图一表明:中级管理者与低级管理者的评分之间存在显著差异,且中级管理者与低级管理者的评分之间差异比与高级管理者的差异大。四、 相关分析研究题目:广告费用与销售收入之间的关系。数据来源:见附录2分析方法:主运用散点图、相关系数进行分析从上面各散点图可以看出,月销售收入与电视广告费用、报纸广告费用之间都具有一定的线性关系

15、。但,从各散点图的分布情况看,月销售收入与电视广告费用之间的线性关系比较密切。表一Correlations相关性月销售收入电视广告费用报纸广告费用月销售收入Pearson Correlation1.808*-.021Sig. (2-tailed).015.962N888电视广告费用Pearson Correlation.808*1-.556Sig. (2-tailed).015.152N888报纸广告费用Pearson Correlation-.021-.5561Sig. (2-tailed).962.152N888*. Correlation is significant at the 0.

16、05 level (2-tailed).由上表可以看出:在月销售收入与电视广告费用、报纸广告费用两个变量的关系中,与电视广告费用的相关系数(0.808)比较大,与报纸广告费用的相关系数(-0.021)比较小。即月销售收入与电视广告费的线性关系比较密切。 五、多元线性回归 研究题目:广告费用与销售收入之间的关系。数据来源:见附录2分析方法:多元线性回归分析主运用统计值:R、调整后的R、F统计量、P值、回归系数、残差、标准残差、标准估计的误差、标准误差表一Variables Entered/RemovedaModelVariables Entered输入的变量Variables Removed移去

17、的变量Method方法dimension01电视广告费.Stepwise (Criteria: Probability-of-F-to-enter = .100).2报纸广告费.Stepwise (Criteria: Probability-of-F-to-enter = .100).a. 因变量Dependent Variable: 月销售收入上表表明:(1)本次多元回归分析采用的是逐步筛选法回归系数显著性F检验的相伴概率值小于0.05的自变量引入了回归方程,大于0.1的自变量剔除出了回归方方程(2)自变量进入回归方程的顺序首先电视广告费进入回归方程,形成模型1其次,在模型1的基础上引入第二

18、个自变量报纸广告费,形成最终的回归模型2表二Model Summary模型汇总cModel模型RR Square R方Adjusted R SquareStd. Error of the Estimate标准 估计的误差dimension01.808a.653.5951.215182.959b.919.887.64259a. 预测变量Predictors: (Constant), 电视广告费(万元)b. 预测变量Predictors: (Constant), 电视广告费(万元), 报纸广告费(万元)c.因变量 Dependent Variable: 月销售收入(万元)由上表得:随着自变量的不断

19、引入回归方程,调整的R2在不断提高,回归方程的估计标准误差在不断减小。表三ANOVAcModel平方和Sum of Squaresdf均方Mean SquareFSig.1Regression回归16.640116.64011.269.015aResidual残差8.86061.477Total总计25.50072Regression23.435211.71828.378.002bResidual2.0655.413Total25.5007a. Predictors: (Constant), 电视广告费(万元)b. Predictors: (Constant), 电视广告费(万元), 报纸广告

20、费(万元)c. Dependent Variable: 月销售收入(万元)由上表得:(1)模型1(电视广告费)与模型2(报纸广告费) F 检验的P值都小于显著性水平0.05,即因变量销售收入与自变量电视广告费、报纸广告费的线性关系是显著的,即意味着模型中存在多重共线性。(2)第二列的三行分别列出了:回归平方和、剩余平方和、因变量的总平方和。第四列是第二列除以第三列自由度的结果,分别为平均的回归平方和、平均的剩余平方和。第五列是用于回归方程显著性检验的F统计量,由平均的回归平方和除以平均的剩余平方和得到。第六列是F统计量对应的相伴概率值。表四Coefficients系数aModelUnstand

21、ardized Coefficients非标准化系数Standardized Coefficients标准系数tSig.Collinearity Statistics共线性统计量BStd. Error标准误差Beta试用版ToleranceVIF1(Constant)88.6381.58256.016.000电视广告费1.604.478.8083.357.0151.0001.0002(Constant)83.2301.57452.882.000电视广告费2.290.3041.1537.532.001.6901.448报纸广告费1.301.321.6214.057.010.6901.448a.因

22、变量 Dependent Variable: 月销售收入分析系数表得:(1)第一列,是回归分析过程中形成的两个模型的代码和引入自变量的情况,模型2是最终的回归模型;第二列,回归模型各自变量的回归系数,依据该回归系数,案例最终的回归方程为: 销售收入83.230+2.290电视广告费+1.301报纸广告费第三列,回归系数的标准误差;第四列,标准化回归系数,可以衡量自变量对因变量的贡献程度。依据标准化回归系数,案例最终的标准化回归方程为:销售收入1.153电视广告费+0.621报纸广告费(2)可见,在其他变量保持一定的条件下:电视广告费增加一个单位,将引起销售收入平均增加1.153个单位;报纸广告

23、费增加一个单位,将引起销售收入平均增加0.621个单位。(3)第五、六列,各回归系数显著性检验的t统计量和其相应的相伴概率值回归系数的P值均小于显著性水平0.05。应拒绝回归系数显著性检验的零假设,即认为这些回归系数与零有显著差异,相应的自变量能够较好的解释说明因变量的变化,应该保留在回归方程中。表五以排除的变量 Excluded VariablesbModel模型Beta IntSig.Partial Correlation偏相关Collinearity Statistics共线性统计量ToleranceVIFMinimum Tolerance容差1报纸广告费.621a4.057.010.8

24、76.6901.448.690a. PrCollinearity DiagnosticsaModelDimensionEigenvalueCondition IndexVariance Proportions(Constant)电视广告费报纸广告费dimension01dimension111.9621.000.02.022.0387.228.98.982dimension112.8461.000.00.01.012.1404.510.00.16.293.01414.4941.00.83.71a. Dependent Variable: 月销售收入模型中的预测变量:(常量)edictors i

25、n the Model: (Constant), 电视广告费b. Dependent Variable: 月销售收入上表表明:(1)该表是回归分析过程中,尚未被引入方程的自变量的情况。(2)第二、三、四列,模型1;第二列表示:如果下一步引入报纸广告费,那么它的标准化系数应该是0.621,这个数据与输出结果表四中的模型2是相吻合的。第三、四列表示,如果下一步引入某自变量进入回归方程,它的回归系数显著性检验的t值和对应的相伴概率值。(3)第五列,在控制了方程中已有自变量的前提下计算出的某自变量与因变量的偏相关系数。第六列,显示如果某自变量进入了回归方程,方程中所有自变量容忍度的最小值,通过比较最小

26、容忍度和该自变量的容忍度,可以对目前方程中自变量共线性的大小程度有所把握。表六残差统计量Residuals StatisticsaMinimum极小值Maximum极大值Mean均值Std. Deviation标准偏差NPredicted Value预测值90.412496.632593.75001.829738Std. Predicted Value标准预测值-1.8241.575.0001.0008Residual残差值-.63249.65769.00000.543098Std. Residual标准残差值-.9841.024.000.8458Stud. Residual-1.6251.2

27、25-.1481.1378Deleted Residual-1.72313.94145-.269921.037088Stud. Deleted Residual-2.1151.309-.1911.2648Mahal. Distance.0483.7471.7501.6218Cooks Distance.0091.517.434.5378Centered Leverage Value.007.535.250.2328a. Dependent Variable: 月销售收入表六表示:残差统计量,第一至第四行数据分别为:根据回归方程计算出的因变量预测值序列、残差序列、标准化预测值序列、标准化残差序列

28、的最小值、最大值、均值、标准差和样本数。 残差分析结果(1)标准化残差直方图: 从图中看出,标准化残差不服从均值为0的正态分布,图形略呈右偏分布。(2)标准化残差散点图:标准化残差在0附近波动,残差的均值为0;但并不是随机的分布在一条平行的带子内,图形有点关于X轴对称。(3)方差为常数,且残差之间不相关,95%的点分布在-1至+1之间。(4)综上所述,标准化残差不服从标准正态分布,即随机误差项不服从基本假定。总结:1、 本次实习中所进行的定量分析的研究题目、数据来源及定量分析的方法: (1)第一个研究题目:从居民调查问卷中研究“现在买东西合算还是存 钱合算和预计未来一两年中居民的收入状况”。 数据来源:老师提

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论