数据分析spss作业_第1页
数据分析spss作业_第2页
数据分析spss作业_第3页
数据分析spss作业_第4页
数据分析spss作业_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据分析方法及软件应用(作业)题 目:4、8、13、16 题指导教师: 学 院:交通运输学院姓 名: 学 号:4、在某化工生产中为了提高收率,选了三种不同浓度,四种不同温度做试验。 在同一浓度与温度组合下各做两次试验,其收率数据如下面计算表所列。试在 a =0.05显著性水平下分析(1) 给出SPSS数据集的格式(列举前3个样本即可);(2) 分析浓度对收率有无显著影响;(3) 分析浓度、温度以及它们间的交互作用对收率有无显著影响。解答:(1)分别定义分组变量浓度、温度、收率,在变量视图与数据视图中 输入表格数据,具体如下图。ilk1111321110312124121151313&13971

2、4108141292191021722101222913238142311峯称类型宽度小数值列1法度数值80无无8 I2温度数值S0无无83收率数值80无无8(2)思路:本问是研究一个控制变量即浓度的不同水平是否对观测变量收率 产生了显著影响,因而应用单因素方差分析。假设:浓度对收率无显著影响。步骤:【分析-比较均值-单因素】,将收率选入到因变量列表中,将浓度选入 到因子框中,确定。输出:變異數分析收率平方和df平均值平方F顯著性群組之間39.083219.5425.074.016在群組內80.875213.851總計119.95823显著性水平a为0.05,由于概率p值小于显著性水平a,则应

3、拒绝原假设, 认为浓度对收率有显著影响。(3)思路:本问首先是研究两个控制变量浓度及温度的不同水平对观测变 量收率的独立影响,然后分析两个这控制变量的交互作用能否对收率产生显著影 响,因而应该采用多因素方差分析。假设,Hoi:浓度对收率无显著影响;H02:温度对收率无显著影响;H03:浓度与温度的交互作用对收率无显著影响。步骤:【分析-一般线性模型-单变量】,把收率制定到因变量中,把浓度与温 度制定到固定因子框中,确定。输出:主旨間效果檢定因變數:收率來源第III 類平方和df平均值平方F顯著性修正的模型70.458 a116.4051.553.230截距2667.04212667.04264

4、6.556.000浓度39.083219.5424.737.030温度13.79234.5971.114.382浓度*温度17.58362.931.710.648錯誤49.500124.125總計2787.00024校正後總數119.95823a. R 平方=.587 (調整的 R 平方=.209 )第一列是对观测变量总变差分解的说明;第二列是观测变量变差分解的结 果;第三列是自由度;第四列是均方;第五列是F检验统计量的观测值;第六列 是检验统计量的概率p值。可以看到观测变量收率的总变差为119.958,由浓度不同引起的变差是39.083,由温度不同引起的变差为13.792,由浓度和温度的交

5、互作用引起的变差为17.583,由随机因素引起的变差为49.500。浓度,温度和浓 度*温度的概率p值分别为0.030,0.382和0.648。浓度:显著性0.05说明拒绝原假设(浓度对收率无显著影响),证明浓度对 收率有显著影响;温度:显著性0.05说明不拒绝原假设(温度对收率无显著影 响),证明温度对收率无显著影响;浓度与温度:显著性0.05说明不拒绝原假 设(浓度与温度的交互作用对收率无显著影响),证明温浓度与温度的交互作用 对收率无显著影响。8、以高校科研研究数据为例:以课题总数 X5为被解释变量,解释变量为投入人 年数X2、投入科研事业费X4、专著数X6获奖数X8;建立多元线性回归模

6、型, 分析它们之间的关系。解释变量采用逐步筛选策略,并做多重共线性、方差齐 性和残差的自相关性检验。解答:思路:根据要求采用逐步筛选的解释变量筛选策略, 利用回归分析方法建立 多元线性回归模型,分析它们之间的关系,并且要求做多重共线性、方差齐性和 残差的自相关性检验。(1)步骤:【分析-回归-线性】,X5选入因变量,X2、X4 X6、X8选入自变 量,方法选择【逐步】。【统计量】勾选【估计】、【模型拟合度】、【共线性诊断】 与【Durbin-Waston(U)】。【绘制(T)按钮】,将*ZRESlD添加到Y(Y)框中,将*ZPRED 添加到X2(X)框中,勾选【正态概率图】,【保存(S)】按钮

7、。在预测值与残差 中勾选【标准化】选项。选择菜单【分析一相关一双变量】将标准化预测值和标 准化残差选入【变量】框,在相关系数中选择Spearman各项完成后点击【确定】。输出:變數已輸入/已移除模型變數已輸入變數已移除方法1投入人年数逐步(準則:F-to-enter 的 機率 =.100】。a.應變數:课题总数模型摘要模型RR平方調整後R平方標準偏斜度錯誤Durbin-Watson1.959 a.919.917241.95821.747a. 預測值:(常數),投入人年数b. 應變數:课题总数表中变量为投入人年数,参考调整的判定系数,由于调整的判定系数(0.917) 较接近于1,因此认为拟合优度

8、较高,被解释变量可以被模型解释的部分较多, 未能被解释的部分较少。方程DV检验值为1.747,残差存在一定的正自相关。變異數分析模型平方和df平均值平方F顯著性1迴歸19379040.047119379040.047331.018.000 b殘差1697769.9532958543.791總計121076810.000 I30 1IIIa.應變數:课题总数b.預測值:(常數),投入人年数被解释变量的总离差平方和为21076810.00,回归平方和及均方分别为19379040.047和19379040.047,剩余平方和及均方分别为1697769.953和 58543.791,检验统计量的观测值

9、为331.018,对应的概率 值近似为0。依据该 表可进行回归方程的显著性检验。如果显著性水平为0.05,由于概率 值小于显著性水平 ,应拒绝回归方程显著性检验的零假设,认为回归系数不为 0,被 解释变量与解释变量的线性关系是显著的,可建立线性模型。係數模型非標準化係數標準化係數T顯著性共線性統計資料B標準錯誤Beta允差VIF1(常數)-94.52472.442-1.305.202投入人年数.492.027.95918.194.0001.0001.000a.應變數:课题总数依据该表可以进行回归系数显著性检验,写出回归方程和检测多重共线性。可以看到,如果显著性水平 为0.05,投入人年数变量的

10、回归系数显著性t检验的 概率p值小于显著性水平,因此拒绝零假设,认为其偏回归系数与0有显著差异, 与被解释变量与解释变量的线性关系是显著的, 应保留在方程中。同时从容忍度 和方差膨胀因子看,解释变量与投入人年数多重共线性很弱,可以建立模型。最 终回归方程为,课题总数=-94.524+0.492投入人年数。排除的變數模型Beta 入T顯著性偏相關共線性統計資料允差VIF允差下限1投入科研事业费(百元).152 b1.528.138.278.2673.748.267专著数.023 b.182.857.034.1885.308.188获奖数.030 b.411.684.077.5421.846.54

11、2a. 應變數:课题总数b. 模型中的預測值:(常數),投入人年数该表展示回归方程的剔除变量,可以看到,如果显著性水平为0.05,表中三个变量的回归系数显著性t检验的概率p值大于显著性水平,因此不拒绝零假 设,认为其偏回归系数与0无显著差异,与被解释变量与解释变量的线性关系是 不显著的,不应保留在方程中。同时从容忍度和方差膨胀因子看, 解释变量与三 个解释变量多重共线性严重,在建立模型的时候应当被剔除。共線性診斷|模型維度特徵值條件指數變異數比例(常數)投入人年数111.8001.000.10.102.2003.001.90.90a.應變數:课题总数依据该表可进行多重共线性检测,从方差比例上看

12、第二个变量可解释常量的 90%,也可解释投入人年数的90%,一次认为这些变量存在多重共线性。 条件指 数都小于10,说明存在共线性较弱,低个变量特征值小于 0.7,说明线性相关关 系较弱。殘差統計資料最小值最大值平均數標準偏差N預測值-57.6423246.986960.000803.721331殘差-466.2850509.6787.0000237.891431標準預測值-1.2662.845.0001.00031標準殘差-1.9272.106.000.98331a.應變數:课题总数嵐歸糅那化城於怕我烏F-F四数据点围绕基准线还存在一定的规律性,但标准化残差的非参数检验结果表明标准化残差与标

13、准正态分布不存在显著差异,可以认为残差满足了线性模型的 前提要求。随着标准化预测值的变化,残差点在0线周围随机分布,但残差的等方差性 并不完全满足,方差似乎有增大的趋势。但计算残差与预测值的Spearman等级相关系数为-0.176,且检验并不显著,因此认为异方差现象并不明显。相關StandardizedPredictedValueStandardizedResidualSpearman 的 rhoStandardized Predicted相關係數1.000-.176Value顯著性(雙尾).344N3131Standardized Residual相關係數-.1761.000顯著性(雙尾)

14、.344N3131依据该表可以对标准化残差和标准化预测值的 Spearman等级进行分析,可 以看到,计算残差与预测值的相关性弱,认为异方差现象不明显。13、利用1950年1990年的天津食品消费数据,分析这段时间内的人均生活费 用年收入的变化情况。要求:数据进行对数变换后,运用Holt线性趋势平滑模型分析。(1) 输出均方根误差和参数估计结果;(2) 输出ACF和PACFffl形并对其特征进行分析,是否满足白噪声序列的条件;(3) 给出1991-1992的预测值,并输出拟合图。解答:思路:根据题意,先不进行序列图和自相关、偏自相关的观察和检验阶段处 理。直接利用指数平滑模型中的Holt线性趋

15、势模型对数据进行分析,同时输出均 方根误差和参数估计误差,ACF和 PACF图像判断是否满足白噪音序列的条件;最后然后对数据进行1991年、1992年做出预测,并用模型进行拟合步骤:【分析-预测-创建模型】,将人均生活费年收入选入【因变量】中,将 【方法】选为【指数平滑法】;点击【条件】,在【因变量转换】中选【自然对数】, 在【模型类型】中【Holt线性趋势】,【继续】。【统计量】,在【拟合度量】中选择【平稳的 R方、均方根误差】,在【个别 模型的统计量】中选中【参数估计】,在【比较模型的统计量】中选中【拟合优 度】,选中【显示预测值】,【确定】【图表】,在【单个模型图】中选择【序列、残差自相

16、关函数、残差部分自 相关函数】,在【每张图显示的内容】中现则【观察值、预测值、拟合值】。【选项】,在【预测阶段】选择第二个,在【日期】的【年】框中填入【1992】。 输出:模型適合度適合度統計資料平均數SE最小值最大值百分位數5102550759095平穩R平方.221.221.221.221.221.221.221.221.221.221R平方.994.994.994.994.994.994.994.994.994.994RMSE28.17928.17928.17928.17928.17928.17928.17928.17928.17928.179MAPE3.5173.5173.5173.5

17、173.5173.5173.5173.5173.5173.517MaxAPE12.49512.49512.49512.49512.49512.49512.49512.49512.49512.495MAE17.14617.14617.14617.14617.14617.14617.14617.14617.14617.146MaxAE82.91182.91182.91182.91182.91182.91182.91182.91182.91182.911標準化BIC6.8586.8586.8586.8586.8586.8586.8586.8586.8586.858模型統計資料模型預測變數數目模型適合

18、度統計資料Ljung-Box Q(18)離群值數目平穩R平方RMSE統計資料DF顯著性人均生活费年收入-模型 10.22128.17916.36016.4280均方根误差为28.179,误差较小指數平滑化模型參數模型估計SET顯著性人均生活费年收入-模型自然對數 Alpha (水準)1.000.1576.381.000_1Gamm(趨勢).400.1782.244.031模型的两个参数分别为:1.0和0.4,则具体模型为ft+m=1.0+0.4m ,舷 pacf2d-Tr-I21201&-1B-1产1-ILH-12-I:-111D-:-IZZI0 D 匸口D1r-1.&.5a.D1.D-l.f

19、l-0.50.0asResidual但两函数都虽然残差自相关函数和偏自相关函数绝大多数处于置信区间内, 具有明显减少趋势,且具有一定的季节性,因此不属于白噪音序列。預測模型19911992人均生活费年收入-模型_1預測1708.821920.58UCL1887.022274.43LCL1543.631609.99針對每一個模型,預測是在所要求的估計期間範圍內的前次非遺 漏開始,並在其所有預測值的非遺漏值可用的前次期間,或是在 所要求的預測期間的結束日期結束,取較早的時間。002000.00-1SDD.0D-100D.00-500叶松J. gCDr _ gg gEBBKJ4 予g g 口 Bi田

20、g1991、1992年的预测值与1990年的观测值有较大的增长趋势。从整个数据 来看,1950年至1980年这段时期较为平稳的增长,但是1980年之后迅速上升, 最后预测值上升较为明显,这与实际趋势基本一致。且1991、1992年预测值分 别为 1708.82、1920.58。16、结合自己的研究方向、参与项目等,举出一个说明SPS在交通运输中应用的例子。例子需包含问题说明、数据来源、统计方法、统计结果及其主要结论。解答:问题说明:利用1950年2013年美国么历年定期航班旅客周转量(单位:“台 亿客公里)历年数据数据,建立几种指数平滑模型,预测 2016年美国定期航班 旅客周转量。数据来源:

21、从统计看民航(2014)中国民航出版社,2014年11月第一版年份1950195119521953195419551956195719581959定期航班旅客周转量/亿客公里164.4211.8250.3292.1331.6391.8444.5503506.9585.3年份1960196119621963196419651966196719681969定期航班旅客周转量/亿客公里625.4640.9704.2810.4941.31105.21285.71605.81830.72017.3年份1970197119721973197419751976197719781979定期航班旅客周转量/亿客

22、公里2131.32155.914532606262126202882311036404080年份1980198119821983198419851986198719881989定期航班旅客周转量/亿客公里3930395041004460472052795800647067436948年份1990199119921993199419951996199719981999定期航班旅客周转量/亿客公里731471837651.477598199.88491.69214.89655.7984710448.7年份2000200120022003200420052006200720082009定期航班旅客周

23、转量/亿客公里11109.510444.810218.410389.611643.712446.912753.813120.51279012570年份2010201120122013定期航班旅客周转量/亿客公里12998.713105.413247.513525.2解题思路:首先首先绘制和观察彩电出口量的序列图, 通过图形观察和检验寻找规律,然后通过指数平滑模型一简单、HOIT线性趋势、Brown线性趋势三个模型进行分析预测,比较选择最佳模型预测 2016年亿客公里数。统计结果:美国亿客公里时间序列图如下:15000000 00-IIMODaKIHI1SfldDOOOOO-KKKIKI.Da-

24、15000000 0Q-年俏神惬-djffarfic(16)-T总E该序列图为平稳序列则可以直接进行建模分析(1)简单指数平滑模型型號說明模型類型模型ID亿客公里模型 1簡單模型統計資料模型預測變數數目模型適合度統計資料Ljung-Box Q(18)離群值數目平穩R平方RMSE統計資料DF顯著性亿客公里-模型10-.417367.91812.51117.0460指數平滑化模型參數模型估計SET顯著性亿客公里-模型 1自然對數Alpha (水準)1.000.1228.175.000瓶溼MF殲譚PACF預測模型201420152016亿客公里-模型_1預測13638.2113752.1613867

25、.06UCL17502.4819474.7921137.62LCL10451.729393.228654.28O 口口口口口口口口 jddod 口口 QanDDI-UD%M-QDUQ 口口口 口1.D 課 JO -05 DJO a.51J9Residual針對每一個模型,預測是在所要求的估計期間範圍內的前次非遺漏開 始,並在其所有預測值的非遺漏值可用的前次期間,或是在所要求的預 測期間的結束日期結束,取較早的時間。(2) HOIT线性趋势指数平滑模型型號說明模型類型模型ID亿客公里模型 1Holt模型統計資料預測變數數模型適合度統計資料Ljung-Box Q(18)離群值數目平穩R平方RMSE統計資料DF顯著性目亿客公里-模型_10.610417.99015.33616.0500flS: ACF1 0101D ODD11 Di 01舷 PACF-ID J05 DDD5IB -1.0-0.5 D.D051.0RvEidul指數平滑化模型參數模型估計SET顯著性亿客公里-模型_1自然對數Alpha (水準).694.1185.893.000Gamm(趨勢).117.0621.895.063預測模型201420152016亿客公里-模型_1預測13940.7814300.6314680.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论