《环境数据统计分析基础》_第1页
《环境数据统计分析基础》_第2页
《环境数据统计分析基础》_第3页
《环境数据统计分析基础》_第4页
《环境数据统计分析基础》_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

作业一1.《环境数据统计分析基础》P33,以例2-3的数据,分析是否存在异常值,若有,请列出。第一步:打开数据(例2-3)→【分析】→【描述分析】→【探索】第二步:选择标签值(因变量列表:铅含量;标注个案:编号)第三步:选择输出的描述性统计量第四步:结果输出个案处理摘要个案有效缺失总计数字百分比数字百分比数字百分比铅含量/(mg/L)12100.0%00.0%12100.0%描述性统计标准错误铅含量/(mg/L)平均值65.6171.8870平均值的95%置信区间下限值61.463上限69.7705%截尾平均值65.702中位数65.600方差42.729标准偏差6.5367最小值50.2最大值(X)79.5范围29.3四分位距4.5偏度-.370.637峰度4.0781.232M估计量休伯M估计量aTukey双权b汉佩尔M估计量c安德鲁波d铅含量/(mg/L)65.62265.67365.75565.673a.加权常量为1.339。b.加权常量为4.685。c.加权常量为1.700、3.400和8.500d.加权常量为1.340*pi。常态性检验Kolmogorov-Smirnov(K)aShapiro-Wilk统计df显著性统计df显著性铅含量/(mg/L).25612.029.84712.034a.Lilliefors显著性校正铅含量/(mg/L)Stem-and-LeafPlotFrequencyStem&Leaf1.00Extremes(=<50)2.006.233.006.4453.006.6662.006.891.00Extremes(>=80)Stemwidth:10.0Eachleaf:1case(s)结果分析:由实验结果中的箱图可看出,例2-3的数据中存在两个异常值,分别是第7组铅含量为50.2和第10组铅含量是79.5.2.《环境数据统计分析基础》P40,例2-7。第一步:【分析】→【比较均值】→【单样本T检验】第二步:选择标签值(检验变量:酚的浓度)检验值为0.030第三步:【选项】→置信区百分比为95%第四步:输出结果单样本统计数字平均值(E)标准偏差标准误差平均值酚的浓度(mg/L)20.02800.003598.000805单样本检验检验值=0.030t自由度显著性(双尾)平均差差值的95%置信区间下限上限酚的浓度(mg/L)-2.48619.022-.002000-.00368-.00032由实验结果可知,P=0.022,即P<0.05,说明在0.05的显著性水平下,该断面酚的平均污染水平与检验值0.03有显著性差异。作业二1.《环境数据统计分析基础》例2-8,请在问噪声水平从50增加到55时,该10个居民的睡眠时数是否发生了显著变化第一步:SPSS数据准备→【分析】→【比较均值】→【独立样本T检验】第二步:选择标签值(检验变量:睡眠时间;分组变量:分组)→【定义组】第三步:【选项】→置信区间百分百:95%第四步:结果输出组统计组别数字平均值(E)标准偏差标准误差平均值睡眠时间X106.700.8420.2662Y106.820.7300.2308独立样本检验列文方差相等性检验平均值相等性的t检验F显著性t自由度显著性(双尾)平均差标准误差差值差值的95%置信区间下限上限睡眠时间已假设方差齐性.130.722-.34118.737-.1200.3524-.8603.6203未假设方差齐性-.34117.646.737-.1200.3524-.8614.6214由实验结果可知,列文分差相等性检验未通过方差齐次性检验,故分析平均值相等的T检验,P=0.737,即P>0.05,说明噪声水平从50增加到55时,该10个居民的睡眠时数没有发生显著变化。作业三1.《环境数据统计分析基础》例3-1,要求用不同的大/小写字母标注结果的差异性第一步:SPSS数据准备→【分析】→【比较均值】→【单因素ANOVA】第二步:选择标签值(因变量列表;铜元素含量;因子:操作序号)第三步:【事后多重比较】→选择LSD→显著性水平为0.05第四步:【选项】→勾选“描述性”和“方差同质性检验”第五步:结果输出方差同质性检验铜元素含量Levene统计df1df2显著性.431336.732ANOVA铜元素含量平方和df均方F显著性组之间14.86134.9548.440.000组内21.13036.587总计35.99139多重比较因变量:铜元素含量LSD(L)(I)操作序号(J)操作序号平均差(I-J)标准错误显著性95%置信区间下限值上限12.9900*.3426.006.2951.6853-.7100*.3426.045-1.405-.0154-.1000.3426.772-.795.59521-.9900*.3426.006-1.685-.2953-1.7000*.3426.000-2.395-1.0054-1.0900*.3426.003-1.785-.39531.7100*.3426.045.0151.40521.7000*.3426.0001.0052.3954.6100.3426.083-.0851.30541.1000.3426.772-.595.79521.0900*.3426.003.3951.7853-.6100.3426.083-1.305.085*.均值差的显著性水平为0.05。描述性铜元素含量N平均值标准偏差标准错误平均值95%置信区间最小值最大值下限值上限11022.260.8044.254421.68522.83521.223.521021.270.7454.235720.73721.80320.222.731022.970.8858.280122.33623.60421.224.041022.360.6004.189921.93122.78921.623.2总计4022.215.9606.151921.90822.52220.224.0结果分析:测定人员1234铜元素含量22.26±0.8044bA21.27±0.7454cB22.97±0.8858aA20.36±0.6004abA作业四以“偏相关分析”例题中的数据,分析降水对径流量的影响。第一步:SPSS数据准备→【分析】→【相关】→【偏相关】第二步:选择标签值(变量:月平均径流量和月平均雨量;控制:月平均气温)第三步:【选项】→勾选如下所示第四步:结果输出描述统计平均值标准偏差N月平均径流量1.9582.085212月平均雨量1.2921.126112月平均气温3.3259.594812相关性控制变量月平均径流量月平均雨量月平均气温-无-a月平均径流量相关性1.000.855.835显著性(双侧)..000.001df01010月平均雨量相关性.8551.000.867显著性(双侧).000..000df10010月平均气温相关性.835.8671.000显著性(双侧).001.000.df10100月平均气温月平均径流量相关性1.000.479显著性(双侧)..136df09月平均雨量相关性.4791.000显著性(双侧).136.df90a.单元格包含零阶(Pearson)相关。由实验结果可知,P<0.01,说明在不剔除气温因素的影响下,月平均雨量与月平均径流量极显著相关,R2=0.855,说明有很强的正相关关系。控制变量为月平均气温时,P>0.05,说明在剔除气温因素的影响下,月平均雨量与月平均径流量无显著相关关系。作业五1.《环境数据统计分析基础》例4-1第一步:SPSS数据准备→【分析】→【线性】第二步:选择标签值第三步:【统计量】→勾选如下图所示第三步:结果输出模型摘要模型RR平方调整后的R平方标准估算的错误更改统计量R方变化F更改df1df2显著性F更改1.998a.996.996.563.9962140.94718.000a.预测变量:(常量),温度ANOVAa模型平方和自由度均方F显著性1回归677.9671677.9672140.947.000b残差2.5338.317总计680.5009a.因变量:污染物浓度b.预测变量:(常量),温度系数a模型非标准化系数标准系数t显著性B标准错误贝塔1(常量)16.800.85519.647.000温度.573.012.99846.270.000a.因变量:污染物浓度由实验结果可知,回归系数B=0.573,截距(常数)=16.8,所以排除污染物的温度与浓度之间的回归方程为:y=16.8+0.573x2.《环境数据统计分析基础》例4-2第一步:SPSS数据准备→【分析】→【曲线估计】第二步:选择标签值→勾选所需要的模型第三步:【保持】→勾选预测值和残差第四步:结果输出模型描述模型名称MOD_1因变量1Y方程式1线性(L)2对数3逆模型(N)4二次项(Q)5立方(U)6Sa7增长(H)a8指数分布a自变量X常量已包括值在绘图中标记观测值的变量未指定对在方程式中输入项的容许.0001a.此模型需要所有非缺失值为正。模型摘要和参数估算因变量:Y方程式模型摘要参数估计值R平方Fdf1df2显著性常量b1b2b3线性(L) .79527.16217.001.032-.004对数a.......逆模型(N)b.......二次项(Q).92235.62726.000.035-.009.001立方(U).93423.67535.002.036-.013.003.000Sb.......增长(H).85140.12917.000-3.443-.183指数分布.85140.12917.000.032-.183自变量为X。a.自变量(X)包含了非正值。最小值为.0。无法计算对数和幂模型。b.自变量(X)包含了零值。无法计算逆模型和S模型。由实验结果可知,线性:y=0.032-0.004x二次:y=0.035-0.009x+0.001x2立方:y=0.036-0.013x+0.003x2+0.000x3增长:y=EXP(-3.443-0.183x)指数:y=0.032EXP(-0.183x)由上图知,最优的是立方:y=0.036-0.013x+0.003x2+0.000x3作业五数据见图,将数据中的城市按照空气质量,用两种方法进行分类,并回答以下问题:用K-均值聚类方法分为5类时,和西安一类的城市有哪些?空气质量和成都最接近的城市是哪个?分为4类时,和昆明同一类的城市有哪些?第一步:【分析】→【描述统计】→将各指标导入变量对话框→将各变量进行标准化处理后得到变量(Z)→确定第二步:【分析】→【聚类】→K-均值聚类第三步:选择各标签值→聚类数输入5第四步:迭代(Iterate)→收敛标准0.02→继续第五步:保存→勾选其中两项→继续

第六步:选项→按对排除个案(P)→继续→确定第七步:结果输出描述统计数字最小值(M)最大值(X)平均值(E)标准偏差颗粒物14.033.172.10857.038644二氧化硫14.0030.1130.058643.0312696二氧化碳14.013.073.03936.017064天3654.257有效N(成列)14初始聚类中心聚类12345Zscore(颗粒物).86504.47688-.24768-.66172-1.95559Zscore(二氧化硫)1.73834-1.10788.587061.13072-1.65154Zscore(二氧化碳)1.61998-.724181.97160-.89999-1.54463Zscore(天数)-.98342-.30148.14086.749091.28358迭代历史记录a迭代聚类中心的更改1234511.406.929.779.815.3352.000.000.000.000.000a.由于聚类中心无更改或只有小的更改,因此达到了汇合。任何中心的最大绝对坐标更改为.000。当前迭代为2。初始中心之间的最小距离是1.988。最终聚类中心聚类12345Zscore(颗粒物)1.10657.56098-.04066-.68760-1.70976Zscore(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论