SAS统计分析与应用(第二讲)_第1页
SAS统计分析与应用(第二讲)_第2页
SAS统计分析与应用(第二讲)_第3页
SAS统计分析与应用(第二讲)_第4页
SAS统计分析与应用(第二讲)_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SAS统计软件及其应用

—INSIGHT模块

SAS/INSIGHT简介

SAS/INSIGHT是在基本的SAS系统上添加的一个模块,提供了数据交互输入、数据探索、分布研究、相关分析及各种图形等功能。尤其在数据探索方面有特色。

所谓探索性分析,就是对数据分布情况一无所知情况下,首先通过绘制数据的统计图表,对它的属性有一个大致的了解,然后通过各种统计分析的计算得到较为精确的分布.因为整个过程是从未知到已知,逐步摸索的过程,所以就称为对数据的探索性分析.SAS/NSIGHT启动启动INSIGHT模块有三种方法:1.从菜单启动

2.在命令框内输入Insight3.在程序编辑窗口输入程序,然后Submit.procinsight;run;INSIGHT菜单功能全称交互式数据分析

Interactivedataanalysis启动INSIGHT模块后,打开一个数据集,就可以看到它的窗口界面.编辑菜单分析菜单对于一维数据,怎样用此模块来作直方图,盒形图与马赛克图.例子:德国某城市在一周内的空气污染情况,记录的变量包括时间,一氧化碳含量,臭氧含量,SO2含量,一氧化氮含量,可吸入颗粒,风力等.部分数据见下表.目的:了解SO2的分布情况.例子

一维数据探索

(1)直方图(Histogram)适用于连续数据和离散数据(2)盒形图(BoxPlot)(3)马赛克图(MosaicPlot)

用于比较多个变量的分布

本例目的:想了解SO2分布情况,可绘制直方图.首先打开数据集,选择Analysis菜单下的Histogram/BarChart,弹出对话框:

在左侧变量中选择SO2,然后单击右侧的Y,变量SO2被添加,单击OK,得到直方图设置坐标轴间隔是否显示坐标轴添加指导线显示的观测个数是否显示观测值分组直方图选择分组变量盒形图选择Analysis菜单下的Boxplot.SO2分布情况,有50%的值在2到2.5之间多个盒形图对比男女生语文成绩,分别画出它们的盒形图女生的成绩平均水平高于男生,波动范围小马赛克图使用Boxplot/Mosaicplot命令可以对离散变量做马赛克图.二维数据探索SASINSIGHT可以绘制二维数据的散点图,曲线图,散点图列表散点图可以将两个变量的值以散点的形式在图上表现出来.通过散点图,可以粗略地观察两个变量之间是否有数量关系曲线图以曲线的形式给出两个变量之间的关系可在图中同时画出多条曲线方法:在一条曲线的图形中再用主菜单的Edit-Windows-Renew,添加另一个Y变量即可散点图绘制SO2对时间的散点图,由此来看SO2和时间的关系.首先,在菜单Analysis中选择Scatterplot(Y,X),则弹出对话框结果:每天当中都存在一个峰值散点图矩阵绘制CO,O3,SO2两两之间的散点图.在数据窗口中选定3个变量,然后选择Scatterplot(Y,X)即可.曲线图绘制SO2含量对时间的曲线图.先在菜单中选择LinePlot(Y,X),弹出对话框:周六,日的含量明显低于其他几天三维数据探索通过绘制旋转图,三维曲面图,等高线图来揭示多个变量之间的关系.旋转图,三维的散点图,可旋转.三维曲面图,就是在旋转图中将点拟合为一个曲面.如果预测到一个变量可能由其他两个变量决定,就可以绘制这个变量的响应曲面.等高线图,将地表高度相同的点连成一环线直接投影到平面形成水平曲线,不同高度的环线不会相合.旋转图绘制wind,datatime,dust的三维散点图选择Analysis菜单中的RotatingPlot,弹出对话框立体图象三维曲面图绘制dust对wind,datetime的曲面图

单击选中FitSurface,单击OK.然后单击Method,选择生成曲面的方法,选择Thin-PlateSmoothing.等高线图,使用Analysis菜单中CountorPlot菜单INSIGHT‘分布’功能分布分析可以对数值变量给出分布的讨论.矩统计量分位数统计图:直方图,盒形图曲线拟合密度及分布估计,检验创建分布分析Analysis—>distribution(Y),弹出对话框:盒形图直方图

各阶矩分位数

添加密度估计参数估计:给出各种已知分布,只需对其中的参数进行估计核估计:对密度函数没有作假设,曲线的形状完全依赖数据参数估计选择菜单中的ParametricDensity,弹出对话框:正态分布曲线核估计选择Curves菜单中的KernelDensity,弹出对话框:曲线拟合Analyze中的Fit(YX)多变量回归选择Analysiz菜单下的Fit(YX),将因变量添加到Y,自变量添加到x,单击Apply即可.所谓变量回归,就是研究变量之间相关关系的一种工具.例如:身高与体重的关系;股票价格与流通盘,每股收益,GDP的关系等等.分析结果1.回归的基本模型2.回归的模型方程3.拟合概况4.模型方差分析,检验模型是否成立5.第三类检验,检验变量是否显著6.参数的估计7.残差对预测值的散点图,检验残差是否异常方差分析介绍比较多个总体之间是否存在显著差异。是两独立样本均值检验的自然延续。主要目的:研究某些因素对于指标有无显著影响。对有显著影响的因素,一般希望找出最好的水平(因素的不同取值)。例1:研究三种不同的教学方法的效果;例2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论