SAS数据分析完整笔记_第1页
SAS数据分析完整笔记_第2页
SAS数据分析完整笔记_第3页
SAS数据分析完整笔记_第4页
SAS数据分析完整笔记_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 SAS数据分析完整笔记。收藏2013-08-11ice数据分析数据分析1.SASINSIGHT启动:方法1:SolutiomAnalysisInteractiveDateAnalysis方法2:在命令栏内输入insight方法3:程序编辑窗口输入以下代码,然后单击Submit按钮;Procinsight;Run;一维数据分析用sasinsight做直方图、盒形图、马赛克图。直方图:AnalysisHistogram/BarChart盒形图:AnalysisBoxplot马赛克图:AnalysisBoxplot/Mosaicplot(Y)二维数据分析散点图:AnalysisScatterypl

2、ot(YX)曲线图:AnalysisLineplot(YX)三维数据分析旋转图:AnalysisRotationgPlot曲面图:AnalysisRotationgPlot设置FitSurface等高线图:AnalysisCountorplot分布分析验。包括:直方图、盒形图、各阶矩、分位数表,直方图拟合密度曲线,对特定分布进行检1.4.1AnalysisDistribution(Y)第一部分为盒形图,第二部分为直方图,第三部分为各阶矩,第四部分为分位数表。添加密度估计A:参数估计:给出各种已知分布(正态,指数等),只需要对其中参数进行估计;CurvesParametricDensityB:核

3、估计:对密度函数没有做假设,曲线性状完全依赖于数据;CurvesKernelDensity1.4.3分布检验CurvesCDFconfidencebandCurvesTestforDistribution曲线拟合AnalysisFit(YX):分析两个变量之间的关系多变量回归AnalysisFit(YX)方差分析AnalysisFit(YX)相关系数计算AnalysisMultivariate主成分分析AnalysisMultivariate2.SASANALYST启动:方法1:SolutionAnalysisAnalyst方法2:在命令栏内输入analyst分类计算统计量:DataSumma

4、rizebygroup随机抽样:DataRandomSample生成报表:ReportTables变量计算:DateTransform绘制统计图条形图:GraphBarChartHorizontal饼图:GraphPieChart直方图:GraphHistogram概率图:GraphProbalityplot散点图:GraphScatterplot2.6统计分析与计算2.6.1计算描述性统计量StatisticsDescriptiveSummartStatistics只计算简单统计量StatisticsDescriptiveDistribution可计算一个变量的分布信息StatisticsD

5、escriptiveCorrelations可计算变量之间的相关关系StatisticsDescriptiveFrequencycounts可计算频数列联表分析StatisticsTableAnalysis2.7假设检验2.7.1单样本均值Z检验:检验单样本均值与某个给定的数值之间的关系StatisticsHypothesistestsOne-SampleZ-testforamean2.7.2单样本均值t检验:适用于不了解变量的方差情形推断该样本来自的总体均数卩与已知的某一总体均属卩0是否相等StatisticsHypothesistestsOne-Samplet-testforamean2.

6、7.3单样本比例检验:检验取离散值的变量取某个值的比例StatisticsHypothesistestsOne-Sampletestforaproportion2.7.4单样本方差检验:检验样本方差是否等于给定的值。零假设方差等于某个给定的StatisticsHypothesistestsOne-Sampletestforavariance2.7.5两样本均值t检验:独立的两个总体的均值是否相等或者是否相差给定的值StatisticsHypothesistestsTwo-Samplet-testformeans2.7.6成对样本均值t检验:成对样本检验中总体是相关的。StatisticsHyp

7、othesistestsTwo-Samplepairedt-testformeans两样本比例检验:检验两个总体中某个比例的值是否相等。StatisticsHypothesistestsTwo-Sampletestforproportions两样本方差检验StatisticsHypothesistestsTwoSampletestforvariance2.8ANOVA过程2.8.1单因素ANOVA过程StatisticsANOVAOne-WayAnova2.8.2非参数的单因素方差分析:适用于正态分布假定或方差相等假设不能满足的单因素问题StatisticsANOVAnonparametero

8、ne-wayAnovatestWilcoxon法、Median法、VanderWaerden法、Savage法。2.8.2因素方差分析:实验结果是连续数值而分类变量是两个以上的离散型数值。StatisticsANOVAFactorialAnova2.8.3线性模型:用最小二乘法拟合一般线性模型StatisticsANOVALinearModel2.9回归分析:StatisticsRegression2.9.1simple回归:简单一类回归分析,单一的自变量,单一的因变量,模型可以是一次、二次、三次。StatisticsRegressionsimple2.9.21inear回归:线性回归,回归模

9、型可以有多个因变量,多个自变量,但是对因变量分别进行回归StatisticsRegressionlinear2.9.3logistic回归:用于解决因变量是一个二元变量StatisticsRegressionlogistic3.报表以及图形输出3.1print过程Procprintdata=sasuser.score;/数据库.数据集Run;Procprintdata=sasuser.score;VarnamemathChinese;/变量Run;Procprintdata=sasuser.scorenoobs;/去掉第一列(观测序号)VarnamemathChinese;Run;Procpr

10、intdata=sasuser.score;Wheresexin(F);/通过where语句Run;Procprintdata=sasuser.scorenoobslabel;Title女生成绩单;Labelname=姓名Sex=性别,Math=数学,Chinese=语文,English=英语飞Wheresexin(f5);Run;Title“thesassystem”;/恢复系统标题Procprintdata=sasuser.score;Footnote=分数列表5;/加分数列表的脚注Run;Procsortdata=sasuser.score;Bysex;Run;Procprintdata

11、=sasuser.score;/使用by分组输出前用sort排序Bysex;Run;Procprintdata=sasuser.score;Summath;Run;tabulate过程Proctabulatedata=数据集名称;Class分类变量;Var分析变量;Table页面说明行维说明列维说明/选项Run;sort过程Procsortdata=数据集名称;/默认升序排列By变量名;Run;Procsortdata=数据集名称;Bydescending变量名;/降序排列Run;means过程:数量(N)、均值(Mean)、标准差(StdDev)、最大值(Maximum)、最小值(Minim

12、um)Procmeansdata=sasuser.stock;Varprice;Run;univariate过程Procunivariatedata=数据集;Var分析变量;Run;结果:Moments:统计量的各阶矩,例如一阶矩就是均值,二阶矩就是方差等;BasicStatisticalMeasures:基本统计量;Testsforlocation:检验均值是否为零;Quantiles:分位数表;ExtremeObservations:极端观测值。3.6freq过程:离散变量的分布情况Procfreqdata=数据集名;Tables变量名;Run;结果:变量取值、频数、百分比、累计频数、;累

13、计百分比3.7corr过程:相关系数Proccorrdata=数据集;Var变量名变量名;Run;结果:简单统计量相关系数及p值gplot过程:绘制散点图和曲线图,绘制回归曲线。Procgplotdata=数据集名称;Symbol曲线类型;Plot竖轴变量*横轴变量;Run;Procgplotdata=sasuser.score;SymbolI=nonev=star;PlotEnglish*Chinese;Run;gchart过程:绘制直方图、饼图、三维直方图等。Procgchartdata=数据集名称;Vbar/pie/block=变量;Run;3.10G3D过程绘制三维曲面Procg3dd

14、ata=数据集;Plot变量x*变量y=变量z;Run;gcontour过程:画出曲面的等高线Procgcontourdata=数据集名;Plotx*y=z;Run;4.基本统计分析4.1正态性检验:univariate过程Procunivariatedata=sasuser.stocknormal;Vareps;Run;Procunivariatedata=sasuser.stocknormal;Vareps;Histogrameps;/画出直方图Probploteps;/画出概率分布图Run;4.2单变量均值检验4.2.1如果一个变量服从正态分布,那么可以用t检验来对变量进行均值检验Pro

15、cttestdata=数据集ho=均值;Var检验变量;Run;4.2.2t检验还可以检验方差相同的两个独立样本均值是否相等Procttestdata=数据集;Class分类变量;Var检验变量;Run;结果第一部分简单统计量第二部分t检验结果第三部分两者方差是否相等检验T检验要求两个独立样本都必须服从正态分布,如果不服从正态分布,则无法进行t检验。这时可用非参数的方法,常用的非参数方法是NPAR1WAY过程,它是noparameter1way缩写。4.3成对总体均值检验4.4回归分析:reg(回归)过程、rsreg(二次响应面回归)过程、orthoreg(病态数据回归)过程、nlin(非线性

16、回归)过程、transreg(变换回归)过程、calis(线性结果方程和路径分析)过程、glm(一般线性回归)过程、genmod(广义线性回归)过程REG过程Procregdata=输入数据集选项;Var变量列表;Model因变量=自变量列表;Print输出结果;Plot诊断图形;Run;nlin过程指明模型的表达式并给定系数初值4.4.3glm过程:使用最小二乘法回归线性模型,还可以进行回归,分差,协方差,多变量方差、偏相关系数分析方差分析4.5.1单因素方差分析Procanovadata=数据集名称;Class因素;Model实验结果=因素;Run;Procanovadata=数据集名称;Class因素;Model实验结果=因素;Meansbrand;Run;Procanovadata=数据集名称;Class因素;Model实验结果=因素;Meansbrand/t;/t检验Run;Procanovadata=数据集名称;Class因素;Model实验结果=因素;Meansbrand/bon;/bonferronit检验控制第一类错误的概率,但是具有较大第二类错误概率Run;Procanovadata=数据集名称;Class因素;Model

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论