用SAS作统计分析课件_第1页
用SAS作统计分析课件_第2页
用SAS作统计分析课件_第3页
用SAS作统计分析课件_第4页
用SAS作统计分析课件_第5页
已阅读5页,还剩171页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

用SAS作统计分析SASInstitute(Shanghai)Co.,Ltd.基本概念和方法浏览1用SAS作统计分析SASInstitute(Shangh统计的作用对数据作出概要的描述基于数据作出推断

(包括评价推断的有效性)2统计的作用对数据作出概要的描述2SAS系统提供有力的统计分析

功能BaseSAS和

SAS/GRAPH

包含常规的

分析功能SAS有专用于各种分析功能的模块STAT,QC,ETS,ORINSIGHT,LAB,ASSISTIMLSAS将其分析功能与其数据管理功能结

合成强大的决策支持系统3SAS系统提供有力的统计分析

功能BaseSAS和SASAS分析的特点SAS将常用的统计方法用程序实现,是

一个高品位的程序系统SAS是一个迅速发展的系统:融入最新

的方法,不断适应用户的新需求SAS既可由编程也可用图形界面交互式

地实现分析功能SAS将各种专门分析方法融入为用户提

供的直接使用的专用系统中4SAS分析的特点SAS将常用的统计方法用程序实现,是

一个了解学习SAS的分析决策功能会找:针对问题和数据选用合适的

分析工具会用:选PROC,选Option,

写Statement会解释:对SAS提供的计算结果给出

解释和分析5了解学习SAS的分析决策功能会找:针对问题和数据选用合适的总体(母体Population)关心的对象全体关心对象的某些指标(Variable)

Var1,Var2,...,Varn总体的分布:这些变量取什麽值,

各占多大比例总体的分布的特征:均值,方差(及其他

参数)抽样6总体(母体Population)关心的对象全体6样本(子样Sample)样本:取自总体的若干(有代表性)的个体计算统计量7样本(子样Sample)样本:取自总体的若干(有代表性)统计量(Statistics)子样总体

描述推断统计量--由样本运算而得到的量:均值,方差中位数,极差直方图,经验分布统计量能集中样本某一方面的信息8统计量(Statistics)子样统计模型

母体(分布及其它特征)抽样子样(分布及其它特征)计算统计量统计量描述推断9统计模型母体(分布及其它特征)抽样子样(分布及其它特征)计算统计模型参数是总体的特征。统计量是由样本观测值计算而得到的。统计量可用于估计总体的参数。10统计模型参数是总体的特征。10抽样的随机性总体子样子样子样子样子样对同一个总体可以获得多个不同的样本这些样本的观测值不全相同,相应的统计

量也不一样,这是由抽样偶然性引起的但当样本的容量增大时,不同样本间的差

异逐渐缩小,这是统计的规律性11抽样的随机性总体子样子样子样子样子样对同一个总体可以获抽样的随机性12rannor2,原数据rannor1抽样的随机性12rannor2,原数据rannor1抽样的随机性13抽样的随机性13抽样的随机性14抽样的随机性14抽样的随机性15抽样的随机性15抽样的随机性16抽样的随机性16抽样的随机性17抽样的随机性17用SAS作常规统计

的几种常用做法用SAS作常规统计分析,在交互式运行方

式下常用的做法有:用编程实现各种任务用SAS提供的菜单系统实现各种任务

用SAS/ASSIST

用STATISTICALANALYST

发命令analyst

用SAS/INSIGHT发命令insight18用SAS作常规统计

的几种常用做法用SAS作常规统计分析,在SAS/INSIGHT是一个可视化的数据探索工具。将统计

方法与交互式地图形显示融合在一起随时为用户提供数据、图形和分析结果

三方面的内容,便于用户发现奇异数据

及包含在数据中的模式或规律,探索性

地使用各种统计分析方法并观察分析结

果。它为用户提供一种全新的使用统计

分析方法的环境。19SAS/INSIGHT是一个可视化的数据探索工具。将统计

方SAS/INSIGHT如何在SAS系统中进入SAS/INSIGHT

键入命令INSIGHT

用下拉菜单

Globals

Analyze

Interactivedataanalysis

通过

SAS/ASSIST

或提交

Procinsight

20SAS/INSIGHT如何在SAS系统中进入SAS/INSISAS/INSIGHT在SAS/INSIGHT中,变量按其测量水平分

为:

区间型的(Interval)

列名型的(Nominal)以连续变化尺度测量具有可进行分析的数值有数值或字符值用于作分类变量数值型

字符型区间型列名型21SAS/INSIGHT在SAS/INSIGHT中,变量按其测SAS/INSIGHT

对数据集的操作在SAS/INSIGHT中,可对SAS数据集进行 数据输入和浏览 修改测量水平 移动变量显示次序 建立新的变量 按某个变量的值进行排序 选取子集22SAS/INSIGHT

对数据集的操作在SAS/INSIGHAnalystApplication分析员应用(AnalystApplication)是在SAS系统中进行基本统计分析菜单界面系统它将常用的统计方法按描述统计,表分析,假设检验,方差分析和回归分析等栏目提供菜单,也有制图和建表的功能菜单它对所进行的每项分析都提供按菜单设定的要求自动生成的程序它对分析的过程和结果建立项目并进行管理23AnalystApplication分析员应用(AnalyAnalystApplication在SAS中进入Analyst: 键入命令ANALYST 用下拉菜单Globals

Analyze

StatisticalAnalysis24AnalystApplication在SAS中进入AnalAnalystApplication在Analyst中,可对SAS数据集进行 数据输入和浏览 移动变量显示次序

建立新的变量 按某个变量的值进行排序 选取子集

转置数据集25AnalystApplication在Analyst中,可变量取值的宏观描述分布全面地描述了变量取值的概况

分布:变量取什麽值,各占多少比例字符型变量:用表列举其取值和比例或用

柱状图,拼花图(Mosaic)26变量取值的宏观描述分布全面地描述了变量取值的概况

分布:变量变量取值的宏观描述连续变化数值型变量:用表列举其在各个

范围取值的比例,用直方图,Box图或

次序统计量、经验分布图27变量取值的宏观描述连续变化数值型变量:用表列举其在各个

范围SAS/INSIGHT

数据取值频数的描述柱状图与直方图(Barchart/Histogram)AnalyzeHistogram/Barchart(Y)频数表AnalyzeDistribution(Y)OutputFrequencyTable28SAS/INSIGHT

数据取值频数的描述柱状图与直方图(Analyst

数据取值频数的描述StatisticsDescriptive

FrequencyCounts制作直方图29Analyst

数据取值频数的描述Statistics变量取值特征的描述运用各种统计量描述变量取值的不同特征均值、中位数描述变量取值的中心位置方差、极差描述变量取值的离散程度次序统计量也可描述变量取值的分布30变量取值特征的描述运用各种统计量描述变量取值的不同特征30次序统计量样本(Sample):次序统计量(OrderStatistics):4,3,11,3,15,81,3,3,4,5,8,1131次序统计量样本(Sample):次序统计量(OrderSt描述数据中心位置的统计量样本观测值:4,3,11,3,1,5,832描述数据中心位置的统计量样本观测值:4,3,11,3,描述数据离散程度的统计量33描述数据离散程度的统计量33描述数据离散程度的统计量样本观测值:4,3,11,3,1,5,8

34描述数据离散程度的统计量样本观测值:4,3,11,3,与均值方差有关的统计量标准差(StdDev):标准误(StdError):变异系数(CV)未校平方和(USS)校正平方和(CSS)35与均值方差有关的统计量标准差(StdDev):标准误(St偏度(Skewness)偏度:(Skewness)精确地<0>0=036偏度(Skewness)偏度:精确地<0>0=036峰度(Kurtosis)峰度:(Kurtosis)精确地<0=0>0>0<037峰度(Kurtosis)峰度:精确地<0=0>0>0分位数(Quantile)(0.4分位数)38分位数(Quantile)(0.4分位数)38分位数(Quantile)p分位数:附近的一个数(小于p-分位点的样本数约占样本总数的100p%)0.5-分位数即中位数0.25-分位数称下四分位数0.75-分位数称上四分位数样本观测值:4,3,11,3,1,5,8(1,3,3,4,5,8,11)43839分位数(Quantile)p分位数:附近的一个数(小于p-分SAS/INSIGHT

数据的图形描述-盒须图40SAS/INSIGHT

数据的图形描述-盒须图40SAS/INSIGHT与Analyst

生成描述统计量

Insight生成描述性统计量:Analyze

Distribution(Y)Analyst生成描述性统计量:StatisticsDescriptiveSummaryStatistics…或Distributions…

41SAS/INSIGHT与Analyst

生成描述统计量Ins变量取值的宏观描述对母体和样本都可考虑它们各自的分布样本直方图总体分布密度样本经验分布总体累计分布42变量取值的宏观描述对母体和样本都可考虑它们各自的分布样本直方中心极限定理43中心极限定理43标准正态分布密度44标准正态分布密度44对数正态分布45对数正态分布45Weibull分布46Weibull分布46SAS/INSIGHT

分布拟合直方图(Graphs)+拟合分布密度(Curves)经验分布(Curves)+拟合累计分布(Curves)QQ图(Graphs)+参照线(Curves)非正态参数分布的拟合:Curves+ParametricDensity非参数分布密度拟合:

Curves+Kernel由AnalyzeDistribution(Y)进入后:47SAS/INSIGHT

分布拟合直方图(Graphs)+拟合Q-Q图

48Q-Q图48Analyst

直方图与分布拟合StatisticsDescriptiveDistributions...拟合49Analyst

直方图与分布拟合StatisticsD方差分析(AnalysisofVariance)对多个均值进行统计推断通常使用方差分析方差分析是分析试验结果数据的重要方法50方差分析(AnalysisofVariance)对多个均方差分析(AnalysisofVariance)在方差分析中:

连续应变量:记录在各种条件下的观测结果 若干个分类变量:设定观测条件(也称独立变量)

分类变量可表示固定效因或随机效因

分类变量的不同值又称为水平51方差分析(AnalysisofVariance)在方差分方差分析(ANOVA)方差分析将观测到的应变量的变差分解为属

于不同分类变量的和随机误差进行分析52方差分析(ANOVA)方差分析将观测到的应变量的变差分解为属方差分析(ANOVA)

53方差分析(ANOVA)53方差分析(ANOVA)自由度分解方差分解或(效因模型、线性模型)单分类数据的分析(均值模型)54方差分析(ANOVA)自由度分解方差分解或(效因模型、线性模方差分析(ANOVA)方差分解与检验

TotalSS=SS(因素A)+ResidualSSTotalDF=DF(A)+ResidualDFMS(.)=SS(.)/DF(.)F(.)=MS(.)/ResidualMS

55方差分析(ANOVA)方差分解与检验

Total方差分析

数据要求使用SAS进行方差分析时要求每条记录为一次观测的结果。不同因素或水平下因变量的观测值都记用同一个变量表示不合适合适56方差分析

数据要求使用SAS进行方差分析时要不合适合适56方差分析

SAS/INSIGHT单因素方差分析图形表现:

AnalysisBoxplot

Y:区间型因变量,X:列名型独立变量方差分析计算:

AnalysisFit(X,Y)

Y:区间型因变量,X:列名型独立变量57方差分析

SAS/INSIGHT单因素方差分析图形表现:方差方差分析

AnalystStatisticsANOVAOne-wayANOVAFactorialANOVALinearModels58方差分析

AnalystStatisticsANOVA变量的相关关系散点图是直观地观察连续变化变量间相依

关系的重要工具Insight:AnalyzeScatterplot(YX)或Multivariate(Y's)编程:procgplotAnalyst:GraphsScatterplot59变量的相关关系散点图是直观地观察连续变化变量间相依

关系的重变量的相关关系用直线描述用曲线描述可能有周期变化无明显关系60变量的相关关系用直线描述用曲线描述可能有周期变化无明显关系6相关系数(CorrelationCoef.)线性联系是描述变量联系中最简单和最常

用的一种(Y=a1x1+a2x2+b)相关系数是描述两个变量间线性联系程度

的统计指标相关系数的计算公式:61相关系数(CorrelationCoef.)线性联系是描述相关系数(CorrelationCoef.)正相关:一个变量数值增加时另一个变量也增加负相关:一个变量数值增加时另一个变量减少62相关系数(CorrelationCoef.)正相关:负相关相关系数(CorrelationCoef.)强相关并不表示存在因果关系弱相关并不表示变量间不存在关系个别极端数据可能影响相关系数63相关系数(CorrelationCoef.)强相关并不表示相关系数的计算

SAS/INSIGHT

AnalyzeMultivariate(Y's)

OutputCorr在多变量分析窗中,由下拉菜单TablesCorr在散点图上加置信椭圆认识相关大小CurvesConfidenceEllipse

Prediction:...64相关系数的计算

SAS/INSIGHTAnalyzeM相关系数的计算

AnalystStatisticsDescriptiveCorrelations65相关系数的计算

AnalystStatisticsDe相关与回归相关分析量化连续变化变量间线性相

关的强度回归分析确定一个连续变量与另一些

连续变量间的关系66相关与回归相关分析量化连续变化变量间线性相

关的强度66回归(Regression)描述一个变量与另一些变量间统计联系的关系式,Y=f(x1,x2,...,xm),用于解释和预测。确定回归: 确定变量:Y与那些x1,x2,..,xm有关 选择形式:Y与x1,x2,..,xm以什麽形式

相联系,即f的表示式 确定系数:确定Y=a1x1+a2x1x2+a3x12+...

中的ai

67回归(Regression)描述一个变量与另一些变量间统计联回归的简单线性模型Yi=b0+b1xi+ei

i=1,2,...,n

Yi:因变量的第i次观测值

xi:自变量的第i次观测值

b0,b1:待估计的未知参数

ei:

余差(residual相互独立,正态分布,零均值,同方差)一般的:Yi=b0+b1x1i+b2x2i+...+bpxpi+ei

68回归的简单线性模型Yi=b0+b1xi+ei回归的简单线性模型69回归的简单线性模型69回归的简单线性模型70回归的简单线性模型70线性回归的拟合71线性回归的拟合71最小二乘法估计(LSE)72最小二乘法估计(LSE)72回归的方差分解总变异回归阐明部分回归未阐明部分73回归的方差分解总变异回归阐明部分回归未阐明部分73回归的方差分解.....74回归的方差分解.....74回归的方差分解

75回归的方差分解75回归的假设检验原假设:简单线性模型拟合数据不比基线

模型好

b1=0,

r=0,|b1|小,SS(Model)小备选假设:简单线性模型拟合数据比基线

模型好

b10,

r0,|b1|不为零,SS(Model)大76回归的假设检验原假设:简单线性模型拟合数据不比基线

模型好7

7777预测值与置信限

78预测值与置信限78回归分析计算

AnalystAnalyst:Statistics

Regression

Simple...79回归分析计算

AnalystAnalyst:Statist变量的测量水平

名义型(Nominal)变量的值之间无逻辑次序可按任何次序排序编码变量:饮料的种类80变量的测量水平

名义型(Nominal)变量的值之间无逻辑变量的测量水平

有序型的

(Ordinal)变量:饮料杯的型号小中大有序变量的值有明确的逻辑次序,但各

个值之间的距离并不清楚81变量的测量水平

有序型的(Ordinal)变量:饮料杯的型变量的测量水平

连续型的

(Continuous)变量:饮料的体积连续型变量的值有逻辑次序,且它们之间的距离也是有意义的82变量的测量水平

连续型的(Continuous)变量:饮料变量的类型

属性的与连续的属性变量是指其测量结果只能取到较少的不同的值,通常用以表示对象的分类属性。与属性变量对立的是连续性变量名义型的、有序的和连续型变量当它们可能取到的数值较少时,可作为属性变量处理83变量的类型

属性的与连续的属性变量是指其测量结果只能取到较少属性变量取值的频数统计对属性变量最基本的统计特征就是它可能取到的不同数值和取各个不同数值的概率(频率)84属性变量取值的频数统计对属性变量最基本的统计特征就是它可能取属性变量取值的频数统计Insight:Distribution(Y)FrequencyTableAnalyst:StatisticsDescriptive…FrequencyCount...编程:

PROCFREQDATA=数据集名;

TABLES变量;

RUN;85属性变量取值的频数统计Insight:Distributi属性变量取值的频数统计涉及多个属性变量时,为了了解变量之间的关联信息,必须得到各个变量取值不同组合下的频数和百分率。以列联表(交叉表)表示86属性变量取值的频数统计涉及多个属性变量时,为了了解变量之间的属性变量取值的频数统计Analyst:StatisticsTableAnalysis行分类变量列分类变量分层变量单元记数变量87属性变量取值的频数统计Analyst:Statistics属性变量取值的频数统计分类变量排序依据关联统计量设定单元格显示内容分组变量设定要求表格88属性变量取值的频数统计分类变量排序依据关联统计量设定单元格显用SAS作统计分析SASInstitute(Shanghai)Co.,Ltd.基本概念和方法浏览89用SAS作统计分析SASInstitute(Shangh统计的作用对数据作出概要的描述基于数据作出推断

(包括评价推断的有效性)90统计的作用对数据作出概要的描述2SAS系统提供有力的统计分析

功能BaseSAS和

SAS/GRAPH

包含常规的

分析功能SAS有专用于各种分析功能的模块STAT,QC,ETS,ORINSIGHT,LAB,ASSISTIMLSAS将其分析功能与其数据管理功能结

合成强大的决策支持系统91SAS系统提供有力的统计分析

功能BaseSAS和SASAS分析的特点SAS将常用的统计方法用程序实现,是

一个高品位的程序系统SAS是一个迅速发展的系统:融入最新

的方法,不断适应用户的新需求SAS既可由编程也可用图形界面交互式

地实现分析功能SAS将各种专门分析方法融入为用户提

供的直接使用的专用系统中92SAS分析的特点SAS将常用的统计方法用程序实现,是

一个了解学习SAS的分析决策功能会找:针对问题和数据选用合适的

分析工具会用:选PROC,选Option,

写Statement会解释:对SAS提供的计算结果给出

解释和分析93了解学习SAS的分析决策功能会找:针对问题和数据选用合适的总体(母体Population)关心的对象全体关心对象的某些指标(Variable)

Var1,Var2,...,Varn总体的分布:这些变量取什麽值,

各占多大比例总体的分布的特征:均值,方差(及其他

参数)抽样94总体(母体Population)关心的对象全体6样本(子样Sample)样本:取自总体的若干(有代表性)的个体计算统计量95样本(子样Sample)样本:取自总体的若干(有代表性)统计量(Statistics)子样总体

描述推断统计量--由样本运算而得到的量:均值,方差中位数,极差直方图,经验分布统计量能集中样本某一方面的信息96统计量(Statistics)子样统计模型

母体(分布及其它特征)抽样子样(分布及其它特征)计算统计量统计量描述推断97统计模型母体(分布及其它特征)抽样子样(分布及其它特征)计算统计模型参数是总体的特征。统计量是由样本观测值计算而得到的。统计量可用于估计总体的参数。98统计模型参数是总体的特征。10抽样的随机性总体子样子样子样子样子样对同一个总体可以获得多个不同的样本这些样本的观测值不全相同,相应的统计

量也不一样,这是由抽样偶然性引起的但当样本的容量增大时,不同样本间的差

异逐渐缩小,这是统计的规律性99抽样的随机性总体子样子样子样子样子样对同一个总体可以获抽样的随机性100rannor2,原数据rannor1抽样的随机性12rannor2,原数据rannor1抽样的随机性101抽样的随机性13抽样的随机性102抽样的随机性14抽样的随机性103抽样的随机性15抽样的随机性104抽样的随机性16抽样的随机性105抽样的随机性17用SAS作常规统计

的几种常用做法用SAS作常规统计分析,在交互式运行方

式下常用的做法有:用编程实现各种任务用SAS提供的菜单系统实现各种任务

用SAS/ASSIST

用STATISTICALANALYST

发命令analyst

用SAS/INSIGHT发命令insight106用SAS作常规统计

的几种常用做法用SAS作常规统计分析,在SAS/INSIGHT是一个可视化的数据探索工具。将统计

方法与交互式地图形显示融合在一起随时为用户提供数据、图形和分析结果

三方面的内容,便于用户发现奇异数据

及包含在数据中的模式或规律,探索性

地使用各种统计分析方法并观察分析结

果。它为用户提供一种全新的使用统计

分析方法的环境。107SAS/INSIGHT是一个可视化的数据探索工具。将统计

方SAS/INSIGHT如何在SAS系统中进入SAS/INSIGHT

键入命令INSIGHT

用下拉菜单

Globals

Analyze

Interactivedataanalysis

通过

SAS/ASSIST

或提交

Procinsight

108SAS/INSIGHT如何在SAS系统中进入SAS/INSISAS/INSIGHT在SAS/INSIGHT中,变量按其测量水平分

为:

区间型的(Interval)

列名型的(Nominal)以连续变化尺度测量具有可进行分析的数值有数值或字符值用于作分类变量数值型

字符型区间型列名型109SAS/INSIGHT在SAS/INSIGHT中,变量按其测SAS/INSIGHT

对数据集的操作在SAS/INSIGHT中,可对SAS数据集进行 数据输入和浏览 修改测量水平 移动变量显示次序 建立新的变量 按某个变量的值进行排序 选取子集110SAS/INSIGHT

对数据集的操作在SAS/INSIGHAnalystApplication分析员应用(AnalystApplication)是在SAS系统中进行基本统计分析菜单界面系统它将常用的统计方法按描述统计,表分析,假设检验,方差分析和回归分析等栏目提供菜单,也有制图和建表的功能菜单它对所进行的每项分析都提供按菜单设定的要求自动生成的程序它对分析的过程和结果建立项目并进行管理111AnalystApplication分析员应用(AnalyAnalystApplication在SAS中进入Analyst: 键入命令ANALYST 用下拉菜单Globals

Analyze

StatisticalAnalysis112AnalystApplication在SAS中进入AnalAnalystApplication在Analyst中,可对SAS数据集进行 数据输入和浏览 移动变量显示次序

建立新的变量 按某个变量的值进行排序 选取子集

转置数据集113AnalystApplication在Analyst中,可变量取值的宏观描述分布全面地描述了变量取值的概况

分布:变量取什麽值,各占多少比例字符型变量:用表列举其取值和比例或用

柱状图,拼花图(Mosaic)114变量取值的宏观描述分布全面地描述了变量取值的概况

分布:变量变量取值的宏观描述连续变化数值型变量:用表列举其在各个

范围取值的比例,用直方图,Box图或

次序统计量、经验分布图115变量取值的宏观描述连续变化数值型变量:用表列举其在各个

范围SAS/INSIGHT

数据取值频数的描述柱状图与直方图(Barchart/Histogram)AnalyzeHistogram/Barchart(Y)频数表AnalyzeDistribution(Y)OutputFrequencyTable116SAS/INSIGHT

数据取值频数的描述柱状图与直方图(Analyst

数据取值频数的描述StatisticsDescriptive

FrequencyCounts制作直方图117Analyst

数据取值频数的描述Statistics变量取值特征的描述运用各种统计量描述变量取值的不同特征均值、中位数描述变量取值的中心位置方差、极差描述变量取值的离散程度次序统计量也可描述变量取值的分布118变量取值特征的描述运用各种统计量描述变量取值的不同特征30次序统计量样本(Sample):次序统计量(OrderStatistics):4,3,11,3,15,81,3,3,4,5,8,11119次序统计量样本(Sample):次序统计量(OrderSt描述数据中心位置的统计量样本观测值:4,3,11,3,1,5,8120描述数据中心位置的统计量样本观测值:4,3,11,3,描述数据离散程度的统计量121描述数据离散程度的统计量33描述数据离散程度的统计量样本观测值:4,3,11,3,1,5,8

122描述数据离散程度的统计量样本观测值:4,3,11,3,与均值方差有关的统计量标准差(StdDev):标准误(StdError):变异系数(CV)未校平方和(USS)校正平方和(CSS)123与均值方差有关的统计量标准差(StdDev):标准误(St偏度(Skewness)偏度:(Skewness)精确地<0>0=0124偏度(Skewness)偏度:精确地<0>0=036峰度(Kurtosis)峰度:(Kurtosis)精确地<0=0>0>0<0125峰度(Kurtosis)峰度:精确地<0=0>0>0分位数(Quantile)(0.4分位数)126分位数(Quantile)(0.4分位数)38分位数(Quantile)p分位数:附近的一个数(小于p-分位点的样本数约占样本总数的100p%)0.5-分位数即中位数0.25-分位数称下四分位数0.75-分位数称上四分位数样本观测值:4,3,11,3,1,5,8(1,3,3,4,5,8,11)438127分位数(Quantile)p分位数:附近的一个数(小于p-分SAS/INSIGHT

数据的图形描述-盒须图128SAS/INSIGHT

数据的图形描述-盒须图40SAS/INSIGHT与Analyst

生成描述统计量

Insight生成描述性统计量:Analyze

Distribution(Y)Analyst生成描述性统计量:StatisticsDescriptiveSummaryStatistics…或Distributions…

129SAS/INSIGHT与Analyst

生成描述统计量Ins变量取值的宏观描述对母体和样本都可考虑它们各自的分布样本直方图总体分布密度样本经验分布总体累计分布130变量取值的宏观描述对母体和样本都可考虑它们各自的分布样本直方中心极限定理131中心极限定理43标准正态分布密度132标准正态分布密度44对数正态分布133对数正态分布45Weibull分布134Weibull分布46SAS/INSIGHT

分布拟合直方图(Graphs)+拟合分布密度(Curves)经验分布(Curves)+拟合累计分布(Curves)QQ图(Graphs)+参照线(Curves)非正态参数分布的拟合:Curves+ParametricDensity非参数分布密度拟合:

Curves+Kernel由AnalyzeDistribution(Y)进入后:135SAS/INSIGHT

分布拟合直方图(Graphs)+拟合Q-Q图

136Q-Q图48Analyst

直方图与分布拟合StatisticsDescriptiveDistributions...拟合137Analyst

直方图与分布拟合StatisticsD方差分析(AnalysisofVariance)对多个均值进行统计推断通常使用方差分析方差分析是分析试验结果数据的重要方法138方差分析(AnalysisofVariance)对多个均方差分析(AnalysisofVariance)在方差分析中:

连续应变量:记录在各种条件下的观测结果 若干个分类变量:设定观测条件(也称独立变量)

分类变量可表示固定效因或随机效因

分类变量的不同值又称为水平139方差分析(AnalysisofVariance)在方差分方差分析(ANOVA)方差分析将观测到的应变量的变差分解为属

于不同分类变量的和随机误差进行分析140方差分析(ANOVA)方差分析将观测到的应变量的变差分解为属方差分析(ANOVA)

141方差分析(ANOVA)53方差分析(ANOVA)自由度分解方差分解或(效因模型、线性模型)单分类数据的分析(均值模型)142方差分析(ANOVA)自由度分解方差分解或(效因模型、线性模方差分析(ANOVA)方差分解与检验

TotalSS=SS(因素A)+ResidualSSTotalDF=DF(A)+ResidualDFMS(.)=SS(.)/DF(.)F(.)=MS(.)/ResidualMS

143方差分析(ANOVA)方差分解与检验

Total方差分析

数据要求使用SAS进行方差分析时要求每条记录为一次观测的结果。不同因素或水平下因变量的观测值都记用同一个变量表示不合适合适144方差分析

数据要求使用SAS进行方差分析时要不合适合适56方差分析

SAS/INSIGHT单因素方差分析图形表现:

AnalysisBoxplot

Y:区间型因变量,X:列名型独立变量方差分析计算:

AnalysisFit(X,Y)

Y:区间型因变量,X:列名型独立变量145方差分析

SAS/INSIGHT单因素方差分析图形表现:方差方差分析

AnalystStatisticsANOVAOne-wayANOVAFactorialANOVALinearModels146方差分析

AnalystStatisticsANOVA变量的相关关系散点图是直观地观察连续变化变量间相依

关系的重要工具Insight:AnalyzeScatterplot(YX)或Multivariate(Y's)编程:procgplotAnalyst:GraphsScatterplot147变量的相关关系散点图是直观地观察连续变化变量间相依

关系的重变量的相关关系用直线描述用曲线描述可能有周期变化无明显关系148变量的相关关系用直线描述用曲线描述可能有周期变化无明显关系6相关系数(CorrelationCoef.)线性联系是描述变量联系中最简单和最常

用的一种(Y=a1x1+a2x2+b)相关系数是描述两个变量间线性联系程度

的统计指标相关系数的计算公式:149相关系数(CorrelationCoef.)线性联系是描述相关系数(CorrelationCoef.)正相关:一个变量数值增加时另一个变量也增加负相关:一个变量数值增加时另一个变量减少150相关系数(CorrelationCoef.)正相关:负相关相关系数(CorrelationCoef.)强相关并不表示存在因果关系弱相关并不表示变量间不存在关系个别极端数据可能影响相关系数151相关系数(CorrelationCoef.)强相关并不表示相关系数的计算

SAS/INSIGHT

AnalyzeMultivariate(Y's)

OutputCorr在多变量分析窗中,由下拉菜单TablesCorr在散点图上加置信椭圆认识相关大小CurvesConfidenceEllipse

Prediction:...152相关系数的计算

SAS/INSIGHTAnalyzeM相关系数的计算

AnalystStatisticsDescriptiveCorrelations153相关系数的计算

AnalystStatisticsDe相关与回归相关分析量化连续变化变量间线性相

关的强度回归分析确定一个连续变量与另一些

连续变量间的关系154相关与回归相关分析量化连续变化变量间线性相

关的强度66回归(Regression)描述一个变量与另一些变量间统计联系的关系式,Y=f(x1,x2,...,xm),用于解释和预测。确定回归: 确定变量:Y与那些x1,x2,..,xm有关 选择形式:Y与x1,x2,..,xm以什麽形式

相联系,即f的表示式 确定系数:确定Y=a1x1+a2x1x2+a3x12+...

中的ai

155回归(Regression)描述一个变量与另一些变量间统计联回归的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论