SAS基础与金融计算3_第1页
SAS基础与金融计算3_第2页
SAS基础与金融计算3_第3页
SAS基础与金融计算3_第4页
SAS基础与金融计算3_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1SAS基础与金融计算游家兴厦门大学经济学院计统系2描述统计中的单变量分析UNIVARIATE过程该过程除可以完成类似MEANS过程的基本统计量的计算外,它还可以计算以下统计量:描述变量极端值的情况;计算分位数,如中位数;生成若干个描述变量的分布图;生成频率表;对数据进行正态性检验;

对数据进行t检验和秩和检验。3该过程由下列语句控制:PROCUNIVARIATE[options];VARvariables;BYvariables;OUTPUT[out=SAS-data-set][output-statistics];Run;4PROCUNIVARIATE语句详解PROCUNIVARIATE[options];用于UNIVARIATE过程语句的可选项有(与MEANS过程相同用法的选项略去说明):

DATA=SAS-data-set

FREQ:要求生成包括变量值、频数、百分数和累计频数的频率表。

NORMAL:要求计算关于变量服从正态分布的假设检验统计量,这个检验统计量相应的概率也被输出。5

PLOT:要求生成茎叶图、盒形图和正态概率图。

PCTLDEF=value:规定计算百分位数的方法,值取为1,2,3,4,5。缺省时为5。6OUTPUT语句OUTPUT语句的用法与MEANS过程中类似,下面指出两点不同之处:

output-statistics选项中可用的关键词除了在MEANS过程中已介绍过的以外,还有:

NOBS,MEDIAN,MODE,P1,P5,P10,P90,P95,P99,MSIGN(符号统计量),PROBN(正态性检验统计量对应的概率),SIGNRANK,NORMAL,Q1,Q3,QRANGE(四分位差)。7PCTLPTS=percentiles:规定在该过程中不能自动提供而用户又希望计算的百分位数。例如要计算第33分位数值,必须选择此项。PCTLPRE=prefix-names:该选项规定要求计算的百分位数的输出变量名的前缀。

PCTLNAME=suffix-names:该选项规定要求计算的百分位数的输出变量名的后缀。8以上三个选项往往结合起来使用,如:Procunivariatedata=

;varageweightheight;outputpctlpts=33.366.7pctlpre=awhpctlname=p33_3p66_7;Run;

9例:我们利用前面建立的数据集student来看看Univariate过程的输出结果。Datastudent;inputclasssex$ageweightheight;cards;1f15461561f14411491m13481552m16551652f17501602f16601652m17651753f18651653m18701803m1768176;Run;Procunivariatedata=student;varheight;Run;Procunivariatedata=studentnormal;varheight;Run;Procunivariatedata=studentplot;varheight;Run;10

MomentsN15SumWeights15Mean163.2SumObservations2448StdDeviation9.1354881Variance83.4571429Skewness0.28385259Kurtosis-0.5095875UncorrectedSS400682CorrectedSS1168.4CoeffVariation5.59772555StdErrorMean2.35877289

BasicStatisticalMeasuresLocationVariabilityMean163.2000StdDeviation9.13549Median162.0000Variance83.45714Mode160.0000Range31.00000InterquartileRange14.00000NOTE:Themodedisplayedisthesmallestof2modeswithacountof3.11ExtremeObservations----Lowest--------Highest---ValueObsValueObs149216511150517071554175101561176151601218013TestsforLocation:Mu0=0Test-Statistic------pValue-----Student’stt69.18852Pr>|t|<.0001SignM7.5Pr>=|M|<.0001SignedRankS60Pr>=|S|<.0001Quantiles(Definition5)QuantileEstimate100%Max18099%18095%18090%17675%Q317050%Median16225%Q115610%1505%1491%1490%Min14912TestsforNormalityTest--Statistic--------pValue------Shapiro-WilkW0.961232Pr<W0.7138Kolmogorov-SmirnovD0.155234Pr>D>0.1500Cramer-vonMisesW-Sq0.042367Pr>W-Sq>0.2500Anderson-DarlingA-Sq0.259036Pr>A-Sq>0.2500Normal(1)当样本本量小于于2000时,应选选用Shapiro-Wilks的W检验。W值愈接近近于1,说明该该变量愈愈接近正正态分布布;(2)当样本本量大于于2000时,应选选用Kolmogorov-Smirnov正态性检检验。D值越大,,P值越小,,说明该该变量愈愈不服从从正态分分布;D值越小,,P值越大,,说明该该变量愈愈服从正正态分布布。Procunivariatedata=studentnormal;varheight;Run;13为什么要要进行正正态检验验?正态分布布是许多多统计方方法的理理论基础础。t检验、方方差分析析、相关关和回归归分析等等多种统统计方法法均要求求分析的的变量服服从正态态分布。。许多统计计方法虽虽然不要要求分析析指标服服从正态态分布,,但相应应的统计计量在大大样本时时近似正正态分布布,因而而大样本本时这些些统计推推断方法法也是以以正态分分布为理理论基础础的。如果变量量不服从从正态分分布,那那么以正正态分布布为假设设所获得得的结论论就不可可靠。14Procunivariatedata=studentplot;varheight;Run;获得三个个图:1、茎叶图图2、箱线图图3、正态概概率图15茎叶图茎叶图,,类似直直方图,,但又与与直方图图不同,,它的思思路是将将数组的的数按位位数进行行比较,,将数大大小基本本不变或或变化不不大的位位作为一一个主杆杆(茎)),将变变化大的的位的数数作为分分枝(叶叶),列列在主杆杆的后面面,这样样就可以以清楚地地看到每每个主杆杆后面的的几个数数,每个个数具体体是多少少。16茎叶图有有三列数数:(1)最左边边的一列列表示茎茎,也就就是变化化不大的的位数;;(2)中间的的是数组组中的变变化位,,它是按按照一定定的间隔隔将数组组中的每每个变化化的数一一一列出出来,象象一条枝枝上抽出出的叶子子一样,,所以人人们形象象地叫它它茎叶图图;(3)右边的的一列数数为统计计数,表表示该组组的单位位个数。。StemLeaf#180117562170116555316000241556215011491MultiplyStem.Leafby10**+117箱线图箱线图,,也称盒盒须图,,由一个个箱子((或盒子子)和两两条线段段组成。。其绘制制的方法法是,求求出总体体的五个个数量特特征值::极大值、极小值、中位数、上四分位位数、下四分位位数,连接上上四分位位数和下下四分位位数画出出箱体,,再将两两个极值值点与箱箱体相连连。StemLeaf#Boxplot1801|17562|1701+-----+165553||1600024*--+--*15562+-----+1501|1491|----+----+----+----+MultiplyStem.Leafby10**+118NormalProbabilityPlot182.5+*+++++|**++++++|*+++++|**+*++|***+*+|*+*+++|++*+++147.5+++*+++----+----+----+----+----+----+----+----+----+----+-2-10+1+2纵轴为实实测值标标度,横横轴按标标准正态态分布U值标度。。图中的的“+”号标记标标准正态态u值的参考考直线,,“*””号标记记实际数数据点。。如果样本本来自正正态总体体,则观观测值数数据“*”构成成的直线线与参考考直线基基本重合合,表明明观测值值数据服服从正态态分布。。正态概率率图19Procunivariatedata=studentfrep;varheight;Run;生成包括括变量值值、频数数、百分分数和累累计频数数的频率率表。20本次课上上机作业业对数据集集finance进行如下下操作::1、画出股股票收益益率正态态概率图图,并判判断它是是否服从从正态分分布?2、剔除股股票收益益率和市市盈率在在1%和99%分位数之之外的观观测值,,将结果果生成新新的数据据集(test);3、用Univari

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论