




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据分析描述性统计分析过程第1页,共33页,2023年,2月20日,星期五几种描述性统计分析的SAS过程和作图过程procmeansprocunivariateproccorrprocplot//procgplotproccapability第2页,共33页,2023年,2月20日,星期五procmeans(1)
Means过程的语句格式
Means过程的主要控制语句如下:
procmeans输入数据集名<选项列表>;var变量列表;class变量列表;byfreq变量列表;
变量;weight变量;id变量列表;
output<out=输出数据集名><统计量关键字=变量名列表>;run;第3页,共33页,2023年,2月20日,星期五procmeans(2)var语句——规定要求计算简单描述性统计量的数值变量的次序。by语句——按by语句定义的变量进行分组计算其相应的简单统计量,要求输入数据集已按by变量排序。class语句——与by语句一样,可用class变量定义观测组,分别计算各组观测的描述统计量。输出格式与by不同且事先不需要按class变量排序。freq语句——指定一个数值型的freq变量,它的值表示输入数据集中相应观测出现的频数。weight语句——规定一个weight变量,它的值表示相应观测的权数。id语句——在输出数据集中增加一个或几个附加变量,目的在于识别输出数据集里的观测。其值为生成这个观测的输入数据集中相应观测组里id变量具有的最大值。第4页,共33页,2023年,2月20日,星期五ntcvprocmeans(3)
procmeans语句中可用的统计量关键字统计量名称含义统计量名称含义未丢失的观测个数mode众数,出现频数最高的数nmissmeanstderrsumstdvarusscssskewnesskurtosis丢失的观测个数算术平均均值的标准误差加权和标准偏差方差变异系数的百分数加权平方和关于均值偏差的加权平方和对称性的度量——偏度对尾部陡平的度量——峰度sumwgtmaxminrangemedianprtclmlclmuclm权数和最大值最小值极差,max—min中间值总体均值等于0的t统计量t分布的双尾p值置信度上限和下限置信度下限置信度上限第5页,共33页,2023年,2月20日,星期五procmeans(4)output语句中的选项。<out=输出数据集名>——输出数据集名。统计量关键字=变量名列表——规定在输出数据集中要包含的统计量并规定这些统计量在新数据集中的变量名。means过程对output语句的次数没有限制,可以使用几个output语句来创建内容不同的多个数据集。第6页,共33页,2023年,2月20日,星期五Nprocmeans(5)
SAS程序 dataexamp1; inputx@@; cards; 70.472.076.574.376.577.667.372.075.074.3 73.579.573.574.765.076.581.675.472.772.7 67.276.572.770.477.268.867.367.367.372.7 75.873.575.072.773.573.572.781.670.374.3 73.579.570.476.572.777.284.375.076.570.4 ; procmeansdata=examp1nmeancvskewnesskurtosisrangemedian; varx; run;
输出TheMEANSProcedureAnalysisVariable:xMeanVariationSkewnessKurtosisRangeMedian5073.74600005.40837940.15401110.358117919.300000073.5000000第7页,共33页,2023年,2月20日,星期五procunivariate(1)单变量统计分析对一组单指标实验数据进行分析常采用两种方法:图示法——包括茎叶图、盒型图和正态概率图。描述统计量——包括矩、分位数、极端值和頻数分布表。第8页,共33页,2023年,2月20日,星期五procunivariate(2)
Univariate过程的主要控制语句如下:
procunivariate输入数据集名<选项列表>;varbyfreqweightid变量列表变量列表变量;变量;变量列表;;;output<out=输出数据集名><统计量关键字=变量名列表><pctlpts= 百分位数pctlpre=变量前缀名pctlname=变量后缀名>;run;第9页,共33页,2023年,2月20日,星期五procunivariate(3)
Univariate过程的主要控制语句如下:
procunivariate输入数据集名<选项列表>;varbyfreqweightid变量列表变量列表变量;变量;变量列表;;;output<out=输出数据集名><统计量关键字=变量名列表><pctlpts= 百分位数pctlpre=变量前缀名pctlname=变量后缀名>;run;第10页,共33页,2023年,2月20日,星期五教材1.1例题examp1_1(SAS程序)dataexamp1_1;inputx@@;cards;74.378.868.878.070.480.580.569.771.273.579.575.675.078.872.072.072.074.371.272.075.073.578.874.375.865.074.371.269.768.073.575.072.064.375.880.369.774.373.573.575.875.868.876.570.471.281.275.070.468.070.472.076.574.376.577.667.372.075.074.373.579.573.574.765.076.581.675.472.772.767.276.572.770.477.268.867.367.367.372.775.873.575.072.773.573.572.781.670.374.373.579.570.476.572.777.284.375.076.570.4;procunivariatedata=examp1_1;varx;run;第11页,共33页,2023年,2月20日,星期五教材1.1例题examp1_1(SAS结果1)
TheUNIVARIATEProcedure Variable:x MomentsNMeanStdDeviationSkewness100SumWeights 73.66SumObservations 3.94008153Variance 0.06007521Kurtosis100 7366 15.5242424 0.03386864UncorrectedSS544116.46CorrectedSS1536.9CoeffVariation5.34901103StdErrorMean BasicStatisticalMeasures0.39400815LocationVariabilityMean73.66000StdDeviationMedian73.50000VarianceMode73.50000Range
3.94008 15.5242420.00000InterquartileRange4.60000第12页,共33页,2023年,2月20日,星期五教材1.1例题examp1_1(SAS结果2)
TheUNIVARIATEProcedure Quantiles(Definition5)Quantile100%Max99%95%90%75%Q3Estimate 84.30 82.95 80.50 79.15 75.8050%Median25%Q110%
73.50 71.2068.405%1%0%Min67.3064.65 64.30第13页,共33页,2023年,2月20日,星期五proccapability(能力分析过程)PROCCAPABILITYisdesignedforprocesscapabilityanalysis,including:Histograms(直方图)andcomparativehistograms.Cumulativedistributionfunctionplots(cdfplots)(累积分布函数).Quantile-quantileplots(Q-Qplots),probabilityplots,andprobability-probabilityplots(P-Pplots).Theseplotsfacilitatethecomparisonofadatadistributionwithvarioustheoreticaldistributions.Goodness-of-fit(拟合优度)testsforavarietyofdistributionsincludingthenormal.Statisticalintervals(prediction,tolerance,andconfidenceintervals)foranormalpopulation.第14页,共33页,2023年,2月20日,星期五教材1.2例题examp1_4(SAS程序)dataexamp1_4;inputx@@;cards;74.378.868.878.070.480.580.569.771.273.579.575.675.078.872.072.072.074.371.272.075.073.578.874.375.865.074.371.269.768.073.575.072.064.375.880.369.774.373.573.575.875.868.876.570.471.281.275.070.468.070.472.076.574.376.577.667.372.075.074.373.579.573.574.765.076.581.675.472.772.767.276.572.770.477.268.867.367.367.372.775.873.575.072.773.573.572.781.670.374.373.579.570.476.572.777.284.375.076.570.4;proccapabilitydata=examp1_4;histogramx/normal(mu=estsigma=est);cdfplot/normal(mu=estsigma=est);qqplotx/normal(mu=estsigma=est);run;第15页,共33页,2023年,2月20日,星期五教材1.2例题examp1_4(SAS结果)
TheCAPABILITYProcedure FittedNormalDistributionforx ParametersforNormalDistribution ParameterSymbolEstimateMeanMu73.66
StdDevSigma3.940082QuantilesforNormalDistribution ------Quantile------ PercentObservedEstimated 1.064.650064.4940 5.067.300067.1791 10.068.400068.6106 25.071.200071.0025 50.073.500073.6600 75.075.800076.3175 90.079.150078.7094 95.080.500080.1409 99.082.950082.8260第16页,共33页,2023年,2月20日,星期五教材1.2例题examp1_4(SAS直方图)第17页,共33页,2023年,2月20日,星期五教材1.2例题examp1_4(SAS分布函数图)第18页,共33页,2023年,2月20日,星期五教材1.2例题examp1_4(SASqq图)第19页,共33页,2023年,2月20日,星期五教材1.2例题examp1_6(SAS程序)dataexamp1_6;inputx@@;cards;74.378.868.878.070.480.580.569.771.273.579.575.675.078.872.072.072.074.371.272.075.073.578.874.375.865.074.371.269.768.073.575.072.064.375.880.369.774.373.573.575.875.868.876.570.471.281.275.070.468.070.472.076.574.376.577.667.372.075.074.373.579.573.574.765.076.581.675.472.772.767.276.572.770.477.268.867.367.367.372.775.873.575.072.773.573.572.781.670.374.373.579.570.476.572.777.284.375.076.570.4;procunivariatedata=examp1_6plot;varx;run;第20页,共33页,2023年,2月20日,星期五#4教材1.2例题examp1_6(SAS结果)StemLeafBoxplot84383828126680355795557808887722676555555575000000046888887433333333773555555555557200000007777777712222703444444469777680088867233336665006431 3 3 3 4 3 714 91114 8 3 5 5 2 1
0 | | | | | |+-----+||*--+--*||+-----+ | | | | | | 0第21页,共33页,2023年,2月20日,星期五教材1.2例题examp1_8(SAS程序)dataexamp1_8;inputx@@;cards;254550545561646872757578798183848484858686868789898990919192100;procunivariatedata=examp1_8normal;run;proccapabilitydata=examp1_8graphicsnoprint;histogramx/weibullvscale=proportion;run;datadelmin;setexamp1_8;ifx=25thendelete;run;proccapabilitydata=delmingraphicsnoprint;histogramx/weibullvscale=proportion;cdfplotx/weibull;run;第22页,共33页,2023年,2月20日,星期五2
教材1.2例题examp1_8(SAS结果1)TestsforNormalityTest--Statistic--------pValue------Shapiro-WilkW0.863287Pr<W0.0010Kolmogorov-SmirnovD0.195196Pr>D<0.0100Cramer-vonMisesAnderson-DarlingW-Sq0.295854 A-Sq1.593346Pr>W-Sq<0.0050Pr>A-Sq<0.0050结论:拒绝正态分布的假设
Goodness-of-FitTestsforWeibullDistributionTestCramer-vonMises----Statistic----- W-Sq0.2242363DF
------pValue------Pr>W-Sq<0.010Anderson-DarlingA-Sq1.2884219Pr>A-Sq<0.010Chi-SquareChi-Sq24.87188823Pr>Chi-Sq<0.001结论:拒绝Weibull分布的假设
Goodness-of-FitTestsforWeibullDistributionTest----Statistic-----DF------pValue------Cramer-vonMisesAnderson-DarlingChi-SquareW-Sq0.16341872 A-Sq1.00500667Chi-Sq5.22777090
Pr>W-Sq0.013Pr>A-Sq<0.010Pr>Chi-Sq0.073结论:对于删去25的数据集,接受Weibull分布的假设第23页,共33页,2023年,2月20日,星期五教材1.2例题examp1_8(SAS结果2)第24页,共33页,2023年,2月20日,星期五proccorr(1)
proccorr(相关分析过程)用于计算变量之间 的相关系数,包括Pearson(皮尔逊)的乘 积矩相关和加权乘积矩相关。还能产生三个 非参数的关联测量:Spearman的秩相关, Kendall的tau-b和Hoeffding的相关性度量D。proccorr语句调用corr过程,且是唯一必须的语句。如果只使用proccorr这一条的语句,过程计算输入数据集中所有数值变量之间的相关系数。其余语句是供选择的。第25页,共33页,2023年,2月20日,星期五proccorr(2)
proccorr过程一般由下列语句控制:proccorrvarwithpartialweightfreqByrun;
data=数据集<选项>;变量列表;变量列表;变量列表;变量;变量;变量列表;第26页,共33页,2023年,2月20日,星期五教材1.3例题examp1_9(SAS程序)dataexamp1_9;inputxy;cards;689716389270112568265931911210162123212031530375334622735221305584142292733217185537036287265740;run;proccorrdata=examp1_9pearsonspearmancov;run;run;第27页,共33页,2023年,2月20日,星期五xyNxy
教材1.3例题examp1_9(SAS结果1)TheCORRProcedure2Variables:xyCovarianceMatrix,DF=19
x 570.45007845.0789
y 7845.0789112404.2632SimpleStatisticsVariable20
Mean33.85000StdDev 23.88410Median 27.00000Minimum 5.00000Maximum70.0000020477.50000335.26745342.0000082.000001125第28页,共33页,2023年,2月20日,星期五xyxy教材1.3例题examp1_9(SAS结果2)
TheCORRProcedurePearsonCorrelationCoefficients,N=20 Prob>|r|underH0:Rho=0
x1.000000.97971y0.97971 <.00011.00000
<.0001SpearmanCorrelationCoefficients,N=20 Prob>|r|underH0:Rho=0
x1.000000.97366<.0001y0.97366<.00011.00000第29页,共33页,2023年,2月20日,星期五教材1.3例题examp1_10(SAS程序)dataexam1_10;inputx1-x6;cards;19136505162601893752211060………156335415225731383368211043;proccorrdata=exam1_10covpearsonspearman;varx1-x6;run;第30页,共33页,2023年,2月20日,星期五Nx520教材1.3例题examp1_10(SAS结果1)TheCORRProcedure6Variables:x1x2x3x4x5x6CovarianceMatrix,DF=19(略)
SimpleStatisticsVariableMeanStdDevMedianMinimumMaximumx120178.6000024.69051176.00000138.00000247.00000x2x3x420202035.4000056.10000 9.45000
3.20197 7.210375.28628
35.00000 55.0000011.5000031.0000046.000001.00000
46.00000 74.0000017.00000145.5500062.56658122.5000050.00000251.00000x62070.3000051.2774754.0000025.00000250.00000第31页,共33页,2023年,2月20日,星期五教材1.3例题examp1_10(SAS结果2)TheCORRProcedure6Variables:x1x2x3x4x5x6PearsonCorrelationCoefficients,N=20 Prob>|r|underH0:Rho=0x1x2x3x4x5x6x1x2x3x4x5x6
1.00000 0.87024 <.0001-0.365760.1128-0.389690.0894-0.49308 0.0272-0.22630 0.3374
0.87024
<.0001 1.00000 -0.352890.1270 -0.552230.0116 -0.64560 0.0021 -0.19150 0.4186
-0.36576
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年吉林工程职业学院单招职业适应性测试题库及答案1套
- 药学考试模拟题及参考答案
- 2025年衡阳幼儿师范高等专科学校单招职业技能测试题库一套
- 2025四川省建筑安全员考试题库
- 2025年湖南省株洲市单招职业适应性测试题库汇编
- 2025年广东省广州市单招职业倾向性测试题库完美版
- 卫浴工地采购合同范本
- 2025年湖南省湘潭市单招职业适应性测试题库带答案
- 第一课时内力与地表形态+复习学案 高中地理鲁教版(2019)选择性必修1
- 计量经济学(济南大学)知到智慧树章节测试课后答案2024年秋济南大学
- 五年级上册信息技术教学计划华科版
- 机器人传感器PPT完整全套教学课件
- 初一语文下册:阅读理解知识点整理
- 营销部安全生产责任制
- CSM工法双轮铣水泥土搅拌墙专项施工方案
- 【讲座】高三英语高效二轮备考讲座课件
- 定点医疗机构接入验收申请表
- 小羊诗歌大全1479首(小羊喝水扩句)
- 2022-2023学年辽宁省鞍山市普通高中高一年级下册学期第一次月考数学(A卷)试题【含答案】
- 中国农村居民储蓄行为研究共3篇
- 华为鸿蒙深度研究
评论
0/150
提交评论