版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章描述性统计描述统计量统计图形一、描述统计量描述性统计是最根本的统计分析,通过对原始数据进行总括和描述来说明总体的情况和特征。描述性统计一方面利用一系列数字指标来概括数据的信息,另一方面利用直观简单的图形来展现数据的特性。描述统计量包括:表示位置的统计量、表示分散程度的统计量和表示分布形态的统计量。
1、根本概念一、描述统计量(1)表示位置的统计量均值:由样本的总和除以样本的个数,即中位数:将样本按照大小顺序排列之后,处于中间位置的样本值众数:样本中出现频率最大的样本值百分位数:将样本按照从小到大排列后,处于p%位置的样本值被称为第p百分位数1、根本概念一、描述统计量〔2〕表示分散程度的统计量方差:各样本值与均值差值平方的平均值,即标准差:方差的平方根,即标准误:样本均值的标准误差,定义为变异系数:是将标准差表示为均值的百分数,即极差:样本中最大值与最小值之差1、根本概念一、描述统计量(3)表示分布形态的统计量偏度:是衡量数据分布对称性的指标,定义为
当数据关于均值对称分布时,偏度为0;当数据向右偏时,偏度大于0;当数据向左偏时,偏度小于0。峰度:是衡量数据分布尖峭程度的指标,定义为当数据分布为标准正态分布时,峰度等于0;当数据分布比标准正态分布更尖峭时,峰度大于0;当数据分布比标准正态分布更平缓时,峰度小于0。2、MEANS过程一、描述统计量MEANS过程的主要功能是计算根本的描述统计量,此外还可以进行一些参数估计和假设检验。MEANS过程的语句格式为:PROCMEANSDATA=数据集名<选项列表><统计量关键字列表>;VAR变量名列表;BY分组变量名;CLASS分组变量名;RUN;其中,只有PROC语句是必须的,其他语句可以根据用户需要进行选用。2、MEANS过程一、描述统计量语句说明:〔1〕PROC语句规定开始运行MEANS过程,并指定要分析的数据集名。MEAR过程默认输出的统计量有:观测总数、均值、标准差、最大值和最小值。如果要计算其他统计量或其中的某一些统计量,那么可在PROC语句中指定统计量的关键字。〔2〕VAR语句规定要计算描述统计量的数值型变量及其顺序。假设不使用此语句,那么默认对所有的数值型变量进行计算。〔3〕BY语句规定了分组变量,要求在BY分组内计算描述性统计量。〔4〕CLASS语句规定了观测分组,要求在观测分组内计算描述性统计量。CLASS语句与BY语句的功能类似,但是CLASS语句不要求数据集事先按照变量进行排序,而且两个语句在输出格式上也有一些区别。2、MEANS过程一、描述统计量PROC语句中的统计量关键字关键字统计量关键字统计量N有效观测数MAX最大值NMISS缺失值个数MIN最小值MEAN均值RANGE极差VAR方差MEDIAN中位数STDDEV|STD标准差Q1四分之一分位数STDERR标准误Q3四分之三分位数CV变异系数QRANGE四分位数间距SUM总和P1第1百分位数SUMWGT加权值总和P5第5百分位数CSS校正平方和P10第10百分位数USS未校正平方和P90第90百分位数SKEWNESS偏度P95第95百分位数KURTOSIS峰度P99第99百分位数3、UNIVARIATE过程一、描述统计量UNIVARIATE过程也可以提供描述统计量的计算,另外还有统计频数、绘制图形和假设检验的功能。UNIVARIATE过程的语句格式为:PROCUNIVARIATEDATA=数据集名<选项列表>;VAR变量名列表;BY分组变量名;CLASS分组变量名;RUN;使用UNIVARIATE过程计算描述统计量与MEANS过程所用的语句和选项都根本类似,只是UNIVARIATE过程不需要指定统计量关键字,而是默认给出所有的根本统计量和一些关于位置检验的结果。1、条形图和饼图二、统计图形条形图和饼图是常见的展现属性数据的图形。条形图主要用来描绘属性变量每个取值的频数,清晰地反映它们之间的差异。饼图用来描绘属性变量每个取值的频数所占的比例,反映它们之间相对数量的多少。1、条形图和饼图二、统计图形GCHART是SAS/GRAPH模块提供的输出高精度彩色图表的过程,可用于制作二维或三维的条形图和饼图等。GCHART过程的语句格式为:PROCGCHARTDATA=数据集名;图形名变量名</选项>;RUN;GCHART过程中,通过图形名调用相应的程序来绘制某一类的图形。图形名说明BLOCK3维平铺条形图HBAR水平条形图HBAR3D3维水平条形图VBAR垂直条形图VBAR3D3维垂直条形图PIE饼图PIE3D3维饼图DONUT环形图STAR星形图2、散点图和连线图二、统计图形散点图和连线图是常用的表现两个变量之间变化关系的图形。散点图是以数据集中的某两个变量为坐标轴,将每个观测对应一个点绘制在图中,来反映两个变量间的相互关系。连线图那么是用直线或曲线将散点图中的所有点连接起来而得到,用来更清晰的表现某种变化趋势。1、条形图和饼图二、统计图形GPLOT也是SAS/GRAPH模块提供的一个绘图过程,可用于制作高精度的散点图和连线图。GPLOT过程的语句格式为:PROCGPLOTDATA=数据集名;PLOT纵轴变量名*横轴变量名<=第三个变量名></选项>;SYMBOL<选项>;AXIS<选项>;RUN;其中,PROC语句和PLOT语句是必须的。PLOT语句用于规定纵轴变量和横轴变量,并可选第三个变量来对观测进行分组。SYMBOL语句为可选语句,用来规定图中线和点的特征。2、散点图和连线图3、直方图、经验分布图和QQ图二、统计图形直方图、经验分布图和QQ图是常见的表现数据分布特征的图形。直方图经常用来展示数值型变量的分布。一般做法是先将数值型变量的取值分成假设干等间距的区间,然后统计数据落入每个区间的频数,并在区间上画出一个矩形,用矩形的高度来表示每个区间频数的大小。对于一个适宜的分组,利用直方图可以去近似总体的分布密度。3、直方图、经验分布图和QQ图二、统计图形经验分布图是根据样本观测值作出的经验分布函数而绘制的,经验分布函数是样本对总体累积分布函数的一个估计。QQ图是鉴别样本分布是否近似于某种类型分布的一种直观简便的图形。它是以某种分布的分位数为横坐标,以样本值为纵坐标绘制的散点图。1、条形图和饼图二、统计图形CAPABILITY过程是由SAS/QC模块提供,可以用来绘制直方图、经验分布图和QQ图等,其语句格式为:PROCCAPABILITYDATA=数据集名<选项>;HISTOGRAM变量名</选项>;
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 岭南师范学院《地理学前沿讲座》2023-2024学年第一学期期末试卷
- 2024实习协议书模板:汽车销售行业实习生合同范例3篇
- 动产抵押借款合同
- 滑冰场场地租赁合同
- 2024至2030年中国加速器行业投资前景及策略咨询研究报告
- 2024年度房产委托代持风险责任合同3篇
- 2024年度版权买卖合同版权交付与交易金额支付3篇
- 2024年物业绿化管理服务外包合同
- 2021学校母亲节活动策划范文
- 2024年度养老产业投资入股合作协议范本3篇
- 企业管理制度-薪酬管理制度
- 消毒供应室消毒员培训
- 输血相关知识培训
- 体育场馆照明解决方案
- 团购被子合同范例
- 管理学基础知识考试题库(附含答案)
- 中药涂擦治疗
- 2023-2024学年广东省深圳市福田区八年级(上)期末英语试卷
- 2024年高考物理复习试题分类训练:动量(教师卷)
- 2024年军事理论知识全册复习题库及答案
- FA合同协议模板新
评论
0/150
提交评论