统计学实验SPSS和R软件应用与实例(第二版) 费宇第10章数据的描述-R_第1页
统计学实验SPSS和R软件应用与实例(第二版) 费宇第10章数据的描述-R_第2页
统计学实验SPSS和R软件应用与实例(第二版) 费宇第10章数据的描述-R_第3页
统计学实验SPSS和R软件应用与实例(第二版) 费宇第10章数据的描述-R_第4页
统计学实验SPSS和R软件应用与实例(第二版) 费宇第10章数据的描述-R_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023/1/5《统计学实验》第10章数据的描述10-1统计学实验

—SPSS和R软件应用与实例

主编:费宇(第二版)2023/1/5《统计学实验》第10章数据的描述10-2第10章

数据的描述2023/1/5《统计学实验》第10章数据的描述10-3一、实验目的运用R中的barplot()函数画条形图,hist()函数画直方图,pie()函数画饼图,boxplot()函数画箱线图,plot()函数画线图,stem()函数画茎叶图。

掌握运用R软件中的函数对数据进行描述性分析。2023/1/5《统计学实验》第10章数据的描述10-4二、实验环境系统软件Windows2000或WindowsXP或Windows7;

统计软件R3.3.1或更高版本。

2023/1/5《统计学实验》第10章数据的描述10-5三、实验内容常见统计图的绘制

(1)分类数据和顺序数据的频数分布表

(2)分类数据和顺序数据的条形图及饼图

(3)数值型数据的频数分布表

(4)数值型数据的直方图、箱线图、线图、茎叶图

2.

描述性统计分析

2023/1/5《统计学实验》第10章数据的描述10-6第10章

数据的描述10.1常见统计图的绘制

10.1.1分类数据和顺序数据的频数分布表

10.1.2分类数据和顺序数据的条形图及饼图10.1.3数值型数据的频数分布表

10.1.4数值型数据的直方图、箱线图、线图、茎叶图

10.2描述性统计分析

2023/1/5《统计学实验》第10章数据的描述10-710.1常见统计图的绘制

10.1.1分类数据和顺序数据的频数分布表

【例10.1】(数据文件为li10.1.txt)对某高校经济系30名教师性别及职称登记结果,如表10.1所示,试用R分别编制教师职称的频数分布表。

2023/1/5《统计学实验》第10章数据的描述10-8表10.1某高校30名教师性别及职称情况统计表序号性别职称序号性别职称序号性别职称1男讲师11男教授21男副教授2女助教12女副教授22女副教授3女副教授13女副教授23男讲师4女副教授14男讲师24女助教5男助教15男讲师25男副教授6男教授16男副教授26男讲师7女教授17女讲师27女教授8男讲师18男助教28男讲师9女副教授19女副教授29男副教授10男教授20女副教授30女教授2023/1/5《统计学实验》第10章数据的描述10-9【统计理论】对分类数据和顺序数据,计算出每一类别出现的频数或频率后,可通过频数分布表来展示。2023/1/5《统计学实验》第10章数据的描述10-10【软件操作】采用table()函数编制频数分布表setwd(“D:/R-Statistics/data/chap-10”)#设定工作路径x=read.table("li10.1.txt",header=T)#从li10.1.txt中读入数据,记为xfre=table(x$ZHCH)#生成教师职称变量的分组频数,如果绘制教师性别的频数分布表只需要把命令改为fre=table(x$XB)即可2023/1/5《统计学实验》第10章数据的描述10-11library(sca)#加载扩展包scaper=percent(fre/sum(fre),d=1)#使用扩展包sca中的percent函数,可以用带%符号的表示方式显示结果,参数d来指定小数点后的表示位数。在不指定的情况下,小数点后的数字不表示。rbind(fre,per)#合并表格命令,生成教师职称分组频数分布表2023/1/5《统计学实验》第10章数据的描述10-12运行结果

副教授

讲师

教授

助教

fre"12""8""6""4"per"40.0%""26.7%""20.0%""13.3%"2023/1/5《统计学实验》第10章数据的描述10-1310.1.2

分类数据和顺序数据的条形图及饼图

【例10.2】(数据文件为li10.1.txt)根据表10.1资料,用R软件绘制条形图。(数据来源:费宇等,《统计学》第2章,高等教育出版社,2010)

2023/1/5《统计学实验》第10章数据的描述10-14【统计理论】对分类数据和顺序数据,计算出每一类别出现的频数或频率后,还可通过统计图来展示,例如条形图。

2023/1/5《统计学实验》第10章数据的描述10-15【软件操作】采用barplot()函数画条形图

setwd(“D:/R-Statistics/data/chap-10”)#设定工作路径x=read.table("li10.1.txt",header=T)#从li10.1.txt中读入数据,记为xZHCH.table=table(x$ZHCH)#生成教师职称变量的列联表barplot(sort(ZHCH.table,decreasing=TRUE),ylab="人数")#其中sort命令是对列联表进行排序,decreasing=TRUE按升序排,参数ylab为y轴的标签2023/1/5《统计学实验》第10章数据的描述10-16图10.1

某高校30名教师职称分布条形图运行结果2023/1/5《统计学实验》第10章数据的描述10-17【例10.3】(数据文件为li10.1.txt)根据表10.1资料,用R软件绘制饼图。(数据来源:费宇等,《统计学》第2章,高等教育出版社,2010)

2023/1/5《统计学实验》第10章数据的描述10-18【统计理论】对分类数据和顺序数据,计算出每一类别出现的频数或频率后,还可通过统计图来展示,例如饼图

2023/1/5《统计学实验》第10章数据的描述10-19【软件操作】采用pie()函数作饼图

x=read.table("li10.1.txt",header=T)#从li10.1.txt中读入样本数据xZHCH.table=table(x$ZHCH)#生成教师职称变量的列联表pie(ZHCH.table,col=gray(seq(0.4,1.0,length=4)))#参数col是用于设定填充颜色的向量,length用于设置颜色深浅的层次2023/1/5《统计学实验》第10章数据的描述10-20图10.2

某高校30名教师职称分布饼图运行结果2023/1/5《统计学实验》第10章数据的描述10-2110.1.3数值型数据的频数分布表

【例10.4】(数据文件为li10.4.txt)2014年我国各地区农村居民家庭人均纯收入资料如表10.2所示,试用R软件制作频数分布表。

2023/1/5《统计学实验》第10章数据的描述10-22表10.22014年我国各地区农村居民家庭人均纯收入注:本表为我国农村居民家庭收入抽样调查资料。资料来源:《中国统计年鉴(2015)》地区人均纯收入(元)地区人均纯收入(元)北

京18867.3湖

北10849.1天

津17014.2湖

南10060.2河

北10186.1广

东12245.6山

西8809.4广

西8683.2内蒙古9976.3海

南9912.6辽

宁11191.5重

庆9489.8吉

林10780.1四

川9347.7黑龙江10453.2贵

州6671.2上

海21191.6云

南7456.1江

苏14958.4西

藏2359.2浙

江19373.3陕

西7932.2安

徽9916.4甘

肃6276.6福

建12650.2青

海7282.7江

西10116.6宁

夏8410.0山

东11882.3新

疆8723.8河

南9966.1——2023/1/5《统计学实验》第10章数据的描述10-23【统计理论】数值型数据经过整理后,首先可用频数分布表(变量数列)将其展示出来。

2023/1/5《统计学实验》第10章数据的描述10-24首先将农村居民家庭人均纯收入用代码1、2、3、4、5表示,然后在数据文件的VaribleView窗口Values栏定义变量值标签,1表示人均纯收入在5000元以下(不含5000元),2表示人均纯收入在5000~10000元(不含10000元),3表示人均纯收入在10000~15000元(不含15000元),4表示人均纯收入在15000~20000元(不含20000元),5表示人均纯收入在20000元以上(含20000元)。

【数据预处理】2023/1/5《统计学实验》第10章数据的描述10-25【软件操作】x=read.table("li10.4.txt",header=T)#从li10.4.txt中读入样本数据xfre=table(x[,4])#生成教师职称变量的分组频数library(sca)#加载扩展包scaper=percent(fre/sum(fre),d=1)#使用扩展包sca中的percent函数,可以用带%符号的表示方式显示结果,参数d来指定小数点后的表示位数。在不指定的情况下,小数点后的数字不表示。rbind(fre,per)#合并表格命令,生成教师职称分组频数分布表2023/1/5《统计学实验》第10章数据的描述10-2612345fre"1""15""11""3""1"per"3.2%""48.4%""35.5%""9.7%""3.2%"运行结果2023/1/5《统计学实验》第10章数据的描述10-27注:用cut()函数也可以完成数值型数据的频数分布表

,结果略x=read.table("li10.4.txt",header=T)x.cut=cut(x[,3],breaks=c(2000,5000,10000,15000,20000),right=FALSE)#按照人均纯收入的取值范围作合适的分组,参数breaks用于设置间断点,参数right用于设置区间右边的开闭,right=FALSE表示右边是开区间左边是闭区间。值得注意的是R语言无法描述开口组,所以我们根据数据取值范围

把间断点的最小值取为2000,最大值取为20000。freq=table(x.cut)library(sca)per<-percent(freq/sum(freq),d=1)rbind(freq,per)2023/1/5《统计学实验》第10章数据的描述10-2810.1.4数值型数据的直方图、箱线图、线图、茎叶图【例10.5】(数据文件为li10.5.txt)根据某大学50名教师年龄原始数据,用R软件绘制直方图。(数据来源:费宇等,《统计学》第2章,高等教育出版社,2010)

2023/1/5《统计学实验》第10章数据的描述10-29【统计理论】数值型数据经过整理后,除了用频数分布表(变量数列)将其展示出来,还可以用统计图来展示,例如直方图。2023/1/5《统计学实验》第10章数据的描述10-30【软件操作】用hist()函数画出直方图

x=read.table("li10.5.txt",header=T)#从li10.5.txt中读入样本数据xhist(x$JSHNL,xlab=“教师年龄(周岁)",main="")#参数main为直方图的标题生成参数,此时定义为空的2023/1/5《统计学实验》第10章数据的描述10-31图10.3

某大学50名教师年龄直方图运行结果2023/1/5《统计学实验》第10章数据的描述10-32【例10.6】(数据文件为li10.6.txt)某大学9名大一新生英语、语文、数学考试成绩如表10.3所示,试绘制多批箱线图,比较9名学生的各科成绩。表10.3

9名大一新生英语、语文、数学考试成绩学生编号考试成绩(分)英语语文数学123456789706589346678809356568033698587625078675498787080698575合计———数据来源:费宇等,《统计学》第2章,高等教育出版社,2010

2023/1/5《统计学实验》第10章数据的描述10-33【统计理论】数值型数据经过整理后,除了用频数分布表(变量数列)将其展示出来,还可以用统计图来展示,例如箱线图。2023/1/5《统计学实验》第10章数据的描述10-34【软件操作】用boxplot()函数绘制作箱线图

x=read.table("li10.6.txt",header=T)#从li10.6.txt中读入样本数据xboxplot(x$CHJ~x$XK,ylab="成绩")#箱线图2023/1/5《统计学实验》第10章数据的描述10-35图10.4

9名学生各科成绩的箱线图运行结果2023/1/5《统计学实验》第10章数据的描述10-36【例10.7】(数据文件为li10.7.txt)2000~2014年我国农村居民人均纯收入及城镇居民人均可支配收入资料如表10.4所示,试用R软件绘制线图。表10.4

2000~2014年我国农村居民人均纯收入及城镇居民人均可支配收入注:资料来源:《中国统计年鉴2015》。

时间(年)农村居民人均纯收入(元)城镇居民人均可支配收入(元)2000200120022003200420052006200720082009201020112012201320142253.42366.42475.62622.22936.43254.93587.04140.44760.65153.25919.06977.37916.68895.99892.06280.06859.67702.88472.29421.610493.011759.513785.815780.817174.719109.421809.824564.726955.129381.0合计——2023/1/5《统计学实验》第10章数据的描述10-37【统计理论】数值型数据经过整理后,除了用频数分布表(变量数列)将其展示出来,还可以用统计图来展示,例如线图。2023/1/5《统计学实验》第10章数据的描述10-38【软件操作】用plot()和lines()函数画线图

x=read.table("li10.7.txt",header=T)#从li10.7.txt中读入样本数据xplot(x[,1],x[,2],type="l",ylim=c(2000,31000),col=1,lty=2)#参数“type=”控制所生成图形的类型,type=“l”

绘制线,type=“b”

绘制由线连接的点;参数“col=”控制绘制点线的颜色,col=“1”为黑色;参数“ylim=”控制纵坐标的范围lines(x[,1],x[,3],type="b",lty=1,pch=4,col=1)legend(2000,25000,c(“农村居民人均纯收入”,“城镇居民人均可支配收"),col=c(1,1),text.col="black",lty=c(2,1),pch=c(-1,4))#生成图表的注释,参数“pch=”控制所生成图形的符号类型2023/1/5《统计学实验》第10章数据的描述10-39图10.52000~2014年我国农村居民人均纯收入及城镇居民人均可支配收入线图运行结果2023/1/5《统计学实验》第10章数据的描述10-40【例10.8】(数据文件为li10.5.txt)沿用例10.5某大学50名教师年龄原始数据,用R软件绘制茎叶图。

2023/1/5《统计学实验》第10章数据的描述10-41【统计理论】数值型数据经过整理后,除了用频数分布表(变量数列)将其展示出来,还可以用统计图来展示,例如茎叶图。2023/1/5《统计学实验》第10章数据的描述10-42【菜单方式】用stem()函数作茎叶图

x=read.table("li10.5.txt",header=T)#从li10.5.txt中读入样本数据xstem(x$JSHNL,scale=1,width=80,atom=1e-08)#scale控制绘出茎叶图的长度,scale=1即将10个个位数为两段,0~4为一段,5~9为另一段,width是绘图的宽度,atom是容差2023/1/5《统计学实验》第10章数据的描述10-43图10.6

某大学50名教师年龄的茎叶图Thedecimalpointis1digit(s)totherighofthe|2|42|77999993|00013343|55994|012334444|55566667777785|01235|596|046|78运行结果2023/1/5《统计学实验》第10章数据的描述10-4410.2描述性统计分析【例10.9】(数据文件为li10.5.txt)沿用例10.5某大学50名教师年龄原始数据,试用R软件描述统计功能,对这些年龄的特征进行描述性统计分析。2023/1/5《统计学实验》第10章数据的描述10-45【统计理论】数值型数据经过整理后,还需要进一步找出数据分布的特征,即数据的集中趋势、离散程度,数据分布的偏态和峰态。2023/1/5《统计学实验》第10章数据的描述10-46【软件操作】用max()函数计算样本的最大值,min()函数计算样本的最小值,mean()函数计算样本的均值,var()函数计算样本的方差,sd()函数计算样本标准差,median()给出观测值的中位数,sum()函数为求

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论