R语言试验指导书二_第1页
R语言试验指导书二_第2页
R语言试验指导书二_第3页
R语言试验指导书二_第4页
R语言试验指导书二_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、R语言实验指导书(二)2016年10月27日实验三创建和使用R语言数据集实验目的:1,了解R语言中的数据结构。2,熟练掌握他们的创建方法,和函数中一些参数的使用。3,对创建的数据结构进行,排序、查找、删除等简单的操作。实验内容:1,向量的创建及因子的创建和查看有一份来自澳大利亚所有州和行政区的20个税务会计师的信息样本1以及他们各自所在地的州名。州名为:tas,sa,qld,nsw,nsw,nt,wa,wa,qld,vic,nsw,vic,qld,qld,sa,tas,sa,nt,wa,vic。1)将这些州名以字符串的形式保存在state当中。2)创建一个为这个向量创建一个因子statef。3

2、)使用levels函数查看因子的水平。鼻version3+3.1(2016-06-21)-inYaurCcpyrz.gnt(C)2316TrieRFc'j.ndazicnforstatisticalCcrr.ptingFlaisfcirm:i3S6-w64-rLingw32/i3.56(32-biT:R是自主式件,不帝三何担保;在某茎条件下弥可以将其5士里布二1二二与二"(),或'11Suez(,三看久三的详细条件uR是个合作计划r有讦多人为之密三了贡献.*contributors(j,束着合年者的详细情况尾,citaticE()会告诉会为何在出版,蚣=壬磺地引尾R或

3、R桂序刍亚丽什来看一些示花曼字,年来阅读在线帮助文件,或二y.w.h,遭过三二1仁区,点魂天看芭处女斗;q(),遢巳R.> stacs<-cIta,.m良/qdfzawrnswfr.tfwa,wafqxdr丫工c,nswrVLCfqlafqdf建菱二技K至:对象Fa> 5cace<-c»Hca3",ns,Irqldhl,"nsw*1,Hswnrnr.zH,"Ha”,Hwa0,"r二日"vic1> fact:ir(state)1tassaqldnawnswntwawaqldvicnawvicqldqlti3

4、atassantLevels:r.sv匚二qldsa-aavicwa> levels(stains)NULL> =ta-ef<-fac(5tate)> levels(atatef)1"nswN”口tnT,qldMnB&r,ntasrrT,vicnnw*T,2 .矩阵与数组I.创建一个4*5的数组如图,创建一个索引矩阵如图,用这个索引矩阵访问数组,观察结果。JL39L.3JL4J>(1:20,cif5)>>nyarray> arrays:jir.a-rix<:31,myra匚=£乂:二:3:)运二矢:意夕卜白勺,i

5、n"my五ttmyrtyrLa工工二宜二工:日"mv21at工二k二:三:卜> myarray匚tL*:;3:*TAtrix;1:->:3 .将之前的state,数组,矩阵合在一起创建一个长度为3的列表。>mcList误:找不芝对言FG'mL>mylistI-,'c.H*sa*nqldH"rsr"HnBwn"nt"wa*1*'qld*1*'vic*flnBWnf(vicn"q二。591361014"11IS°12164.创建一个数据框如图。Mazda

6、RX4MazdaRX4wagDatsun710Hornet4Drivempg21.021.022.821.4cyl6646disp160.0160.0108.0258.0hp11011093110drat3.903.903.853.08fl”f"drac,1i5.将这个数据框按照mpg列进行排序。>frtreZeadvarj>iLydauaJ.L.Jhpwtd工1二Mazd*RX421.0IIO-2,6203.打MazdaRX4Waa21.011:'2.门53*90己士巴二H-10.59三;.3;:'3.E5Herne-4Drtve21.41103.215

7、3.二,£kernesSpcrtatcjic53.4403.15la二二arx1033.4SO2.7S>n:ydata:order(mydatat-tdecreasing=T),hp片七dratDatsun一二。fG金上日9S2.3203三5行门"门户一色;1甘7耳?巨一-.4_1,_21,4【工二3.2155.”l-l£Zd£RX421,01122,6203.90Ilezd4神弓Waq21.011J2.丁53.5QCorneroporuabo'Ji;.二.L53.15Valia*l1053.46:'2.766.访问数据框中drat

8、列值为3.90的数据>mydata:中三ieg(myda3aidrar=3.9。),mpghpjxdrat;MazdaRX4211102.6203.9I-Uzd&RX3Wag211102.三53.9H实验要求要求学生熟练掌握向量、矩阵、数据框、列表、因子的创建和使用实验四数据的导入导由实验目的1.熟练掌握从一些包中读取数据。2,熟练掌握csv文件的导入。3.创建一个数据框,并导出为csv格式实验内容1,创建一个csv文件(内容自定),并用readtable函数导入该文件。2.查看R语言自带的数据集airquality(纽约1973年5-9月每日空气质量)。.歹!J出

9、airquality查看airquality查看airquality的前十列,并将这前十列保存到air中。中列的对象类型。数据集中各成分的名称将air这个数据框导出为csv格式文件(write.table(x,file="",sep="",s=TRUE,s=TRUE,quote=TRUE)实验要求要求学生掌握从包中读取数据,导入csv文件的数据,并学会将文件导出实验五R语言数据的清洗实验目的1,查看数据集的缺失值,并学会对缺失值进行处理。2.对异常变量重新赋值。3,将某一列的字符型转化为日期型。4.利用subset()获取

10、子集。实验内容1,有一个数据框代码如下,使用summary函数查看,那一列含有缺失值,有几个。并查看wind列的最大值。Ozone<-c(41,36,12,18,NA,28)Solar.R<-c(190,118,149,313,NA,NA)wind<-c(7,4,8.0,12.6,11.5,14.3,14.9)Temp<-c(67,82,74,62,86,66)date<-c(”1997/05/01",”1997/05/02",”1997/05/03",”1997/05/04”,"1997/05/05","

11、;1997/05/06")air<-data.frame(date,Ozone,Solar.R,wind,Temp,stringsAsFactors=FALSE)2,使用class()函数查看date函数的类型,并将其转化为data型,格式为月/日/3,使用subset()根据Tem的!J获取air中Temp大于60小于70的数据。4,将air中含有缺失值的列去掉。5,找出Temp中大于85的值将其设置为缺失值。6.创建一个air1包含两个列q1,q2。用cbind函数添加到air中。7,使用names函数查看air的列名,并根据列自己创建一个数据框。使用rbind函数添加到a

12、ir中实验要求要求学生会用subset获取子集,学会对缺失值进行一些简单的处理和对一些异常值的查找和修改。实验六高级数据管理实验目的1 .学会简单的数值和字符处理函数。2 .学会自己编写一个函数。实验内容1 .使用下面代码创建roster数据集。Student<-c("JohnDavis","AngelaWilliams","BullwinkleMoose","DavidJones","JaniceMarkhammer","CherylCushing","Re

13、uvenYtzrhak","GregKnox","JoelEngland","MaryRayburn")Math<-c(502,600,412,358,495,512,410,625,573,522)Science<-c(95,99,80,82,75,85,80,95,89,86)English<-c(25,22,18,15,20,28,15,30,27,18)roster<-data.frame(Student,Math,Science,English,stringsAsFactors=FALSE)

14、2 .使用length函数查看Student的长度。3 .计算该班级数学的平均成绩,最高成绩。4 .将成绩单按照姓和名进行排序,将学生的各科考试成绩组合为单一的成绩衡量指标、基于相对名次(前20%,下20%等等)给出从A到F的评分。1) 使用quantile函数按20%40%60%80%,求分位数。2) 使用变量重命名的方法将grade列分为A、BGDF几个等级。3) 使用strsplit函数将Student列的名字分割,存到name中。4) 创建一个函数x1,功能为实现返回值为传入参数的第一个值。5) 使用sapply函数将name中的firstname提取出来。(“sapply(data,

15、function)”)同理即可提取出lastname06) 将lastname和firstname与roster合并,同时去掉roster的第一列。7) 将成绩单用姓和名进行排序。实验要求要求学生学会一些简单的数值和字符处理函数。学会如何自己创建一个函数。和对一些简单问题的处理。实验七基本统计分析实验实验目的1.学会使用summary函数和Hmisc包中的describe函数来计算统计量。2,使用table函数生成一维、二维、多维列联表。3 .学会用R实现卡方独立性检验。4 .学会用R进行相关性的度量。5 .学会用R进行Pearson、SpearmanftKendall相关。6 .学会用R进行

16、相关性的显著性检验。7 .学会用R进行组间差异的非参数检验。实验内容1.描述性统计分析1)对R自带的数据集rock(48块石头的形态数据)使用summary函数、Himisc包中的describe函数、pastecs包中的stats.desc函数计算描述性统计量2) 使用aggregate、doby中的summaryBy对sleep数据集的group歹!J分组获取描述性统计量。2,频数表和列联表1)加载vcd包中的Arthritis数据集使用table生成简单的频数统计表。2)使用table、xtabs对Arthritis生成二维列联表。并使用addmargins为这些表格添加边际和(根据Treatment>Improved)03)使用xtabs,table生成三维列联表(根据Treatment>sex>Improved三个因子)。4)使用chisq.testhan()函数对二维表的行和列进行卡方独立性检验,并观察他们是否独立。5)使用vcd包中的assocstats()函数计算二维列联表的phi系数、列联系数和Cramer'sV系数。3.相关1)Pearson、Spearman和Kendall相关a)对state,x77数据集计算方差和协方差、Pearson积差相关系数、Spearman等级相关系数。b)使用psych

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论