R软件介绍-课件_第1页
R软件介绍-课件_第2页
R软件介绍-课件_第3页
R软件介绍-课件_第4页
R软件介绍-课件_第5页
已阅读5页,还剩99页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

R软件简介R软件简介R语言的由来R语言是从S语言演变而来的。S语言是二十世纪70年代诞生于贝尔实验室,由RickBecker,JohnChambers,AllanWilks开发。基于S语言开发的商业软件Splus,可以方便的编写函数、建立模型,具有良好的扩展性,取得了巨大成功。1995年由新西兰Auckland大学统计系的RobertGentleman和RossIhaka,编写了一种能执行S语言的软件,并将该软件的源代码全部公开,这就是R软件,其命令统称为R语言。R语言的由来R语言是从S语言演变而来的。R软件简介R是开源软件,代码全部公开,对所有人免费。

R可在多种操作系统下运行,如Windows、Linux和UNIX等。

R需要输入命令,可以编写函数和脚本进行批处理运算,语法简单灵活。目前在R网站上约有两千多个程序包,涵盖了基础统计学、社会学、经济学、生态学、地理学、医学统计学、生物信息学等诸多方面。R软件简介R是开源软件,代码全部公开,对所有人下载和安装RTheComprehensiveR

ArchiveNetwork简称CRAN,提供下载安装程序和相应软件包。R主页/

下载和安装RTheComprehensiveRArchR登陆界面(Windows版)菜单栏快捷按钮控制台命令行R登陆界面(Windows版)菜单栏快捷按钮控制台命令行RGui的菜单介绍RGui的菜单介绍R程序包为什么要安装程序包?特定的分析功能,需要用相应的程序包实现。例如:系统发育分析,往往要用到ape程序包,群落生态学vegan包等等。程序包是什么?

R程序包是多个函数的集合,具有详细的说明和示例。Window下的R程序包是已经编译好的zip包。每个程序包包含R函数、数据、帮助文件、描述文件等。R程序包为什么要安装程序包?常用R程序包base-R基础功能包stats-R统计学包nlme-线性及非线性混合效应模型Graphics-绘图lattice-栅格图ape-

系统发育与进化分析apTreeshape-进化树分析seqinr-DNA序列分析ade4-

利用欧几里得方法进行生态学数据分析常用R程序包base-R基础功能常用R程序包cluster-聚类分析ecodist-生态学数据相异性分析mefa-

生态学和生物地理学多元数据处理mgcv-广义加性模型相关mvpart-多变量分解nlme-线性及非线性混合效应模型ouch-系统发育比较BiodiversityR-

基于Rcmdr的生物多样性数据分析vegan-植物与植物群落的排序,生物多样性计算常用R程序包cluster-聚类分析程序包使用在菜单栏程序包选择加载程序包…或者在控制台中输入如下命令:library()####()内为程序包名称调用程序包内的函数与R内置的函数调用方法一样程序包使用在菜单栏程序包选择加载程序包…查看帮助文件如何知道stats程序包内部都有哪些函数?最常用的方法:1菜单帮助>Html帮助2控制台中输入library(help="stats")查看帮助文件如何知道stats程序包内部都有哪些函数?查看帮助文件1

help("t.test")2

?t.test3

help.search("t.test")

4

apropos("t.test")5RGui>Help>R函数帮助(文本)…查看帮助文件1help("t.test")二数字、字符与向量二数字、字符与向量1、赋值与注释在控制台中键入如下命令2+2a<-2<-也可用=,->代替b<-2c<-a+bc#注释赋值符号演示结果演示结果1、赋值与注释在控制台中键入如下命令赋值符号演示结果演示结果少用(1)、向量赋值向量少用(1)、向量赋值向量(2)、向量的运算数学运算运算后给出数值结果+,-,*,/,^(常用运算符号)比较运算运算后给出判别结果(TRUEFALSE)>,<,<=,>=,==,!=逻辑运算与、或、非!,&,&&,|,||(2)、向量的运算数学运算运算后给出数值结果(2)、向量的运算(2)、向量的运算(2)、向量的运算(演示结果)(2)、向量的运算(演示结果)2、R软件中的函数每一个函数执行特定的功能,后面紧跟括号,例如:求和sum()绘图plot()排序sort()

除了基本的运算之外,R的函数又分为高级和低级函数,高级函数内部嵌套了复杂的低级函数,例如plot()是高级绘图函数,函数本身会根据数据的类型,经过程序内部的函数判别之后,绘制相应类型的图形,并有大量的参数可选择。2、R软件中的函数每一个函数执行特定的功能,后面紧跟括号,例计算log(x)log10(x)exp(x)sin(x)cos(x)tan(x)asin(x)acos(x)min(x)max(x)range(x)length(x)统计检验mean(x)sd(x)var(x)median(x)quantile(x,p)cor(x,y)t.test()lm(y~x)(1)、常用函数计算统计检验(1)、常用函数例子(P49.例2.1)某学校在体检时测得12名女中学生体重X1(千克)和胸围X2(厘米)资料如下表所示,计算体重与胸围的均值和标准差。例子(P49.例2.1)某学校在体检时测得1例子(P49.例2.1)平均值方差标准差判断两者之间的关系,是两者相关,还是两者无关,根据数值的大小进行判断接近1,相关,接近0,无关例子(P49.例2.1)平均值方差标准差判断两者之间的关系,例子(P49.例2.1)画出两者之间关系cor()与plot()联合使用例子(P49.例2.1)画出两者之间关系cor()与plot例子(P49.例2.1)频率直方图例子(P49.例2.1)频率直方图3、产生有规律的序列从2.316到6从4到7.63、产生有规律的序列从2.316到6从4到7.63、产生有规律的序列seq(起点,终点,长度)rep(向量,重复次数)3、产生有规律的序列seq(起点,终点,长度)rep(向量,4、缺失数据判断向量中是否有缺失数据4、缺失数据判断向量中是否有缺失数据5、字符型向量5、字符型向量6、向量下标运算(选取向量中某个数)选第二个数据修改向量x中第二个数据新的向量x修改向量中某个数值修改向量x中第一和第三个数值6、向量下标运算(选取向量中某个数)选第二个数据修改向量x中6、向量下标运算(选取向量中某个数)选第1,3,5,9个数值选第1至5个数值选倒数第1至5个数值6、向量下标运算(选取向量中某个数)选第1,3,5,9个数值三多维数组和矩阵三多维数组和矩阵1、数组和矩阵dim()和matrix()x<-1:12dim(x)<-c(3,4);x[,1][,2][,3][,4][1,]14710[2,]25811[3,]36912matrix.x<-matrix(1:12,nrow=3,byrow=T)行或列添加名称:s();s()行数目1、数组和矩阵dim()和matrix()行数目2、数组的运算+,-,*,/,^运算后给出数值结果2、数组的运算2、数组的运算求矩阵的维数2、数组的运算求矩阵的维数3、矩阵的运算3、矩阵的运算3、矩阵的运算例题3、矩阵的运算例题四列表与数据框四列表与数据框1、列表与数据框行名Rownames字符串列名Columnnames每列可看做带名称的向量表1数据表、数据框与向量字符串、因素每行作为一个观测1、列表与数据框行名Rownames列名Columnn2、列表(list)的创建列表可以是不同类型甚至不同长度的向量(数值型,逻辑型,字符型等等)、数据框甚至是列表的组合。list()例如list(character,numeric,logical,matrix)2、列表(list)的创建列表可以是不同类型甚至不同3、数据框(data.frame)的创建data.frame()

#生成数据框d<-data.frame(character,numeric,logical)cbind()

#

按列组合成数据框c.data<-cbind(character,numeric,logical)rbind()#按行组合成数据框3、数据框(data.frame)的创建data.frame4、列表的创建>list(1,matrix(2:9,nrow=2),"估计","FALSE")->x;x[[1]][1]1[[2]][,1][,2][,3][,4][1,]2468[2,]3579[[3]][1]"估计"[[4]][1]"FALSE"第一列内容第二列内容第三列内容第四列内容4、列表的创建>list(1,matrix(2:9,nro5、引用数据框中的元素d<-data.frame(a1,a2)$

引用d$a1[,]

方括号引用d[,1];d[5,]a1<-c(5260,5470,5640,6180,6390)a2<-c(3910,4220,3885,5160,5645)构成数据框选数据框中a1数据选数据框第1列数据选数据框第5行数据5、引用数据框中的元素d<-data.frame(a1,6、外部数据读取

最为常用的数据读取方式是用read.table()

函数或read.csv()函数读取外部txt或csv格式的文件。

txt文件,制表符间隔(Excel可以保存此类文件)

csv文件,逗号间隔(Excel可以保存此类文件)一些R程序包(如foreign)也提供了直接读取Excel,SAS,dbf,Matlab,spss,systat,Minitab文件的函数。6、外部数据读取最为常用的数据读取方式是用read.tread.table()的使用例:test.data<-read.table("D:/R/test2.txt",header=T)header=T表示将数据的第一行作为标题。read.table(file=file.choose(),header=T)

可以弹出对话框,选择文件。read.table()的使用例:test.data<-re例题:六名患者的身高和体重现有6名患者的身高和体重,检验体重除以身高的平方是否等于22.5。例题:六名患者的身高和体重现有6名患者的身高第一种方式:从控制台输入数据(数据较少)数据量较少时可以从控制台直接输入:height<-c(1.75,1.80,1.65,1.90,1.74,1.91)weight<-c(60,72,57,90,95,72)sq.height<-height^2ratio<-weight/sq.heightt.test(ratio,mu=22.5)第一种方式:从控制台输入数据(数据较少)数据量较少时可以从控第一种方式:从控制台输入数据(数据较少)第一种方式:从控制台输入数据(数据较少)第二种方式从外部读取数据(数据量较大)数据量较大时用read.table函数从外部txt文件读取第1步改变R软件工作目录(文件改变工作目录)第2步将Excel中的数据另存为.txt格式(制表符间隔)或.csv格式。第3步用read.table()或read.csv()函数将数据读入R工作空间,并赋值给一个对象。第二种方式从外部读取数据(数据量较大)数据量较大时用rea

在Excel中将数据存为txt文件在Excel中将数据存为txt文件一般从txt文档读取数据。每一行作为一个观测值。每一行的变量用制表符,空格或逗号间隔开。read.table(”位置”)read.csv(”位置”)#从外部读取数据data1<-read.table("d:/t.test.data.txt",header=T)bmi<-data1$weight/data1$height^2t.test(bmi,mu=22.5)#t检验读txt文件读csv文件例题(此时数据为数据框)一般从txt文档读取数据。每一行作为一个观测值。每一行的变量总结R是开源的统计绘图软件,也是一种自解释的语言,有大量的程序包可以利用。R中的向量、列表、数组、统计结果等都是对象,可以方便的生成所需对象,并进行筛选。R脚本是输入的多个命令行。R具有精确控制的绘图功能,生成的图可以另存为多种格式。R编写函数无需声明变量的类型,能利用循环、条件语句,控制程序的流程。总结R是开源的统计绘图软件,也是一种自解释的语言,有大量ThankYou!ThankYou!R软件简介R软件简介R语言的由来R语言是从S语言演变而来的。S语言是二十世纪70年代诞生于贝尔实验室,由RickBecker,JohnChambers,AllanWilks开发。基于S语言开发的商业软件Splus,可以方便的编写函数、建立模型,具有良好的扩展性,取得了巨大成功。1995年由新西兰Auckland大学统计系的RobertGentleman和RossIhaka,编写了一种能执行S语言的软件,并将该软件的源代码全部公开,这就是R软件,其命令统称为R语言。R语言的由来R语言是从S语言演变而来的。R软件简介R是开源软件,代码全部公开,对所有人免费。

R可在多种操作系统下运行,如Windows、Linux和UNIX等。

R需要输入命令,可以编写函数和脚本进行批处理运算,语法简单灵活。目前在R网站上约有两千多个程序包,涵盖了基础统计学、社会学、经济学、生态学、地理学、医学统计学、生物信息学等诸多方面。R软件简介R是开源软件,代码全部公开,对所有人下载和安装RTheComprehensiveR

ArchiveNetwork简称CRAN,提供下载安装程序和相应软件包。R主页/

下载和安装RTheComprehensiveRArchR登陆界面(Windows版)菜单栏快捷按钮控制台命令行R登陆界面(Windows版)菜单栏快捷按钮控制台命令行RGui的菜单介绍RGui的菜单介绍R程序包为什么要安装程序包?特定的分析功能,需要用相应的程序包实现。例如:系统发育分析,往往要用到ape程序包,群落生态学vegan包等等。程序包是什么?

R程序包是多个函数的集合,具有详细的说明和示例。Window下的R程序包是已经编译好的zip包。每个程序包包含R函数、数据、帮助文件、描述文件等。R程序包为什么要安装程序包?常用R程序包base-R基础功能包stats-R统计学包nlme-线性及非线性混合效应模型Graphics-绘图lattice-栅格图ape-

系统发育与进化分析apTreeshape-进化树分析seqinr-DNA序列分析ade4-

利用欧几里得方法进行生态学数据分析常用R程序包base-R基础功能常用R程序包cluster-聚类分析ecodist-生态学数据相异性分析mefa-

生态学和生物地理学多元数据处理mgcv-广义加性模型相关mvpart-多变量分解nlme-线性及非线性混合效应模型ouch-系统发育比较BiodiversityR-

基于Rcmdr的生物多样性数据分析vegan-植物与植物群落的排序,生物多样性计算常用R程序包cluster-聚类分析程序包使用在菜单栏程序包选择加载程序包…或者在控制台中输入如下命令:library()####()内为程序包名称调用程序包内的函数与R内置的函数调用方法一样程序包使用在菜单栏程序包选择加载程序包…查看帮助文件如何知道stats程序包内部都有哪些函数?最常用的方法:1菜单帮助>Html帮助2控制台中输入library(help="stats")查看帮助文件如何知道stats程序包内部都有哪些函数?查看帮助文件1

help("t.test")2

?t.test3

help.search("t.test")

4

apropos("t.test")5RGui>Help>R函数帮助(文本)…查看帮助文件1help("t.test")二数字、字符与向量二数字、字符与向量1、赋值与注释在控制台中键入如下命令2+2a<-2<-也可用=,->代替b<-2c<-a+bc#注释赋值符号演示结果演示结果1、赋值与注释在控制台中键入如下命令赋值符号演示结果演示结果少用(1)、向量赋值向量少用(1)、向量赋值向量(2)、向量的运算数学运算运算后给出数值结果+,-,*,/,^(常用运算符号)比较运算运算后给出判别结果(TRUEFALSE)>,<,<=,>=,==,!=逻辑运算与、或、非!,&,&&,|,||(2)、向量的运算数学运算运算后给出数值结果(2)、向量的运算(2)、向量的运算(2)、向量的运算(演示结果)(2)、向量的运算(演示结果)2、R软件中的函数每一个函数执行特定的功能,后面紧跟括号,例如:求和sum()绘图plot()排序sort()

除了基本的运算之外,R的函数又分为高级和低级函数,高级函数内部嵌套了复杂的低级函数,例如plot()是高级绘图函数,函数本身会根据数据的类型,经过程序内部的函数判别之后,绘制相应类型的图形,并有大量的参数可选择。2、R软件中的函数每一个函数执行特定的功能,后面紧跟括号,例计算log(x)log10(x)exp(x)sin(x)cos(x)tan(x)asin(x)acos(x)min(x)max(x)range(x)length(x)统计检验mean(x)sd(x)var(x)median(x)quantile(x,p)cor(x,y)t.test()lm(y~x)(1)、常用函数计算统计检验(1)、常用函数例子(P49.例2.1)某学校在体检时测得12名女中学生体重X1(千克)和胸围X2(厘米)资料如下表所示,计算体重与胸围的均值和标准差。例子(P49.例2.1)某学校在体检时测得1例子(P49.例2.1)平均值方差标准差判断两者之间的关系,是两者相关,还是两者无关,根据数值的大小进行判断接近1,相关,接近0,无关例子(P49.例2.1)平均值方差标准差判断两者之间的关系,例子(P49.例2.1)画出两者之间关系cor()与plot()联合使用例子(P49.例2.1)画出两者之间关系cor()与plot例子(P49.例2.1)频率直方图例子(P49.例2.1)频率直方图3、产生有规律的序列从2.316到6从4到7.63、产生有规律的序列从2.316到6从4到7.63、产生有规律的序列seq(起点,终点,长度)rep(向量,重复次数)3、产生有规律的序列seq(起点,终点,长度)rep(向量,4、缺失数据判断向量中是否有缺失数据4、缺失数据判断向量中是否有缺失数据5、字符型向量5、字符型向量6、向量下标运算(选取向量中某个数)选第二个数据修改向量x中第二个数据新的向量x修改向量中某个数值修改向量x中第一和第三个数值6、向量下标运算(选取向量中某个数)选第二个数据修改向量x中6、向量下标运算(选取向量中某个数)选第1,3,5,9个数值选第1至5个数值选倒数第1至5个数值6、向量下标运算(选取向量中某个数)选第1,3,5,9个数值三多维数组和矩阵三多维数组和矩阵1、数组和矩阵dim()和matrix()x<-1:12dim(x)<-c(3,4);x[,1][,2][,3][,4][1,]14710[2,]25811[3,]36912matrix.x<-matrix(1:12,nrow=3,byrow=T)行或列添加名称:s();s()行数目1、数组和矩阵dim()和matrix()行数目2、数组的运算+,-,*,/,^运算后给出数值结果2、数组的运算2、数组的运算求矩阵的维数2、数组的运算求矩阵的维数3、矩阵的运算3、矩阵的运算3、矩阵的运算例题3、矩阵的运算例题四列表与数据框四列表与数据框1、列表与数据框行名Rownames字符串列名Columnnames每列可看做带名称的向量表1数据表、数据框与向量字符串、因素每行作为一个观测1、列表与数据框行名Rownames列名Columnn2、列表(list)的创建列表可以是不同类型甚至不同长度的向量(数值型,逻辑型,字符型等等)、数据框甚至是列表的组合。list()例如list(character,numeric,logical,matrix)2、列表(list)的创建列表可以是不同类型甚至不同3、数据框(data.frame)的创建data.frame()

#生成数据框d<-data.frame(character,numeric,logical)cbind()

#

按列组合成数据框c.data<-cbind(character,numeric,logical)rbind()#按行组合成数据框3、数据框(data.frame)的创建data.frame4、列表的创建>list(1,matrix(2:9,nrow=2),"估计","FALSE")->x;x[[1]][1]1[[2]][,1][,2][,3][,4][1,]2468[2,]3579[[3]][1]"估计"[[4]][1]"FALSE"第一列内容第二列内容第三列内容第四列内容4、列表的创建>list(1,matrix(2:9,nro5、引用数据框中的元素d<-data.frame(a1,a2)$

引用d$a1[,]

方括号引用d[,1];d[5,]a1<-c(5260,5470,5640,6180,6390)a2<-c(3910,4220,3885,5160,5645)构成数据框选数据框中a1数据选数据框第1列数据选数据框第5行数据5、引用数据框中的元素d<-data.frame(a1,6、外部数据读取

最为常用的数据读取方式是用read.table()

函数或read.csv()函数读取外部txt或csv格式的文件。

txt文件,制表符间隔(Excel可以保存此类文件)

csv文件,逗号间隔(Excel可以保存此类文件)一些R程序包(如foreign)也提供了直接读取Excel,SAS,dbf,Matlab,spss,systat,Minitab文件的函数。6、外部数据读取最为常用的数据读取方式是用read.tread.table()的使

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论