




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、R语言基础R简介R语言的基本语法R语言的数据结构数据的存储与读取简单的R会话Robert Gentleman Ross Ihaka R简介R语言的产生R语言的创始人R语言是一个开放(GPL)的统计编程环境一种语言,是语言的一种方言(dialect) 之一,另一则为S-plus.一种软件,是集统计分析与图形直观显示于一体的统计分析R简介多领域的统计资源 目前在R网站上约有4849个程序包,涵盖了基础统计学、社会学、经济学、生态学、空间分析、系统发育分析、生物信息学等诸多方面。跨平台 R可在多种操作系统下运行,如Windows、MacOS、多种Linux和UNIX等。命令行驱动 R即时解释,输入命
2、令,即可获得相应的结果。5R简介R语言的特点R是完全免费的R嵌入了一个非常实用的帮助系统R具有很强的作图能力我们将R程序容易地移植到S-Plus程序中,反之S的许多过程直接或稍作修改用于R通过R语言的许多内嵌统计函数,很容易学习和掌握R语言的语法我们可以编制自己的函数来扩展现有的R语言(这就是为什么它在不断等级完善!)R简介R语言的特点计划的网站: 了解有关的最新信息和使用说明,得到最新版本的软件和基于的应用统计软件包. R简介R简介R简介R简介下载安装启动R-GUI(R Graphic Users Interface)R简介R语言的安装与运行R GUI (graphic users inte
3、rface)的主窗口, 它由三部分组成:主菜单、工具条、R console (R的运行窗口) R简介从左至右依次为:打开程序脚本加载工作空间保存工作空间复制粘贴复制并粘贴中断当前计算打印R简介R工具条主要工作是在R console里通过发布命令来完成的,包括数据集的建立,数据的分析,作图等。 R是按照问答的方式运行的,即在命令提示符“”后键入命令并回车,R就完成了一些操作。在这里你可以得到在线帮助: help.start() HTML格式的关于R的帮助文件 help() 得到相应函数的帮助,例如help(plot) demo() 得到R提供的几个示例 q() 退出R R简介R consoleR
4、简介程序包是什么?R程序包是多个函数的集合,具有详细的说明和示例Windows下的R程序包是经过编译的zip包每个程序包包含R函数、数据、帮助文件、描述文件等为什么要安装程序包?R程序包是R功能扩展,特定的分析功能,需要用相应的程序包实现例如:生物信息学分析,系统发育分析等命令方式:在已经联网的条件下,在命令提示符后键入install.packages(“程序包的名称”) 完成程序包的安装新安装的程序包在使用前必须先载入,有两种方式:菜单方式:“程序包=载入程序包”命令方式: library(“程序包名称”)来加载程序包。可以通过“程序包=更新程序包”实现实时更新。R简介R简介R语言的基本语法
5、R语言的数据结构数据的存储与读取简单的R会话1、符号1) 命令或运算提示符2) + 续行符3) # 说明语句字符2、赋值符号1) 大于2) =大于等于 4)= 小于等于5)= 等于6) != 不等于比较运算得到的结果是逻辑常量TRUE(真)和FALSE(假)。R语言的基本语法5、求助符号1) ?2) help()R语言的基本语法6、常量和变量1)常量是其值不变的量,如1234,“abc等数值、字符串和逻辑值等。2)变量是其值可变的量,如x-3,x就是一个变量,当xxmode(x)1 numericlength(x)1 1R语言的数据结构1)建立数值型向量数值型向量是统计分析中最常用的向量,可以
6、用下面几个函数建立:(1)seq( )或“:” #若向量序列具有较为简单的规律(2)rep( ) #若向量序列具有较为复杂的规律(3)sequence() #输出从1到参数的向量(4)c( )#若向量序列没有什么规律(5)scan( ) #通过键盘逐个输入R语言的数据结构2. 向量的建立(向量:一系列元素的组合)1、n1:n2 #生成从n1到n2步长为1(或-1)的向量R语言的数据结构例如: 1:101 1 2 3 4 5 6 7 8 9 10 a-1;b 1:(10-1)1 1 2 3 4 5 6 7 8 9 1:10-11 0 1 2 3 4 5 6 7 8 9 2、seq(n1,n2,b
7、y=n3,length=n4) #生成从n1到n2的向量, n3为步长,n4为生成元素的数量 R语言的数据结构例如: seq(1,10)1 1 2 3 4 5 6 7 8 9 10 seq(1,10,by=0.5)1 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 10.0 seq(1,10,length=11)1 1.0 1.9 2.8 3.7 4.6 5.5 6.4 7.3 8.2 9.1 10.03、rep(n1,n2) #生成n1重复n2次的向量R语言的数据结构例如: rep(2,3)1 2
8、 2 2 rep(1:5,2)1 1 2 3 4 5 1 2 3 4 5 rep(1:5,1:5)1 1 2 2 3 3 3 4 4 4 4 5 5 5 5 5 rep(1:5,rep(2,5)1 1 1 2 2 3 3 4 4 5 54、c() #直接输出向量 5、scan() #通过键盘建立向量 R语言的数据结构例如: x=c(42,7,64,9) length(x)例如: scan()1: 1 3 6 8 #此行末回车5: #冒号后直接打回车Read 4 items1 1 3 6 86、sequence(n1) #生成从1开始到n1结束步长为1的向量 R语言的数据结构例如: sequen
9、ce(5)1 1 2 3 4 5 sequence(c(5,5)1 1 2 3 4 5 1 2 3 4 5 sequence(c(5,4)1 1 2 3 4 5 1 2 3 4 2) 数值型向量的运算 向量的运算方法如下:(1)向量与一个常数的加、减、乘、除为向量的每一个元素与此常数进行加、减、乘、除;(2)向量的乘方()与开方(sqrt)为每一个元素的乘方与开方,这对log,exp,sin,cos,tan 等普通的运算函数同样适用;(3)同样长度向量的加、减、乘、除等运算为对应元素进行加、减、乘、除等;(4)不同长度向量的加、减、乘、除遵从循环法则(recycling rule)R语言的数据
10、结构2. 向量的建立循环法则: 同一个表达式中的向量并不需要具有相同的长度,如果它们的长度不同,表达式的结果是一个与表达式中最长向量有相同长度的向量,表达式中较短的向量会根据它的长度被重复使用若干次(不一定是整数次),直到与长度最长的向量相匹配,而常数将被不断重复。R语言的数据结构R语言的数据结构例如: 5+c(4,7,17)1 9 12 22 5*c(4,7,17)1 20 35 85 c(-1,3,-17)+c(4,7,17)1 3 10 0 c(2,4,5)21 4 16 25例如: sqrt(c(2,4,25)1 1.414214 2.000000 5.000000 1:2+1:41
11、2 4 4 6 1:4+1:71 2 4 6 8 6 8 10警告信息:In 1:4 + 1:7 : 长的对象长度不是短的对象长度的整倍数3、数组与矩阵的建立数组是一个k(1)维的数据表,矩阵是数组的一个特例,其维数k=2,向量可以看成维数为k=1的数组。而且向量、数组或者矩阵中的所有元素都必须是同一种类型的。1)数组的建立格式: array(data,dim,dimnames)其中data为一向量,其元素用于构建数组;dim为数组的维数向量; dimnames为由各维的名称构成的向量(字符型),缺省为空。 R语言的数据结构其中,dim=c(3,4,2) 第一个3代表有3行,第二个4代表有4列
12、,第三个2代表有2组。 R语言的数据结构例如: A A, , 1 ,1 ,2 ,3 ,41, 1 4 7 102, 2 5 8 113, 3 6 9 12, , 2 ,1 ,2 ,3 ,41, 1 4 7 102, 2 5 8 113, 3 6 9 122)矩阵的建立R语言的数据结构例如: A A A A A A由于矩阵在数学及统计中的特殊性,在R中最为常用的是使用命令matrix( )建立矩阵。格式:matrix(data=NA,nrow=1,ncol=1,byrow=FALSE,dimnames=NULL)其中data是一个向量数据,nrow是矩阵的行数,ncol是矩阵的列数,当byrow
13、=TRUE时,生成矩阵的数据按行放置,缺省时相当于byrow=FALSE,数据按列放置。dimnames是数组维的名字,缺省时为空。R语言的数据结构注意:循环准则仍然适用于matrix(),但是要求数据项的个数等于矩阵的列数的倍数,否则会出现警告。R语言的数据结构例如: X X X X A A统计函数作用max(x)返回向量x中最大的元素min(x)返回向量x中最小的元素mean(x)计算样本(向量)x的均值median(x)计算样本(向量)x的中位数var(x)计算样本(向量)x的方差sd(x)计算向量x的标准差length(x)返回向量x的长度sum(x)给出向量x的总和cumsum(x)
14、返回向量x和累积和(其第i个元素是从x1到xi的和)cumprod(x)返回向量x和累积积(其第i个元素是从x1到xi的积)cummin(x)返回向量x和累积最小值(其第i个元素是从x1到xi的最小值)cummax(x)返回向量x和累积最大值(其第i个元素是从x1到xi的最大值)cov(x,y)计算样本(向量)x与y的协方差cor(x,y)计算样本(向量)x与y的相关系数R简介R语言的基本语法R语言的数据结构数据的存储与读取简单的R会话数据的存储与读取1、R的工作目录命令方式: 获取工作目录的函数:getwd() 修改工作目录的函数:setwd()菜单方式: 文件菜单中的“改变工作目录”注:R
15、命令中目录的分割符使用正斜杠“/”或两个反斜杠“”。 getwd()1 D:/我的文档 setwd(f:/r) getwd()1 f:/r“ setwd(f:r)错误于setwd(f:r) : 无法改变工作目录2、数据保存为文件函数:write.table(data,file,s=T,quote=T)说明:data一般为数据框,也可以是(向量,矩阵,数组,列表等),s为行号,quote为引号,默认为True。数据的存储与读取函数: save(data,file=filename) save.image()说明:保存空间的映像。注:在R退出时系统自动保存两个文件,即.Rdata和.Rhistor
16、y。两个文件的作用分别为保存内存变量值和保存历史命令。所以如果想再次打开R时,能够调用曾经的命令,仅执行save.image()是不够的,需要保存历史记录为.Rhistory文件才可以。数据的存储与读取R简介R语言的基本语法R语言的数据结构数据的存储与读取简单的R会话数据的描述?mtcarsmtcar:美国Motor Trend杂志收集的32辆汽车(1973-1974车型)的11项指标。简单的R会话-例1简单的R会话-例1数据的浏览所有数据mtcars 前6个观测值head(mtcars)后6个观测值tail(mtcars)简单的R会话-例1数据的编辑方法一:data.entry(mtcars
17、)方法二:MTcarsfix(mtcars)区别:edit()修改结果不存入mtcars中;fix()结果保存至mtcars中。简单的R会话-例1某学校体检测得10名女中学生体重X1(千克)和身高X2(厘米)资料如表1所示,试计算体重与身高的均值与标准差学生 编号体重X1身高X2学生编号体重X1身高X21421566481622451587461573481618491594511569501635441531053165简单的R会话-例2【注】样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。标准差越高,表示实验数据越离散,也就是说越不精确。反之,
18、标准差越低,代表实验的数据越精确。简单的R会话-例2 # 输入体重数据 X1 mean(X1) #计算体重的均值1 47.6 sd(X1) #计算体重的标准差1 3.373096 #输入身高数据 X2 mean(X2)#计算身高的均值1 159sd(X2)#计算身高的标准差1 3.711843简单的R会话-例2绘制示例一中12名学生体重与身高的散点图和体重的直方图。 X1 X2 plot(X1,X2)简单的R会话-例2hist(X1)直方图中数据分为若干组,组宽度代表组内数据值范围,高度代表出现的频度。简单的R会话-例2 统计实例一家保险公司收集到由36个投保个人组成的随机样本,得到每个投保人的年龄(周岁)数据如表所示。试确定投保人平均年龄90%的置信区间。233539273644364246433133425345544724342839364440394938344850343945484532简单的R会话-例3注:置信区间是指数据可靠程度的范围。90%指置信水
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年城市生活垃圾分类处理公众参与宣传效果评估与长效机制研究报告
- 血透管防感染护理
- 长期家庭氧疗的护理指导
- 2025商业大楼写字间租赁合同范文
- 2025二手房买卖合同违约仲裁申请模板
- 三年级数学计算题专项练习及答案集锦
- 云南警官学院《可编程控制技术(PC)课程设计》2023-2024学年第二学期期末试卷
- 腰间盘突出的护理要点
- 上海外国语大学贤达经济人文学院《国际金融学双语》2023-2024学年第二学期期末试卷
- 武昌工学院《化工环境保护概论》2023-2024学年第二学期期末试卷
- 2024年广东省广州市市中考化学试卷真题(含答案)
- 2023-2024学年广东省珠海市八年级(下)期末数学试卷(含答案)
- 清华大学2024年强基计划数学试题(解析)
- 四川省德阳市2023-2024学年七年级下学期期末语文试题
- JBT 5300-2024 工业用阀门材料 选用指南(正式版)
- DZ/T 0462.7-2023 矿产资源“三率”指标要求 第7部分:石英岩、石英砂岩、脉石英、天然石英砂、粉石英(正式版)
- 2024春期国开电大本科《古代小说戏曲》在线形考(形考任务1至4)试题及答案
- 大学生劳动就业法律问题解读-知到答案、智慧树答案
- MOOC 行政管理学-西北大学 中国大学慕课答案
- 消防设施维护保养记录表
- 【语文】《装在套子里的人》 同步课件 2023-2024学年高一语文(统编版必修下册)
评论
0/150
提交评论