




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、R语言与数据可视化chaijin诺禾致源转录调控事业部主要内容R语言绘图的讲解绘图实例介绍R语言简介开源:免费;各种扩展包;Bioconductor;易学:零编程基础也快速上手统计:R Development Core Team由统计学家组成作图:ggplot2其他:、语言、环境,跨R 语言终端RGui通过R 语言的终端可以进行交互操作,对学习R 语言帮助巨大。RGui新一代R工作环境RStudioRstudio 提供一个高度集成的工作环境。R程序包安装1、连网时,用函数install.packages()选择镜像后,程序将自动并安装程序包。例如:打开,在控制台输入install.packag
2、es(ggplot2) 2、安装本地zip包路径:Packagesinstall.packages from local fileszip包的文件夹。选择光盘或者本地磁盘上https:/3、加载程序包,用函数library()例如: library(ggplot2)R程序包安装install.packages(ggplot2)install.packages(reshinstall.packages(gplots)2)install.packages(VennDiagram)install.packages(pheatmap)install.packages(plotrix)install.p
3、ackages(scattlot3d)未安装或者安装未成功TRD包安装TRD包成功安装TRD包数据可视化可视化是利用计算机图形和图像处理技术,将数据转换成图形或者图像在屏幕上显示出来,并进行交互处理的理论,方法和技术。可视化展现形式:气泡图、 流程图、树、平行坐标轴、矩阵图、时间轴、散点图、折线图、网络图、地图、图、热力图等转录组的数据可视化R绘图功能绘图参数文本和符号的大小、点的类型和颜色、线的类型、颜色、字体等绘图函数高级绘图函数和低级绘图函数绘图参数:设置文本和符号的大小绘图参数:设置点的类型pch=0到14时,点是空心的,col可以设置边框颜色。 pch=15到20是实心的,col可以
4、设置其填充颜色。pch=21到25实心点,col可以设置其边框,bg可以设置其填充颜色绘图参数:设置线的类型绘图参数:设置颜色绘图参数:设置颜色绘图参数:设置字体其他绘图参数help(par)绘图函数的分类高级(high-level)绘图函数在图形设备上产生一个新的绘图区域,并生成一个新的图形通过其参数可以设置坐标轴,标题等等低级(low-level)绘图函数在已存在的图形上加上的图形元素,是绘制图形的基础函数如额外的点、线、多边形和R的高级绘图函数:plot()plot()是最常用R绘图函数,是一个泛型函数,它产生的图形依赖于第一个参数的类型或者类plot(mtcars$wt,mtcars$
5、mpg)R的高级绘图函数:plot()set.seed(1); x - sset.seed(2); y - sxy - cbind(x, y)le(c(1:50),10)le(c(1:50),10)f x - mtcarsorder(mtcars$mpg), # sort by mpg x$cyl - factor(x$cyl) # it must be a factor x$colorx$cyl=4 - redx$colorx$cyl=6 - blue x$colorx$cyl=8 x - c(1:5); y - x; par(pch=22, col=red); par(mfrow=c(2,
6、4)opts - c(p,l,o,b,c,s,S,h) for(i in 1:length(opts)plot(x, y, type=n, main=paste(type=,optsi) lines(x, y, type=optsi)R的高级绘图函数:直方图hist()、核密度图density()直方图(Histogram):# 基本实现,使用hist观察变量的分布hist(mtcars$mpg)# 设置桶的数量和填充颜色hist(mtcars$mpg, breaks=5, col=red)hist(mtcars$mpg, breaks=c(10,25,30,40), col=red) #精确
7、设置断点核密度图(Kernel Density Plots):# 基本实现,使用density观察变量分布d counts - table(mtcars$gear)barplot(counts, main=Car Distribution, xlab=Number of Gears) barplot(counts, main=Car Distribution, horiz=T, names.arg=c(3 Gears, 4 Gears, 5 Gears) # 水平放置,设置# 堆积条形图,设置填充颜色和图例counts sli- c(10, 12, 4, 16, 8)lbls pct - ro
8、und(slilbls 基本实现-使用plot()plot(mtcars$wt, mtcars$mpg, main=Scattlot Exle, xlab=CarWeight , ylab=Per Gallon , pch=19)abline(lm(mtcars$mpgmtcars$wt), col=red) # 添加回归线# 3D散点图library(scattlot3d)scattlot3d(mtcars$wt,mtcars$disp,mtcars$mpg, main=3D Scattlot)R的低级绘图函数低级绘图函数:点、直线、线段、箭头、网格线R的低级绘图函数:点、直线、线段# 基本
9、实现plot(-4:4, -4:4, type = p, col=blue) # 绘制点、连接点pos(x=c(3,-2,-1,3,2), y=c(1,2,-2,2,3), col = red)lines(x=c(3,-2,-1,3,2), y=c(1,2,-2,2,3),col=black)# 绘制直线abline(h=0) abline(v=0) abline(a=1,b=1)abline(lm(mtcars$mpg mtcars$qsec),col=red)R的低级绘图函数:线段、箭头、网格线# 绘制线段segments(x0=2, y0=-4.5, x1=4, y1=-2, col=r
10、ed, lty=dotted) # 绘制箭头,并设置箭头的长度、角度、样式arrows(x0=-4, y0=4, x1=-2, y1=0, length=0.15, angle=30, code=3) #绘制网格线grid(nx=3, ny=5, col = lightgray, lty = dotted)R的低级绘图函数:多边形绘制由(x,y)作为顶点的多边形的低级函数如下:polygon(x, y = NULL, density = NULL, angle = 45, border = NULL, col = NA, lty = par(lty), ., fillOddEven = FAL
11、SE)# 基本实现plot(-4:4, -4:4, type = p, col=blue)polygon(x=c(3,-2,-1,3,2), y=c(1,2,-2,2,3), col = red) # 绘制多边形R的低级绘图函数:标题、任意文本、周边文本# 使用title()函数添加红色标题和蓝色子标题,设置坐标轴体相对大小为0.75plot(mtcars$wt, mtcars$mpg, main=,sub=,xlab=,ylab=)title(main=My Title, col.main=red, sub=My Sub-title, col.sub=blue, xlab=My X labe
12、l, ylab=My Y label, col.lab=green, cex.lab=0.75)# 使用text()/mtext()函数为绘图区域/边缘区域添加文本注释为绿色,字plot(x=mtcars$wt, y=mtcars$mpg, main=Milage vs. Car Weight,xlab=Weight, ylab=age, pch=18, col=blue)text(x=mtcars$wt, y=mtcars$mpg, labels=s(mtcars), cex=0.6,=4, col=red)mtext(Added by mtext(), side=2, line=2,col
13、=blue) #在边界加文本R的低级绘图函数:坐标轴和图例#添加坐标轴x - c(1:10); y - x; z counts 组合多个图形R允许在同一个页面中创建多组图形,以便对这些图形进行对比使用par()函数的mfrow/mfcol参数mypar plot(mtcars$wt,mtcars$disp,main=Scattlot of wt vs disp)hist(mtcars$wt, main=Histogram of wt) boxplot(mtcars$wt, main=Boxplot of wt) par(mypar)数据的读写设置工作路径:gese() 获取当前工作路径() 指
14、定工作路径list.files () 当前工作路径下的文件数据的读写read 和write 系列函数:最为常用的数据方式是用read.table()函数或reav()函数外部txt或csv格式的文件。txt文件:制表符间隔(键盘左上角的Tab键) csv文件:逗号间隔xls文件:二进制文件,不能直接VolcanoplotVolcanoplotk - p- read.table(diffgene.txt,header = TRUE)p - ggplot(k,aes(x = log2FoldChange,y = -log10(padj),color = sig)p - p + geom_po(si
15、ze = 0.8)cols - c(up regulated: 1229 = blue,FALSE = green, down regulated:1921 = red )p - p + scale_color_manual(Differential Expressed Genes,values = cols, breaks = c(up regulated: 1229,FALSE,down regulated: 1921), limits = c(up regulated: 1229,down regulated: 1921)p - p + geom_hline(yercept = -log
16、10(0.05),linetype = dotdash,size = 0.4)p - p+scale_y_continuous(breaks=c(30,60,80),labels=c(30,60,80)p - p + ggtitle(A vs B)+xlab(expres(pasog2,(fold change),sep = ) + ylab(expres(paste(-log10,(padj),sep = )p - p + theme(panel.background = element_rect(fill = transparent),panel.border=element_rect(c
17、olour=black,fill=NA),panel.grid.minor = element_bl(), panel.grid.major = element_bl()pboxplotboxplotlibrary(ggplot2)library(resh2)rp-read.table(fpkm.txt,header=TRUE)df - log10(rp,-1+1)df - mef)colnames(df)-c(Group,value)p - ggplot(df, aes(x = Group, y = value)p - p + geom_boxplot(aes(fill = Group),a
18、lpha = 0.4,outr.size = 1)p - p + xlab() + ylab(expres(pasog10,(FPKM+1),sep = )+ labs(title = FPKM distribution)p - p + theme(panel.background = element_rect(fill = transparent)+ theme(panel.border = element_rect(colour = black,fill = NA)+theme(panel.grid.minor = element_bl()violinviolinq - ggplot(df
19、, aes(x = Group, y = value)q - q + geom_boxplot(aes(fill = Group),alpha=0.4,width=0.1,outr.colour=NA)q - q + geom_violin(aes(colour=Group,fill=Group),alpha=0.2, width=1)q - q + xlab() + ylab(expres(pasog10,(FPKM+1),sep = )+ labs(title=FPKM distribution)q - q + theme(panel.background = element_rect(f
20、ill = transparent), panel.border=element_rect(colour=black,fill=NA),panel.grid.minor = element_bl(), panel.grid.major =element_bl()multiple graphsmultiple graphspar(mfrow=c(2,2)plot(rnorm(50),pch=17)plot(rnorm(20),type=l,lty=5)plot(rnorm(100),cex=0.5)plot(rnorm(200),lwd=2)library(grid)grid.nege()pus
21、hViewport(viewport(layout = grid.layout(nrow = 1, ncol = 2)prpr(p, vp = viewport(layout.(q, vp = viewport(layout.row = 1, layout.row = 1, layout.col = 1).col = 2)vennlibrary(gplots)A-letters1:10B-letters5:16C-lettersc(3:6, 9:13, 17:20)x-list(A, B, C)venn(x)vennlibrary(VennDiagram)V - venn.diagram(li
22、st(A=A,B=B),filenaV - venn.diagram(list(A=A,B=B),filenaLL)LL,fill=c(red,green),col=c(red,green),cat.col=c(red,green)V - venn.diagram(list(A=A,B=B),filenaV - venn.diagram(list(A=A,B=B),filena lwd=2)V - venn.diagram(list(A=A,B=B),filena c(0.5,0.5)LL,cex=1.4, cat.cex=1.6)LL,fill=c(red,green),lty=0,LL,fill=c(red,green),alpha=grid.nege()grid.draw(V)vennLength_A-leng)Length_B-length(B)Length_AB-length(ersect(A,B)grid.nedrage()irwise.venn(area1=Length_A,area2=Length_B,cross.area=Length_AB,ca
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 课题申报书:高质量“双师型”职教师资队伍建设研究
- 校园朗诵社团活动计划
- 课题申报书:高职教育实训基地建设、运行机制与共享策略研究
- 中小学校道德与法治课程设置计划
- 课题申报书:高校学生党员教育管理服务机制创新研究
- 三方租房合同范本
- 课题申报书:高校师德师风评价指标体系研究
- 初三数学学习习惯培养计划
- 六年级语文基础知识补差计划
- 幼儿园家访工作计划
- 小学数学跨学科教学项目化实施
- 【培训课件】《统计法》宣传课件 建立健全法律制度依法保障数据质量
- 《眼应用光学基础》课件
- 球星库里简介
- 【物理课件】游标卡尺 千分尺的使用课件
- 2024年05月青海青海省农商银行(农信社)系统招考专业人才笔试历年参考题库附带答案详解
- 食堂日管控周排查月调度记录表
- 金融行业金融数据分析手册
- DB45T 2634.1-2023 道路运输车辆主动安全智能防控系统设计 第1部分:平台技术要求
- 仓储人员安全培训
- 西安电子科技大学《科技英语阅读》2021-2022学年第一学期期末试卷
评论
0/150
提交评论