从零学测序癌症基因组重测序分析第六讲之circos图的绘制_第1页
从零学测序癌症基因组重测序分析第六讲之circos图的绘制_第2页
从零学测序癌症基因组重测序分析第六讲之circos图的绘制_第3页
从零学测序癌症基因组重测序分析第六讲之circos图的绘制_第4页
从零学测序癌症基因组重测序分析第六讲之circos图的绘制_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、【测序中国测序中国-从零学测序从零学测序】癌症基因组癌症基因组重测序分析第六讲之重测序分析第六讲之circos图的绘制图的绘制卜德超卜德超微信微信/QQ: 530242830邮箱邮箱: 中国科学院计算技术研究所中国科学院计算技术研究所2015-01-07 Circos 是一个Perl语言开发的自由可视化软件,使用GPL协议分发,以绘制输出圈图绘制输出圈图(原型 Circos 是由加拿大的一位生物信息科学家 Martin Krzywinski 所开发,他同时是一位专业摄影师,最初他主要从事Linux系统管理等工作风格的图)为最大特色Circos介绍Circos案例基因组基因组数据数据的可视化的可

2、视化Linux内核内核发展的可发展的可视化视化影视作品影视作品人物关系人物关系的可视化的可视化Circos绘图流程Perl 安装Circos 安装LinksHighlightHeatmapHistogramCircos.confPatterns.confColors.confImage.confFonts.confHousekeeping.conf安装配置文件配置文件导入图形类型。Scatter plot Circos产生静态图片。这些图片的产生过程是通过一个配置文件来实现的。这个配置文件通常会导入其他配置文件,形成一个个分级结构。设置好这个配置文件,基本上就掌握了circos。Windows

3、上安装Circos安装安装Strawberry Perl或者ActiveState Perl (不低于5.8)DOS命令行下perl v检测perl是否安装成功及查看版本下载Circos包,解压DOS命令行下即可运行Circos,例如在circos/example下执行perl .bincircos conf etccircos.conf如果运行失败,用perl自带的安装包管理程序(PPM)继续安装完成即可Unix上安装Circos安装Unix系统一般都安装有perl,perl版本不应低于5.8下载Circos包,解压,根据circos包自带的README安装circos如果运行失败,继续将为

4、安装的perl模块安装完成即可在circos/example下执行perl /path/to/circos/bin/circos conf etccircos.conf配置语法:变量名=变量值配置块:配置文件 thickness = 30p fill_color = white fill_color = grey 形成一个配置块,一些重要的配置块单独写在一个配置文件中,便于其他配置文件的导入。例如ideogram.conf只有ideogram一个配置块。可以具有多个实例,如此有了全局变量和局部变量,左边fill_color = white对中所有实例都有效,除非实例内部自己用局部变量进行定义,

5、如左边的fill_color = grey。如果实例比较多,全局变量变得格外的事半功倍。 在circos/etc目录下有些现成的设置会经常用到,从不或很少改变,学会运用这些配置文件对学习circos有很大帮助,也省去了很多麻烦,如colors.conf、fonts.conf等。写配置文件的时候可以直接导入使用。配置文件colors.conffonts.confpatterns.confHousekeeping.conf颜色配置颜色配置文件,导入了colors.brewer.conf、 colors.hsv.conf和colors.ucsc.conf。在circos中,颜色除了绝对路径,还有很多

6、表达方式,如hs1,red, reds-9-seq-1等,是因为这些字符在colors配置文件中已经赋予了特定的绝对路径。 字体配置字体配置文件,其中,代表字体的标签与circos/fonts文件夹下的otf或ttf文件一一对应。模式配置模式配置文件,其中,标签与circos/tites文件夹下的png文件一一对应,然后根据patterns.svg.conf生成相应的svg文件。基本框架配置基本框架配置,circos必不可少的配置文件,一般直接导入即可。 还有一些设置是也是经常用到,但会根据个人喜好或绘图要求不同而有细微差别,如ideogram.conf、 ticks.conf等。除此之外,也

7、可以把经常用到的设置写成配置文件,便于其它配置文件反复导入,提高效率。配置文件ideogram.confticks.confimage.conf染色体展示染色体展示的配置文件,包括是否展示bands,染色体展示位置、染色体间距离、染色体标签位置等。染色体数据在哪?画哪一些?后面实例中有说明,这里是简单介绍配置文件的作用。刻度标签刻度标签配置文件,可以导入到ideogram.conf中,也可以直接导入到主配置文件中。对image大小、背景颜色、输出目录、输出文件形式以及染色体在圆周上的起始位置等进行设置。 对于上述提到的那些配置文件,主配置文件可以用来导入,这样在主配置文件中就不必再对xxx.c

8、onf文件中的变量进行定义了。如此一来,既可以使这些重要配置文件得以重复利用,也大大简化了主配置文件。除此之外,被导入的配置文件它自己也可以导入其它的配置文件。配置文件导入karyotype = data/karyotype/karyotype.mouse.mm9.txtchromosomes_units = 1000000chromosomes_display_default = yes colors_fonts_patterns.confcircos.conf嵌套配置文件导入white = 255,255,255 colors.confcolors.brewer.confblues-3-s

9、eq = blues-3-seq-(d+)blues-3-seq-rev = rev(blues-3-seq-(d+)blues-3-seq-1 = 222,235,247blues-3-seq-2 = 158,202,225blues-3-seq-3 = 49,130,189 colors_fonts_patterns.confcolors.confcolors.brewer.conf实例绘制初级:核型图绘制 上面学习了配置文件和配置文件导入的相关知识,现在我们一起来完成一个没有data的circos,即只有染色体的只有染色体的circos图图。 首先准备好需要被导入的配置文件:circos

10、/etc目录下的文件直接可以用,一般不需要改动。 etc/background.black.conf etc/background.white.conf etc/colors.brewer.conf etc/colors.conf etc/colors.hsv.conf etc/colors.ucsc.conf etc/colors_fonts_patterns.conf etc/fonts.conf etc/housekeeping.conf etc/image.black.conf etc/image.conf etc/image.generic.conf etc/patterns.con

11、f etc/patterns.svg.conf 除此之外,再创建ideogram.conf和ticks.conf配置文件,与后面创建的主配置文件circos.conf放在同一个目录下,下面是ideogram.conf 和ticks.conf 模板。default = 0.005rradius = 0.9rthickness = 40pfill = yesfill_color = blackstroke_thickness = 2stroke_color = blackshow_label = yeslabel_font = default label_radius = 1r + 75plabe

12、l_size = 30label_parallel = yeslabel_case = upper label_format = eval(sprintf(chr%s,var(label)show_bands = yesfill_bands = yesband_stroke_thickness = 2band_stroke_color = whiteband_transparency = 4show_ticks = yesshow_tick_labels = yesradius = 1rcolor = blackthickness = 2pmultiplier = 1e-6format = %

13、dspacing = 5usize = 10pspacing = 25usize = 15pshow_label = yeslabel_size = 20plabel_offset = 10pformat = %dideogram.confticks.conf染色体间的空隙染色体所在位置、厚度、边框厚度及颜色染色体标签位置、字体等Bands显示与否、bands边框厚度、颜色、透明度等主刻度次刻度(小刻度)刻度所在位置、颜色、厚度等是否显示刻度实例绘制初级:核型图绘制 然后,创建一个主配置文件,导入核型文件和其它配置文件:karyotype = data/karyotype/karyotype.

14、mouse.mm9.txtchromosomes_units = 1000000chromosomes_display_default = yesCircos.conf核型文件是必须的。它定义了需要展示的染色体的名称、大小和颜色等,可以根据自己的要求创建自己想要的核型,不仅仅是染色体,也可以是contigs、genesi等其他可以量化的基于坐标系统的东西。Circos常用的核型数据文件在circos/data/karyotype目录下。定义距离单位u是否显示默认染色体实例绘制初级:核型图绘制 最后,运行circos:perl bin/circos -conf circos.conf次刻度,5u

15、,不显示刻度标签主刻度,25u,显示刻度标签default = 0.005rshow_label = yeslabel_font = default label_radius = 1r + 75plabel_size = 30label_parallel = yeslabel_case = upper label_format = eval(sprintf(chr%s,var(label)实例绘制初级:核型图绘制 画出基本的核型图之后,就要开始往图里面添加需要显示的数据了。circos图形典型的有Scatter Plots、Line Plots、Histograms、Heatmaps 、Con

16、nectors 、Highlights、Links。 Scatter Plots、Line Plots、Histograms、Heatmaps数据数据格式: chr start end value options,options是在数据内部,单单对它所在行的数据进行设置,多项设置用逗号隔开, options可有可无。 hs1 0 99999 0.01044hs1 100000 199999 0.00512hs1 200000 299999 0.00214 fill_color=red,z=68hs1 300000 399999 0.00902hs1 400000 499999 0.00448h

17、s1 500000 599999 0.00879 实例绘制中级:数据图绘制Scatter Plotstype=scatterfile=data/6/snp.density.txtfill_color=greystroke_color=blackglyph=circleglyph_size=10max=0.013min=0r1=0.95rr0=0.65rtype=scatterfile=indata/6/snp.density.txtfill_color=greenstroke_color=dgreenglyph=rectangleglyph_size=8max=0.013min=0.007r1

18、=1.175rr0=1.075rtype=scatterfile=data/6/snp.density.txtfill_color=greystroke_color=blackglyph=circleglyph_size=10max=0.013min=0r1=0.95rr0=0.65rfile=indata/6/snp.density.txtfill_color=greenstroke_color=dgreenglyph=rectangleglyph_size=8max=0.013min=0.007r1=1.175rr0=1.075r设置plot类型,可以是scatter、line、 hist

19、ogram, heatmap 等。指定数据文件设置图形填充颜色及边框颜色设置点的形状及大小设置value数据范围,出界将被忽视掉设置绘画区域,r0是内半径,r1是外半径,value中的“r”代表circos半径不同的实例一般不设置重复区域核心配置块: 形成主配置文件:将核心配置块插入到前面实例circos.conf中即可,其它2D数据同样的方法。karyotype=data/karyotype/karyotype.human.txtchromosomes_units=1000000chromosomes_display_default=nochromosomes=hs1;hs4;hs5不显示默

20、认染色体设置展示的染色体,人染色体符号是hs,小鼠是mm,这是在核型文件中设置好的。type=scatterfile=data/6/snp.density.txtfill_color=greystroke_color=blackglyph=circleglyph_size=10max=0.013min=0r1=0.95rr0=0.65rfile=indata/6/snp.density.txtfill_color=greenstroke_color=dgreenglyph=rectangleglyph_size=8max=0.013min=0.007r1=1.175rr0=1.075r第一个实

21、例,灰色第二个实例,绿色Scatter Plotstype = linethickness = 2max_gap = 1ufile = data/6/snp.density.250kb.txtcolor = redmin = 0max = 0.015r0 = 0.5rr1 = 0.8rfill_color = vdredmax_gap = 1ufile = data/6/snp.density.txtcolor = yellowmin = 0max = 0.015r0 = 0.25rr1 = 0.45rthickness = 1fill_color = vdyellowLine Plots核心

22、配置块Histograms核心配置块type = histogramfile = data/C_fpkm.txtcolor = redmin = 0max = 500r0 = 0.75rr1 = 0.95rthickness = 10pfill_under = yesfill_color = redorientation = outtype = histogramfile = data/D_fpkm.txtcolor = greenmin = 0max = 500r0 = 0.40rr1 = 0.60rthickness = 10pfill_under = yesfill_color = gr

23、eenorientation = in控制方向,向外控制方向,向内Heatmaps核心配置块type = heatmapfile = indata/6/variation.heatmap.txtcolor = spectral-9-divstroke_thickness = 1stroke_color = blackmin = 2000max = 25000r0 = 0.80rr1 = 0.90rfile = indata/6/variation.heatmap.txtcolor = spectral-9-divstroke_thickness = 1stroke_color = blackm

24、in = 10000max = 500000r0 = 0.60rr1 = 0.70rfile = indata/6/variation.heatmap.txtcolor = orrd-9-seqstroke_thickness = 1stroke_color = blackmin = 10000max = 500000r0 = 0.40rr1 = 0.50r颜色是一组颜色(多个),根据min到max,赋予从左至右的颜色三个实例用的是同一组数据,第一个实例min-max设置偏小,图形颜色偏深第二个实例颜色设置与第一个相同,min-max设置加大,图形颜色适中第三个实例min-max设置与第二个相

25、同,颜色设置为另一组颜色。type = connectorfile = indata/6/connectors.txtr0 = 0.70rr1 = 0.90rconnector_dims = 0,0.3,0.4,0.3,0thickness = 2color = blacktype = connectorfile = indata/6/connectors.txtr0 = 0.40rr1 = 0.60rconnector_dims = 0,0,0.8,0.2,0thickness = 2color = greenConnectors 数据格式:chr firstLocal secondLoca

26、l 这两个locals需要在同一染色体上,没有要求一个必须大于另一个。 hs22 14743362 14737115hs22 20339724 20339258hs22 14758082 14790652 核心设置快:connector_dims = 0,0.3,0.4,0.3,0color = blackconnector_dims = 0,0,0.8,0.2,0color = greenHighlights 数据格式:chr start end fill_color=color, hs1 1298972 1300443 fill_color=blue hs1 1311738 1324571

27、 fill_color=red,r0=0.6r,r1=0.6r+50p hs1 1397026 1421444 fill_color=green,r0=1.1r,r1=1.15r hs1 1437417 1459927 fill_color=green,r0=1.1r,r1=1.15r hs1 1540746 1555847 fill_color=yellow hs1 1560962 1645635 hs1 1624179 1645623 核心配置块:有两种设置方式,一种是以是方式,用变量设置type=highlight,实例是;另外一种是以配置块来设置,实例是。一下是两种核心配置块。file

28、 = indata/3/chr.highlights.txtr0 = 0.80rr1 = 0.90rfile = indata/3/h.variation.txtr0 = 0.40rr1 = 0.70rHighlightstype = highlightfile = indata/3/chr.highlights.txtr0 = 0.80rr1 = 0.90rtype = highlightfile = indata/3/h.variation.txtr0 = 0.40rr1 = 0.70r默认的颜色是grey默认颜色是black对于有fill_color的数据,和画出的图案是一样的。file

29、 = huan_chr1_links.txtradius = 0.95rcolor = redbezier_radius = 0.1rthickness = 1file = human_chr1_links.txtradius = 0.95rcolor = greenbezier_radius = 0.4rthickness = 1Links 数据格式:firstChr start end secondChr start end,染色体1和染色体2可以相同,也可以不同。 hs11475914759hs11499914999hs1564465564465hs1564652564652hs1564

30、483564483hs2566317566317 核心配置块:数据综合绘制 所有类型circos图可以穿插在一起,下边的circos是上述图形所用到的数据,综合在一起画的一个circos。Scatter PlotsLine PlotsHighlightsLinksHeatmapsConnectorsHistograms数据综合绘制karyotype = data/karyotype/karyotype.human.txtchromosomes_units = 1000000chromosomes_display_default = nochromosomes = hs1;hs2;hs3;hs4;

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论