版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Noncoding配列探索比較片山俊明 東大医科研解析分野情報利用2005 10/11-12実戦系割C+O+A+8割大人事情内容一部割愛FANTOM3 The Transcriptional Landscape of the Mammalian Genome Science 309:1559-1563 (2 Sep 2005):哺乳動物総合的解析哺乳動物総合的解析RNARNA新大陸発見新大陸発見作出RNA(非RNA)、予想超23,000個以上発見。二重鎖DNA両方鎖転写RNA(RNA)考数31,422個発見。 割転写Noncoding重要話変重要次構造 Noncoding RNA 次構造機能
2、色中次構造取探索方法流用分類Tandemly repeated DNA - 反復型Simple sequence repetitions - ,Blocks of tandemly repeated segments - 長Dispersed repetitive DNA - 分散型Segmental duplications - 内配列重複Transposable elements RNA intermediate (Class I) - Retrotransposon - LTR持、+env 仲間 Retroposon - LTR持、LINE, SINE DNA intermediate
3、(Class II) - IS (insertion sequence) - transposase (integrase) 持 Transposon - IS + 持 不明 萌要素 MITE (miniature inverted repeat trasposable element)分類不明 = 萌() 動物?植物? 菌類?動物? 粘菌 (南方熊楠 - ChemRuby) 節足動物?環形動物? 緩歩動物門 ( - BioRuby)大人事情内容一部割愛 苔棲、歩 東大駐車場南極 乾 tun 状態変形水戻蘇生変形 耐乾燥:何年間乾眠 耐温度:272151環境耐 耐線:57万OK (致死線量50
4、0) 耐圧力:微生物死絶3000気圧倍6000気圧OK 耐真空:真空晒OK詳 http:/ Miniature inverted transposable elementTransposon / ISMITEtransposaseTIRDRTIR DR 配列 書 ATGC 並CCTAGGCGAACCTTTAGCAGTAGCGACAAAAGCTACCTAGGCG 回CTAGGCGA 回TAGGCGAA 回 (例:8bp) 中出現頻度一定、?BioRubyCCTAGGCGAACCTTTAGCAGTAGCGACAAAAGCTA#!/usr/bin/env rubyrequire biocount =
5、 Hash.new(0)genome = Bio:Sequence:NA.new( )genome.window_search(8) do |subseq| countsubseq += 1endsorted = count.sort_by |subseq, num| num sorted.each do |subseq, num| puts #subseqt#numendcaagcccc 1ttccaaac 1 :agcga tcg 19cgatcgct 20ggcgatcg 21cgatcgcc 27gcgatcgc 51実際偏BioRuby Ruby言語 指向 言語 日本発(作)言語 R
6、uby on Rails ?世界中中 Mac OS X 最初入 BioRuby、用 配列解析 KEGG 今年 ChemRuby 共IPA未踏採択 、今日開発者人来。藍藻 Anabaena sp. PCC7120 高頻度配列?BLAST数十保存配列次構造手 Stockholm 次構造表現 Emacs (ralee-mode.el) 利用 http:/www.sanger.ac.uk/Users/sgj/ralee/; /.emacs 設定例; Emacs lisp /lib/lisp/ 以下掘置整理(let (default-directory /lib/lisp) (normal-top-le
7、vel-add-subdirs-to-load-path); /lib/lisp/ralee/ 以下 ralee-*.el ; .stk 開 ralee-mode 起動設定(autoload ralee-mode ralee-mode Yay! RNA things t)(setq auto-mode-alist (cons (.stk$ . ralee-mode) auto-mode-alist)Emacs (ralee-mode.el)(作者)Stockholm # STOCKHOLM 1.0 seq1 catgcgaaacgtcaagctgggcatc seq2 cattcgaaaggt
8、catggtgcgcaat seq3 catgggaaaccacacagtggccatt #=GC SS_cons . /少例?(INFERNAL Userguide.pdf )ralee mode C-f, C-b, C-n, C-p速移動(20文字,20行単位)文字移動矢印C-c C-p, C-c C-o対応 (C-c C-o 方画面分割). (), C-d配列挿入、削除C-c C-i, C-c C-d全配列対挿入、削除C-c C-fRNAfold 画像 rna.ps 出力欠点?:pseudoknot 扱INFERNAL CM 作成 配列対 Rfam 作成検索使 http:/www.gen
9、/eddy/infernal/INFERNAL cmbuild% cmbuild mite.cm mite.stk Stokholm mite.stk CM mite.cm 生成INFERNAL cmbuild% cmsearch mite.cm genome.fa 配列対、次構造考慮検索INFERNAL良点簡単INFERNAL悪点遅make 大規模解析 () 遅並列計算 http:/www.sanger.ac.uk/Software/Rfam/help/scripts/search/rfam_scan.pl rfam_scan 配列対 Rfam 効率的検索 Pe
10、rl Rfam BLAST 絞込手順1: shotgun.rb KEGG 全生物種 1000bp 11000bp 毎切#!/usr/bin/env rubyrequire bioBio:FlatFile.auto(ARGF) do |ff| ff.each do |entry| name, seq = entry.entry_id, entry.naseq begin i = 0 seq.window_search(11000, 10000) do |subseq| puts subseq.to_fasta(#name:segment_#i*10000+1 (11000bp), 60) i +
11、= 1 end puts seq.subseq(i*10000+1).to_fasta(#name:segment_#i*10000+1, 60) rescue puts seq.to_fasta(#name:segment_all, 60) end endend手順2: Makefile 適当数毎分割% make -j 200# 検索対象配列QUERIES := $(wildcard query/*/*)# 配列結果生成result/%: query/%.fa bin/rfam_scan.pl -d ./rfam -f tab $ $ echo $ finished.txt# 作結果名一覧生
12、成infernal: $QUERIES:query/%.fa=result/%結果月末始 266 生物種中現在 137 生物種orz.終 KEGG DAS 載http:/das.hgc.jp/明日、止。(計算中) make 大丈夫。再起動後% make -j 200続、話 MITE 戻INFERNAL 釣 MITE BLAST, HMMER 高感度、高精度 取、崩端拾 近縁藍藻種検索 計150ana 84ava 66284466領域比較 MITE 挿入部位前後 500bp 種間比較MITE挿入遺伝子遺伝子anaavaEMBOSS EMBOSS ? needle stretcher (needl
13、e 足場合?) water (blast, ssearch 、)needle 大文字小文字保存197313.19841 451 gtcaagttggtgagtcagcaatctgatcaatttcaccataatgccaatat 500 |.|.|.| 1250971.1251 451 gtcaagatggtgagtcagcaatctgatcaatttcaccacaatgtcaat- 498197313.19841 501 TAGGACTTACGCATCCAGGTTGTCTGTTAAGACTGGGTGTAAGGGGGTAA 550 1250971.1251 499 - 498197313.19
14、841 551 GGGTATAGCCCTGTACCCCTACACCCTTCTCCAAACCCTTGATTTTTCGT 600 1250971.1251 499 - 498197313.19841 601 TTTCATGCGTAAGTCCTAaatataagtaaggatgtcaacaaagatgcgag 650 .|.|1250971.1251 499 -gaaggatgtcaacaaagatggatg 522197313.19841 651 gttcttgggaaggcatgattcaatcttgctcaatctt- 687 |.|.| 1250971.1251 523 gttcttggga
15、aggtatgattcaatgttgctcaatctttgttgtctttgct 572興味領域大文字見両端合結果 ana-specific結果 ana-ava-common伝播時期? MITE 作成 中崩 MITE 群 ClustalW 、内部数変化進化速度違部分削 手?XCED 宮田研(隈、加藤 et al.)統合環境 http:/www.biophys.kyoto-u.ac.jp/katoh/programs/align/xced/ XCED 内蔵高精度(MAFFT)手xced 図(xced )ClustalW XCED FASTA 吐出 ClustalW 読込作成% clustalw
16、mite.dnd R - ape /統計 ape 系統樹描/src/contrib/Descriptions/ape.html% R install.packages(ape) example(plot.phylo) q()勝手、。問題出場合 root R 起動 sudo R 。ape 系統樹描lab4ut unrooted tree 用向 axial horizontal 指定font 04 bold italic ()cex font 大試行錯誤設定 tree = read.tree(tree.dnd)# 無根系統樹描 postscript(tree_unrooted.ps, horizontal=F, pointsize=5) plot(tree, u, lab4ut=axial, font = 4, cex = 0.5) dev.off()# 有根系統樹描 postscript(tree_rooted.p
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 冲压安全管理制度规定
- 2024年福建客运资格证模拟考试题库下载电子版
- 2024年陕西旅客运输从业资格证考试题库
- 吉首大学《化工环境保护概论》2021-2022学年第一学期期末试卷
- 《机床夹具设计》试卷1
- 吉林艺术学院《流行音乐演唱录音实践Ⅲ》2021-2022学年第一学期期末试卷
- 2024年供应协议书模板合同模板下载
- 吉林师范大学《篆书理论与技法I》2021-2022学年第一学期期末试卷
- 2024年大学助研聘用合同范本
- 2024年大水面出租转让合同范本
- 湖北省武汉市青山区2023-2024学年部编版七年级历史上学期期中试题
- 政府与企业屋顶太阳能光伏合作开发框架协议
- 阿里巴巴福利分析课件
- 做负责任的人
- 【道德与法治】云南省保山市腾冲市2023-2024学年九年级上学期期末试题
- 电影八佰观后感
- 湖北省武汉市东湖高新区2021-2022学年九年级上学期期中考试化学试题
- 出口托运单据课件
- 化学品作业场所安全警示标志双氧水
- 口腔科诊疗技术操作规范2023版
- 环境法全套课件
评论
0/150
提交评论