生物资讯及网路资源简介_第1页
生物资讯及网路资源简介_第2页
生物资讯及网路资源简介_第3页
生物资讯及网路资源简介_第4页
生物资讯及网路资源简介_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物資訊及網路資源簡介蔡少正國立成功大學醫學院生理所國立成功大學生物資訊中心定義:利用電腦輔助資料管理系統從基因體(Genomic)、蛋白質體(proteomics)或藥物篩選資料庫中蒐集、整合、及分析大量的生物序列或資訊。基因資料庫(Genbank)序列資訊快速增加生物資訊學的發展# bp in billions1231982-2000生物資訊學(Bioinformatics)與人類基因組解讀計劃(Human Genome Project)序列資料貯存- (6 * 106序列檔案/one genome) * 6 * 200 KB/序列檔案序列資訊整理- BLAST, FASTA. 序列資訊分

2、析- Assembly, repetitive sequence. 序列功能註解 - Genome annotation, molecular modeling生物資訊學的發展涵蓋分子生物、資訊工程、統計等學門的新科學計算生物學(computational biology):處理生物(序列)資料的科學蘊涵無限寶藏的科學-序列取得、結構分析、功能預測、模擬驗證。生物資訊學的發展後基因體分析紀元(Post-genome Era)功能性基因體(Functional Genomics) 世代來臨當基因被完全解讀出來後下一階段的目標:組合一個沒有“間隙” (Gap)的染色體圖譜,並且提高序列正確率至99

3、.99%-基因註解-基因預測-蛋白質功能研究(proteomics)-單核甘酸多樣性(single nucleotide polymorphisms or SNPs)功能性基因體(Functional Genomics)辨認所有的基因並瞭解他們的功能:Different technologies and resources into a proteomic process LITERATURE (文獻)DATABASES NUCLEOTIDE (核酸)DATABASES PROTEIN (蛋白質)DATABASES ENZYME (酵素)DATABASES OTHER TYPE (其他)DAT

4、ABASES資料庫的類型:依性質區分資料庫的類型:依功能區分原始資料庫Genebank, ESTdatabase加值型資料庫初步或未加整理的序列資訊比對、計算、整理只擷取部分有用的資訊加以歸類儲存重複序列資料庫、訊息傳遞因子資料庫(Smart database)實用價值較低具高附加價值/dbEST/index.htmlSMART - Simple Modular Architecture Research Tool NCBI網路資源 vs. 套裝軟體網路資源的優缺點 優點:- 資料庫更新頻繁- 介面較易學習,操作容易 缺點:- 通常功能專一化- 資料格式轉換不易- 參數預設值無法調整- 解讀輸

5、出結果困難網路資源 vs. 套裝軟體套裝軟體的優缺點 優點:- 容易調整參數預設值- 分析功能完整且具多樣化- 資料格式統一,不同程式間不需轉換- 可提供圖形檔輸出結果 缺點:- 資料庫更新較不頻繁- 指令繁多不易學習網際網路上的生物資源Search EngineBioHunt /BioHunt/Infomine /Pedros Biomolecular Research Tools /pedro/research_tools.html網際網路上的生物資源DatabasesLiterature-PubMed, Hint, SeqAnalRef, SRSSequence -DNA: GenBan

6、k/ EMBL/ DDBJ, UniGene, GDB-Protein: PDB, PIR, PROSITE, SWISS-PORTStructure- BioMagResBank, SCOP, MMDB網際網路上的生物資源Software (DNA annotation)Nucleic Acid Conformation- DNA, RNA secondary structureTranslation- start and stop coden, coden usage tableORF Finder- promoter, 5and 3 UTR, intron and exon Gene F

7、unction Prediction- motif and pattern search 網際網路上的生物資源Software (Protein annotation) Identification and characterization DNA - Protein Similarity searches Pattern and profile searches Post-translational modification prediction Primary structure analysis Secondary structure prediction Tertiary struct

8、ure Transmembrane regions detection Alignment 網際網路上的生物資源Courses陽明大學生化所 清華大學生科系 中研院生圖 國家衛生研究院生物資訊課程 國立成功大學醫學院Bioinformatics Package ToolsGCG - The Wisconsin Package Accelrys Biocomputational ResearchGenoMax v3.3 InforMaxLSITM Lion BioscienceBioinformatics Package ToolsLaserGene - DNAStar, Inc.MacVect

9、or - Oxford Molecular Group, Inc.Discovery Studio Gene - Oxford Molecular Group, Inc.Vector NTI - Informax, Inc.Literature, Bibliography and Reference DatabasesMedlineMIM(Mendelian Inheritance in Man)TaxonomyGeneticodeMIM(Mendelian Inheritance in Man)Browsing OMIM Nucleotide sequence databasesEMBL/G

10、enebank/DDBJContaining every individually submitted primary sequenceREFSEQProvide non-redundant curated data representing knowledge of Known genes ENSEMBLannotated genomic contig sequenceThe International Nucleotide Sequence Database Collaboration (INSD) The INSD consists of DDBJ (Japan), GenBank (U

11、SA) and the EMBL (UK) Nucleotide Sequence Database. The three databases exhange new and updated data on a daily basis to achieve optimal synchronisationGenebankProtein sequence databasesSwiss-Prota curated protein sequence database which strives to provide a high level of annotation. SpTrEMBLa datab

12、ase supplementing the Swiss-Prot Protein Sequence Data Bank. TrEMBL contains the translations of all coding sequences (CDS) EMBLPIRidentification and analysis of protein sequences and their corresponding coding sequences REFSEQPProtein information from REFSEQSPTrEMBLPrimary sequence could be further

13、 analysisSequence database with analyzed annotation(special pattern found) Analysis toolsNucleotide related databasesSpecial pattern of Nucleotide sequenceREBASE Genome structureCPGISLAND, ENSEMBLCPG, LOCUSLINK, MOUSE2HUMANTranscription factor binding siteTESS: TFCLASS, TFCELL, TFFACTOR, TFMATRIX, TFSITE Gene structureEPD, TFGENE, UTR, UTRSITE, EMBLALIGN integration of gene expression patternUNIGENE UNILIB Locuslink PDB二維電泳資料庫2D Gel預測人類的基因利用其他物種的基因利用某一染色體上的基因數利用EST資料庫中的序列傳統的方法Pfam http:/www.sanger.ac.uk/cgi-bin/Pfam/getacc?PF02024http:/www.b

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论