




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、,生物信息学,第三讲:序列的采集、存储和查询,本章内容提要,1.DNA测序2.序列数据的存储3.序列数据的文件格式4.序列数据的查询,1.DNA测序,1.DNA一次测序的长度为500bp。2.基因组的测序方案:将大的染色体打断成100kbp的片断,插入到BAC(BacterialArtificialChromosome)中。再随机打断,克隆,然后再组装成长的序列(contig)。3.EST(Expressedsequencetag)测序:细胞中mRNA反转录成cDNA,方向不定,测序。4.UniGene:为每一个基因创造一个唯一的条目,收集这个基因所有的ESTs.5.GSS(基因组测序序列):
2、类似于ESTs,来源基因组。6.HTG(高通量基因组序列):高通量、尚未完工的DNA序列。,基因组测序:两种方案,1.DNA片段在染色体上的位置、方向已知。首先染色体被打断成150kbp左右的片段,然后克隆到BACs中,再进一步打碎,克隆,测序,组装。2.“鸟枪法”,shotgun,随机将DNA片段打碎,克隆,测序,组装。DNA片段在染色体上的位置和方向未知。,2.序列数据的存储,1.核酸三大数据库:GenBank,EBI,DDBJ.2.Ensembl数据库:基因组注释。3.ESTs数据库;4.UniGene数据库5.Refseq数据库;6.NCBI的Gene信息数据库;7.蛋白质序列:Swi
3、ssprot/TrEMBL/UniProt数据库。,三大数据库之间的联系,GenBank中测序最多的20个物种,161.0版,2007.08,dbEST:表达序列标签数据库,2007.08,总序列45,660,524条,最多的20个物种如下,UniGene:AnOrganizedViewoftheTranscriptom,Refseq数据库,1.提供高质量的,无冗余的,完整的序列信息;2.包括基因组的DNA,转录成的RNA以及蛋白质序列信息。3.序列文件的标识符:DNA/RNA序列,NM_XXXXXX;蛋白质序列:NP_XXXXXX,NCBIGene,1.http:/www.ncbi.nlm.
4、/sites/entrez?db=gene2.序列从Refseq数据库中得到;3.详尽的注释信息,包括基因在基因组的定位,基因名称、蛋白质名称,基因结构,等等。,UniProt,1.专家审核的蛋白质序列数据与知识库;2.UniProtKnowledgebase:Release12.1,2007.083.包括:Swiss-ProtRelease54.1of21-Aug-2007:277883entries;TrEMBLRelease37.1of21-Aug-2007:4754787entries,Swiss-ProtRelease54.1,TrEMBLRelease37.1,3.序
5、列数据的文件格式,1.DNA/RNA/氨基酸代码的标识2.GenBank数据格式3.UniProt4.FASTA,GenBank数据格式,Definition:标题,序列长度,数据类型,Accessionnumber,版本号,GInumber,GenBank的数据类型,UniProt数据格式,Accessionnumber,FASTA格式,4.序列数据的查询,某天,Prof.Gene发现人的Hela细胞中,有丝分裂期间有异常情况:细胞不再分裂,而是开始凋亡(表型,phenotype),通过实验的方法(例如,酵母双杂交),发现了与有丝分裂期间某个蛋白可能相互作用的一个基因,测序结果如下(geno
6、type):,CCCCTGCCTGGCAGCCCTTTCTCAAGGACCACCGCATCTCTACATTCAAGAACTGGCCCTTCTTGGAGGGCTGCGCCTGCACCCCGGAGCGGATGGCCGAGGCTGGCTTCATCCACTGCCCCACTGAGAACGAGCCAGACTTGGCCCAGTGTTTCTTCTGCTTCAAGGAGCTGGAAGGCTGGGAGCCAGATGACGACCCCATAGAGGAACATAAAAAGCATTCGTCCGGTTGCGCTTTCCTTTCTGTCAAGAAGCAGTTTGAAGAATTAACCCTTGGTGAATTTTTGAAACTG
7、GACAGAGAAAGAGCCAAGAACAAAATTGCAAAGGAAACCAACAATAAGAAGAAAGAATTTGAGGAAACTGCGGAGAAAGTGCGCCGTGCCATCGAGCAGCTGGCTGCCATGGATTGAGGCCTCTGGC,问题:,1.这是哪个基因?2.编码的蛋白质序列是怎样的?3.有没有保守的功能结构域(domain)?4.它的功能是怎样的?5.它在真核生物中保守吗?6.有没有三级结构信息?,NCBI:BLAST,/,nucleotideblast,Megablast:找基因序列,输入序列,提交序列,NM_0
8、01168.2:Survivin,UniGene,Geo:基因表达信息,Geneinfo:基因信息,Survivin,Geneinfo:17号染色体,功能注释:GeneOntology,结论1,1.该基因为人的Survivin基因,染色体定位:17号染色体,73721872-73733311;基因标识符:NM_001168.2;2.初步的功能分析:细胞周期,caspase酶的抑制因子,等等。,NM_001168.2:Survivin,HumanSurvivin!,获取蛋白质的序列信息,Survivin:142aa,结论2,人的Survivin蛋白质包含142个氨基酸,序列标识符为:NP_001
9、159.2,获取FASTA序列,FASTA格式的序列,PHI-BLAST:finddomain,填入蛋白质的FASTA序列,BIRdomain,结论3,Survivin具有保守的功能结构域BIR,UniProt:蛋白质数据库,在人中做BLAST搜索,Survivin:O15392,Survivin的蛋白质信息,功能注释,结论4:功能分析,1.在瘤形成过程中可能起一定作用;2.阻碍G2/M期的细胞编程性凋亡;3.Chromosomalpassengercomplex(CPC)的成员之一。细胞亚定位:胞质,核。,人的Survivin在酵母中有同源物吗?,提交序列,在酵母中进行序列比对,酵母BIR1
10、:P47134,酵母BIR1的信息,结论5:,人的Survivin在酵母中的同源物可能是BIR1。,PDB:三级结构数据库,Survivin的三级结构信息,Raswin:三级结构显示,总结,现在,Prof.Gene知道了:1.该基因为人的Survivin基因,染色体定位:17号染色体,73721872-73733311;基因标识符:NM_001168.2;2.人的Survivin蛋白质包含142个氨基酸,序列标识符为:NP_001159.23.Survivin具有保守的功能结构域BIR4.Survivin的细胞亚定位:胞质,核,其功能有:(1)在瘤形成过程中可能起一定作用;(2)阻碍G2/M期
11、的细胞编程性凋亡;(3)Chromosomalpassengercomplex(CPC)的成员之一。等等。5.人的Survivin在酵母中的同源物可能是BIR1。6.Survivin的三级结构已知,在PDB中的标识符为1E31。,作业,某天,Prof.Gene在小鼠(Musmusculus)中又发现了一个与有丝分裂相关的基因,通过DNA测序,得到部分序列:,GATGAGCTGCTTATCCTACAACGAGAAGTCGGACATCTGGTCCTTGGGCTGCCTGCTGTATGAGCTGTGTGCACTAATGCCTCCCTTTACAGCTTTCAACCAAAAAGAGCTAGCTGGGAA
12、AATCAGGGAAGGGAGGTTCAGGCGCATCCCCTACCGCTACTCTGATGGCTTGAATGACCTCATCACTCGGATGCTGAATTTAAAGGACTACCATCGACCTTCAGTGGAAGAAATTCTGGAGAGCCCTTTGATAGCAGACTTGGTTGCAGAAGAGCAAAGGAGAAATCTGGAGAGGAGAGGACGGCGCTCAGGCGAGCCTTCGAAGCTGCCGGACTCCAGCCCTGTGCTGAGCGAGCTCAAGTTGAAGGAAAGGCAACTGCAGGATCGAGAGCAAGCACTCAGAGCTCGGGAGGACATCCT,问题:,1.这个基因在小鼠中是哪个基因?基因的标识
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 企业土地征收合同范例
- 传媒临时合同范例
- 管道废除施工方案
- 农村小院征用合同范例
- 仓库平房出售合同范例
- 镀锌钢管埋地施工方案
- 公司承包土地合同范例
- 农机车合同范例
- 仓储厂房建设合同范本
- 利用合同范例
- 高中家长会 高考考前家长会家长心理调整课件
- 2025年皖北卫生职业学院单招职业适应性测试题库附答案
- 住宅老旧电梯更新改造方案
- 2025年山东国电投莱阳核能有限公司校园招聘笔试参考题库附带答案详解
- 《主题六 研学旅行我做主》教学设计-2023-2024学年六年级下册综合实践活动辽师大版
- 电力工程建设中的风险控制与管理措施
- 中小学生开学第一课主题班会-以哪吒之魔童降世为榜样
- 八年级北师大版上册数学期中卷面分析
- 2025年张家界航空工业职业技术学院高职单招职业技能测试近5年常考版参考题库含答案解析
- 深静脉置管的护理及维护
- 2025年全球及中国寡核苷酸合成和基因合成行业头部企业市场占有率及排名调研报告
评论
0/150
提交评论