生物信息学序列比对方法_第1页
生物信息学序列比对方法_第2页
生物信息学序列比对方法_第3页
生物信息学序列比对方法_第4页
生物信息学序列比对方法_第5页
已阅读5页,还剩170页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物信息学

Bioinformatics

1问题一:这是什么基因?问题二:编码的蛋白质序列是怎样的?问题三:有没有保守的功能结构域?问题四:它的功能是怎样的?问题五:它在真核生物中保守吗?问题六:有没有三级结构信息?问题七:和哪些蛋白有相互作用?问题八:不同组织中基因表达特异性是怎样的?问题九:该基因启动子序列是什么?是否受到某些转录因子的特异性调节?问题十:是否受到某些小RNA的调节?2问题一:这是什么基因?/Blast.cgi3提交序列Blast结果Edem2Gene

info:

2号染色体相关文献功能注释:Gene

Ontology结论一:核酸序列2.染色体定位:2号染色体,位置155701673..155729475;含有个11外显子。mRNA序列号NM_145537。

3.初步的功能分析:分子功能

生物过程1.该基因为鼠的Edem2基因,也被称为AI327354;9530090G24Rik。问题二:

编码的蛋白质序列是怎样的?/gene/16NP_663512:577aa获取FASTA序列结论二:氨基酸序列小鼠的Edem2基因编码蛋白名字为ERdegradation

enhancer,mannosidasealpha-like2precursor这个蛋白质包含577个氨基酸,序列号NP_663512。

>gi|254540029|ref|NP_663512.2|ERdegradationenhancer,mannosidasealpha-like2precursor[Musmusculus]MPFRLLIPLGLVCVLLPLHHGAPGPDGTAPDPAHYRERVKAMFYHAYDSYLENAFPYDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNTSEFQRVVEVLQDNVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTHFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLPEFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESIEKISKVECGFATIKDLRDHKLDNRMESFFLAETVKYLYLLFHPNNFIHNNGSTFDSVMTPHGECILGAGGYIFNTEAHPIDPAALHCCRRLKEEQWEVEDLIKEFYSLKQSRPKRAQRKTVRSGPWEPQSGPATLSSPANQPREKQPAQQRTPLLSCPSQPFTSKLALLGQVFLDSSFASTA格式序列如下:问题三:

有没有保守的功能结构域?

http:///Structure/cdd/wrpsb.cgihttp:///Structure/lexington/lexington.cgi?cmd=rps23查询保守结构域查询保守结构域保守结构域结构检索工具(CDART)结论三1.这个蛋白质具有保守结构域Glyco结构域。2.很多生物有该结构域。保守结构域问题四:它的功能是怎样的?//gene/31UniProt:

蛋白质数据库在哺乳类数据库中做BLAST搜索Q8BJT9蛋白质信息功能注释结论四:功能分析1.功能分析:钙离子结合分子功能。2.亚细胞定位:无。3.配体结合:无。问题五:它在真核生物中保守吗?

/blast/http:///homologene/http://cegg.unige.ch/orthodb643/blast/71ChordataMammalia-mammals(15transcripts,13species)Actinopterygii-bonyfishes(10transcripts,10species)Amphibia-amphibians(3transcripts,2species)Amniota-vertebrates(2transcripts,1species)Ascidiacea-tunicates(2transcripts,2species)Aves-birds(2transcripts,2species)Hyperoartia-vertebrates(1transcript,1species)ArthropodaInsecta-insects(12transcripts,11species)Arachnida-arachnids(2transcripts,2species)Branchiopoda-crustaceans(1transcript,1species)Malacostraca-crustaceans(1transcript,1species)Maxillopoda-crustaceans(1transcript,1species)PlatyhelminthesTrematoda-flatworms(4transcripts,2species)Turbellaria-flatworms(2transcripts,1species)CnidariaHydrozoa-hydrozoans(3transcripts,2species)MolluscaGastropoda-gastropods(2transcripts,2species)NematodaChromadorea-nematodes(2transcripts,2species)AnnelidaPolychaeta-segmentedworms(1transcript,1species)Hirudinida-segmentedworms(1transcript,1species)ChlorophytaChlorophyceae-greenalgae(1transcript,1species)DictyosteliidaDictyostelium-cellularslimemolds(1transcript,1species)CodonosigidaeMonosiga-choanoflagellates(1transcript,1species)脊索动物哺乳-哺乳动物(15转录物13种)辐-硬骨鱼类(10转录物,10种)两栖纲-两栖类(3转录物,2种)羊膜-脊椎动物(2转录物,1种)海鞘纲-被囊动物(2转录物,2种)鸟纲-鸟(2转录物,2种)七鳃鳗纲-脊椎动物(1转录物,1种)节肢动物昆虫-昆虫(12转录物,11种)蛛形纲-蛛形纲动物(2转录物,2种)鳃-甲壳类动物(1转录物,1种)软甲纲-甲壳类动物(1转录物,1种)颚足纲-甲壳类动物(1转录物,1种)扁形动物吸虫-扁形虫(4转录物,2种)涡虫纲-扁形虫(2转录物,1种)刺胞动物门水螅–水螅

(3转录物,2种)贝类腹-腹(2转录物,2种)线虫色矛纲-线虫(2转录物,2种)环节动物门-分段多毛类蠕虫(1转录物,1种)蛭纲-分段蠕虫(1转录物,1种)绿藻绿藻-绿藻(1转录物,1种)网星目粘菌-细胞粘菌(1转录物1种)CodonosigidaeMonosiga-领鞭毛虫(1转录物,1种)76结论五:分子进化1.该EDEM2基因是人类,黑猩猩,猕猴,狗,牛,大鼠,鸡,斑马鱼,线虫,果蝇,蚊子,拟南芥,水稻保守,和青蛙。2.在大鼠Q6AYI8中同源性很高3.在大肠杆菌和酵母中同源性很低问题六:有没有三级结构信息?/pdb/home/home.do81没有此图结论六没有3D结构问题七:和哪些蛋白有相互作用?/proteomicshttp://string.embl.de/89结论七:蛋白质相互作用1.AI327354在小鼠中无相互作用蛋白。2.AI327354在果蝇中同源物与YOS9,

DER1,HRD3,DFM1,SEL1L,OS9相互作用蛋白。问题八:不同组织中基因表达特异性是怎样的?/unigene/geoprofiles//http://www.ebi.ac.uk/arrayexpress/experiments/cgi-bin/source/sourceResult99结论八:基因表达1.小鼠Edem2基因的表达:身体部位:膀胱,血液,骨髓,大脑,结缔组织,眼,心,内耳,小肠,肾脏,肝脏,肺,淋巴结,肌肉,鼻咽乳腺,卵巢,输卵管,胰腺,唾腺,皮肤,脊髓,脾,胃,睾丸,子宫,胸腺,卵母细胞,未孕卵,新生儿少年,成人;发育过程中:胚胎组织,胚外组织,胚泡,原肠胚,器官发生,胎儿2.无表达:身体部位:脂肪组织,骨,肾上腺,背根神经节,受精卵,附睾,臼齿,嗅觉粘膜,松果体,脑下垂体,前列腺癌,交感神经节,甲状腺,舌头,阴道,泡状腺。发育过程中:卵裂期,受精卵,桑椹胚,卵筒。问题九:该基因启动子序列是什么?是否受到某些转录因子的特异性调节?//tools/FirstEF/http://www.cbrc.jp/research/db/TFSEARCH.html/pub/programs.html#matchhttp://www.genomatix.de/cgi-bin//sessions/login.pl?s=6ab17a99c7e9bc3ccb95bcefe1bbf27d131UCSC下载启动子序列/132结论九:基因上游调控区分析>mm10_ensGene_ENSMUST00000040833range=chr2:155729476-1557314755'pad=03'pad=0strand=-repeatMasking=noneAAATTTCTCTTGCTTTAAGCTTCCATGTTGGTGATAATTTGTTCTAGTAGCTTGGGAAACCTATACAGTCTCCCTGTGTTATTATCCAGGTCTTAGTTTCTTTTGGTTTCCCTTCTATCTGGCCCCTCTAAGAAGTATTTAAAAAATATTCTCCTAGTGACTCAGTATTTGCTATGCCATTATTATAGGCATTTTATATGGTTCACTGAATCCTCTAACCCTATTAAGCAGGTATTAATATTCTTCATAATTTATAAATGAGAAAAAAAGGTGAGGCCACACTCCTAATAATACTGCCCCAATTTAACACTGACACATTGACCCTTGACCCATCTATACTAAAACCTTTTTATTGAATTTAGGACCCACTTTGGGTTAGATATGGAGTTTAATTTGTTTATCAACTGATGGCACTTTGGGACACTTAATGAGGGATATTTTCAAGAATGCTGGATTGGGATTGGAGAGATGGATCAATGGTTAAGAGTACTAACTACTCTTCTAGAGCACCTGGGTTGAGTCTTAGCACCACATGGAAGCTCACAATACCTATAATTCTAGACCCAGAGGACTCTACACCCTTTTCTGGCCTCAGAGGTGACCTGGCATGCACAAAATTATGTACAAAATCCTCATGTACATAAATAAATAATATTATTGTGTGCTCCAAACTTGCTTATAACTCTTCACCTATGCTTATGTAAGCAGCCCTAATTAAACCTAATCTACCCCAATCACAACCACAAAAAATGACAGTAGGAGGGGTTTGGGAGGAAAAAGGAGGAGAGAAGAATGGTGAAGGTAATGGGGGAGGGGCGGTGACCAGAACATATTCATACATATATGAAATTGTCAAAGAACAAGAATTAACAAACAAACAAACAAACAAACAAACAACTGGGCCAAAGAAGGCAGAGTCTGCCTGCACTTTGCTCAATAAATGGAGCAGCCATTTCCCTCTGAATTTTTCAGCAAAGAAGAGTTGGGCAATGCTAGAATTAAAGAAAAGTTCAAATTAAAAGGATCTCAAATATCAGTTTAGACAAACCCTTTCATAAATGTGGGTGCTGTGCCTGGAGGATGAGAGGGACTCCTTTAAGGTTATATAGGTTATGTGTGAATGGTAGAGTCGTAATGAACCCCAATCGAACTTCAAATCTAGGGTTGTCTACAGCTCATTCCACTGACCAAAGAGAAGGGGGTTGCTGTAGATAGCGCACTAACAGAGTCTAGGACCTAGCAAGAGAGTGGGGAAACTGGCCCAGATGTTCTTTTTATTTTGTTTTATTTTGTTTTTTCGAGACAGGGTTTCTCTGTGTAGTCCTGGCTGTCCTGGAACTGACTTTGTAGACCAGGCTGACCTCGAACTCAGAAATGTGCCTGCCTCTGCCTCCCAAGTGCTGGGATTAAAGGCGTGCACCACCACCGCCCGGCCGGCCCAGATGTTCTTAAAGGAAGAATGCTGGGTCTTCATTCTCACCAGGGATGGCAGCCACTGAGATGGTCCAGGTAAAGTCCTGGGTTGATTTAGAGACTGAAGGGACCGTGATTTCATGGCACCCTAAAGTGAAAGACCGTCATAAATGTATGAATTCCTAGAACAAAAGGGATTTCTGGAAACCTTAAGGCTTTGGGAAAATAATTCTAGAGTTTACTTACACAATGGTTTGTCAAACCCTGTGTCTATTATAGTCAAAGCCGAACATTTTTCATCCATATTTACATAGGCATCTGCTCAAATCTTGAGTACCTGCTAGCCCCTCCTTTAAAAGGTATTTGGAAAAAAAACAAAAATTAACTAGATGGCGCCTGTAAAGTGCTCCTAACACTTTAATTCACCGAAGGTGCTCAACAAACAGAAACTGGGATTGTGAAAACATTATTAACAGCAGCCACAGCAACCACTGTCTTTAAGACACGTTGAACTCCTCTCTGTAGACCAGAAATCCCGAGATGCTCTTTTGCCAGGGCTCCACCGCCCATTGCATCCTGGGCTTTGT小鼠Edem2基因启动子序列问题十:

是否受到某些小RNA的调节?/miRecords/prediction_query.php/microrna/home.do153miRNAExpressionmmu-miR-2123mmu-miR-590-5p23mmu-miR-199a-5p1mmu-miR-290-5p15mmu-miR-292-5p15没有视图表达概要结论十:miRNA的调节1.多个软件预测小鼠Edem2基因可能受到几个miRNA的调节。2.miR-590-5p定位3号染色体。这个基因编码丝氨酸/苏氨酸蛋白激酶家族成员和TGFB受体亚科。编码的蛋白质是一种跨膜蛋白,蛋白激酶域,形成heterodimeric复杂的与另一个受体蛋白质,绑定及护。这种受体磷酸化蛋白质/配体复杂,然后进入核和规范的一个子集,基因的转录与细胞增殖有关。这个基因的突变与马凡综合征,Loeys-Deitz主动脉瘤综合症,和各种类型的肿瘤的发展。或者拼接成绩单变体编码不同亚型特点。(由RefSeq提供,2008年7月)

结1.核酸:该基因为鼠的Edem2基因,也被称为AI327354;9530090G24Rik,染色体定位在2号染色体,位置155701673..155729475;mRNA序列号NM_145537;含有个11外显子。

3.功能分析:分子功能

生物过程2.蛋白:小鼠dem2基因编码蛋白名字为ERdegradation

enhancer,mannosidasealpha-lik

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论