




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章生物分子数据库第一节引言生物分子数据高速增长分子生物学及相关领域研究人员迅速获得最新实验数据
建立生物分子数据库
数据库记录(entry,item)通常包括两部分
原始数据(序列组成等)对这些数据进行的生物学意义的注释
一个数据库通常链接了多个相关数据库
核苷酸数据库-水稻抗病相关基因OsDR8
Taxonomy数据库Pubmed数据库NCBI-Protein数据库其他数据库Cross-Reference生物分子数据库分类
一级数据库(有冗余)数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释二级数据库(专业数据库)对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的常用的生物分子数据库
三大核酸序列数据库:Genbank、EMBL、DDBJ
特殊类型的核酸序列数据库:非编码RNA数据库(ncRNA)、表达序列标签数据库(dbEST)、miRNA、tRNAdb蛋白质序列数据库:PIR、SWIS-PROT、MIPS核酸和蛋白质三维结构数据库:核苷酸三维结构数据库(NDB)、普纳大学核酸结构数据库(BNASDB)、蛋白质结构数据库(PDB,MMDB)基因组相关数据库:人类基因组数据库(HGD)、基因组序列数据库(GSDB)、基因组在线数据库(GOLD)基因表达数据库:基因表达库(GEO)、斯坦福微阵列数据库(SMD)、ArrayExpress第二节核酸序列数据库国际上权威的核酸序列数据库(1)欧洲分子生物学实验室的EMBL
(2)美国生物技术信息中心的GenBank
(3)日本遗传研究所的DDBJ
信息资源共享,以天为基础进行数据库之间的序列数据交换,三个数据库中的数据基本一致,仅在数据格式上有所差别属于国际合作项目,这三个几乎一致的数据库称为国际核酸序列数据库(INSD)这三个数据库是综合性的DNA和RNA序列数据库,每条记录代表一个单独、连续、附有注释的DNA或RNA片段Ge宣nB昆an丝式k由美淋国国笔家医师学图圣书馆演的国移家生蝴物技港术信垮息中豪心(NC稻BI)构建宇、维坡护和还管理,NC迫BI位于隔美国孝马里荷兰国杠家健层康研恋究所播(NI文H)。Ge砖nB合an具k数据擦库的度序列僵数据颠来源身于序拣列发萄现者单提交宫的序蔽列、腔批量潜提交垃的表窝达序火列标必签(ex苏pr奏es甜se挥d振se顾qu桥en准ce奸t牙ag说,椅ES头T)基循因组泄测序监序列跌(ge携no未me绘s荣ur至ve桑y云se剪qu钓en少ce庙,斧GS范S)和溜其他需测序醒中心孔提供辜的高亦通量今数据宁,还克包括环美国软专利相商标版局提买供的话已发滑表专代利的婶序列姜数据效。一、NC坦BI简介/G及en衰Ba累nk数据将库Ge该nB龙an恩k()数据热库包城含30万余准种不国同物滚种生洞物的抓核酸丧序列裳,这温些数贫据主很要来梁源于蚊全世纱界不伏同实睛验室尽和大师规模着测序每计划胃项目大约12%来桨源于Ho今mo谋s泡ap塌ie啄ns排列瞒前6的物暴种:Ho待mo铲s苏ap万ie叶ns、Mu份s大mu时sc腐ul辣us、Ra蚊tt趋us毕n桂or超ve蚕gi玻cu喇s、Bo退s英ta心ur库us、Ze飞a圆ma佛ys、Da飞ni它o粗re愤ri季o(z戏eb现ra书fi庸sh佣)Ge肾nB说an怒k核酸弦序列盐格式Lo喷cu春s橡na巩me(位点财名,座位胜名,管同Ac奸ce枝ss黑io除n)每条枣序列若有三朋种专狱有标肃识符票(id蚊en找ti侍fi唱er)和庭一个酿版本弟号Ge得nI刑nf温o犯id加en伶ti栋fi肌er(GI)/朝Nu胁cl让eo谢ti刊de惜I珠D(NI矩D)Ac誉ce惠ss批io排n每nu扶mb疤er(登陆全号,慎流水鱼号,并编号拼,注盒册号)10位字喉符属名里第一唱字母野+种朽名第射一字鸡母+6位字桶符的祝注册削号2个字夏母+6个阿合拉伯顶数字门(pr客es圈en汇t括fo随rm)Ve酿rs眼io吧n(与误登录灿号相备同,动后面教有数题字1,戚2,耻3…)No集te:贡序列杏发生膊变化穷时,GI号改融变,四登录院号不后改变纲,但是萍版本伸号会袭发生助改变Ge抗nB热an犬k核酸艘序列状检索NC单BI检索宇首页托检索海窗口宫的数活据库选项画下拉圆菜单En质tr加ez集成灰检索免系统检索塞栏(fo喜r)输化入“IL联-2武h惭um储an”En固tr隔ez很G奏en危e检索漂结果判摘要学格式僵显示洁页面En枯tr疤ez星G惊en微e全文妇报告父页面钓(想前部割分)En嘱tr挑ez认G撒en汇e全文腰报告伪页面影(歉后部怖分)Ge丘nB岁an吐k核酸填序列碗提交欧洲伟生物赚信息架学研拿究所型(EB婶I),驳是欧揭洲分金子生偶物学馋实验洗室(EM食BL)的歉一部只分,EM抢BL笑-E棉BI男EM第BL壁-E习BI的许界多数可据库酿是生尝物学过家们铁熟知棋的,渠包括炊:EM产BL饭-B河an轧k(DN连A和RN赵A序列派)、En嗓se衬mb零le(基碍因组扮)、Ar咸ra太yE撕xp蛮re勇ss(基奏于微量阵列颜的基丑因表耳达数糟据)婚、Un团iP摸ro尝t(蛋紧白质组序列绿)、In际te愤rP彩ro(蛋扩白家驱族、速域和僵基序谋)、Re颤ac阀to邀me(传宅导通悦路)趟和Ch腔EB绩I(小志分子坚),宿新的忌资源犹帮助宽研究透者不白仅了要解构受成生献物体午的分范子部挎件,辟还了博解这膏些部跌件是补如何忌组合馋构成谊系统死的。二、EB均I简介/EB胁ML数据灶库SR脊S集成每检索腥系统SR赔S快速绘文本天检索须窗口SR震S检索帝结果跪页面洗显示亩的检归索结危果SR协S蛋白歇质记血录详洋细内潮容页择面三、DD胸BJ数据经库日本DN御A数据夏库DD记BJ册(D德NA道D习at句a攀Ba紧nk到o员f铲Ja袭pa闪n),于19挥84年建干立,肌与NC顾BI的Ge暂nB甩an缴k,EB淋I的EM跨BL数据占库共殊同组庄成国面际DN蜜A数据器库。本他们砌开发脸了SQ灭ma缓te两h工具团,用瓦来搜者索基高因或这蛋白传质中覆短的沃碱基局或氨飞基酸束序列山区域厌,并革建立柿了简齿便且黄易操冶作的SO衣AP贫(s伤im愧pl裤e宁ob吉je必ct干a剃ee克es泛s道pr既ot桥oc柔o1想)服务但器。DD嫂BJ主要转收集定来自越日本芳研究脸者获云得的疮序列页数据我,但臭也收倦集数怎据和误发放缓编号钓给任嘴何其沿他国县家的足研究初者。第三座节础蛋白名质数献据库随着绑分子祝生物颈学的责发展杀,人柿们获流得了浙越来艳越多派关于部蛋白鄙质序汪列、肃结构坐和功炉能的蹦信息衔。世冻界各粮国的泻生物扛学家膨和计描算机务科学挨家合余作利竭用这私些信掘息构虏建了嫌蛋白牛质序滚列数泰据库佛、蛋亲白质创三维削结构存数据庭库、拒蛋白吩质组缸数据款库(甲二维骡凝胶佛电泳肿数据辣库)丹、信乌号传奶导及浪蛋白慢质-蛋白熔质相相互作肃用相猛关数鸡据库挺、DN合A和蛋姻白质值相互冻作用屠数据蜡库等梁蛋白翁质相断关数达据库陕。常用买的蛋庆白质著序列会数据奶库:PI击RMI纵PSSw渐is假s-崇Pr夹ot(tr搁EM治BL)Pr北es削en银t:Un叉iP家ro陕t数据宏库仓沟库蛋白汽质功蜜能、杯结构染域和惜蛋白县质家矛族有记关的伤数据艇库:PR柱OS等IT喷EIn猾te辰rP翁roPf耽amPr蜜oD跟omSM麦AR见T等蛋白占质三差维结宇构相籍关数语据库对:PD狼BBi妇oM迎ag背Re冲sB蒙an违kSW低IS惹S-指MO秤DE薄L镇Re犬po薯si刘to疮ryMo预dB甲as汉eCA朝THSC灰OPRe蛇Li劣Ba销seTO禁PSSW颂IS计S-牧3D殿IM惕AG疮EBi非oI朽ma叉ge等蛋白江质二形维凝详胶电南泳数蹲据库仍:WO哨RL驾D-负2D河PA象GEPh未or灰et疫ix行l列in克ks信号存传导烈及蛋颠白质-蛋白皂质相牛互作庆用相勤关数丢据库割:DI冠PIN靠TE信RA将CTPr援oN婶etKE辞GGCA艰NS狐IT疲ESP蚂ADCS珠ND侧B等Fr雪eq众ue河nt背ly释-u微se宴d苍pr为ot架ei订n紫se手qu杏en躬ce习d烂at可ab号as雄eUn弄iP句ro士t:由EB化I协(E驻ur姿op员ea阳n慨Bi鱼oi椒nf厕or拨ma喊ti她cs牌I洽ns北ti射tu符te邀)管理朱的数后据库由两庸部分然组成有详栏细注怖释的尖序列栽,数旱据来贞源于抄实验与40个数企据库重相互夜参照企(cr奸os阀s-抗re勿fe责re梳nc茧e)Sw菊is浇s-属Pr茧ot锣/t培rE瘦BM砍BUn染iP趣ro靠t包含3个部牢分:(1)Un惠iP雨ro肿t鸣Kn肯ow额le大dg躬eb旷as表e(Un包iP掏ro患t)蛋白省质序辞列、堪功能宅、分喇类、折交叉将引用督等信训息存包取中抓心(2)Un遗iP态ro节t卖No题n-违re迎du萍nd尤an养t四Re笋fe充re谣nc笑e(Un魂iR陆ef)数躲据库将密岔切相坟关的鞠蛋白虏质序渗列组究合到陷一条你记录菊中以便禽提高瘦搜索挠速度诊;(3)Un魔iP玩ro缓t披Ar钉ch未iv蜜e(Un惨iP托ar挠c)资源系库,副记录岔所有汽蛋白率质序度列的逮历史孟。第四术节缎常用您的数编据库1、基因固组数捆据库生(GD仗B)人类接基因搭组计桐划所队得到潮的图没谱数结据目前GD惨B包含工对下验述三普种对窝象的珠描述廊:(1)人茫类基权因组访区域包括叼基因本、克固隆、PC演R标记军物、如断点衬、细绩胞遗妙传学袜标记栽、易慕碎位待点、ES熔T、综准合区清域、co菜nt蜻ig贿s、重广复等竟;(2)人巡寿类基罢因组旗图谱舅,包含含细胞蹄遗传呆学图威谱、欺连接肺图谱鸟、辐挠射混所合图斗谱、co应nt倒ig图谱熄、集胳成图萍谱,姐所有饼这些膛图谱采都可们以被疤直观求地显棋示出拐来;(3)人惰类基膊因组辉中的我变化越,包括叶基因卫突变好和基街因多柳态性制,加清上等趁位基茎因频党率数岁据。其它凤模式亭生物搭基因坚组数瓦据库如:鼠基姜因组搜数据戏库MG停D()酵母把基因肆组数纪据库SG炎D()En侄se毁mb浊l暖()人类墙基因凭组数共据库En伙se些mb亭lEn盖se扯mb镇l包括圈所有华公开阔的人鹊类基专因组DN期A序列剥,通语过注楼释形芬成的逼关于豪序列疲的特匀征。爆现宣在包僚括其意他基哀因组贼,如籍大鼠世、小筝鼠、补线虫哈、果言蝇等牛。例如惨:基因通过娘实验台发现铲的或者轮是通省过Ge柱nS表ca谊n程序尸预测巧的其他热的特全征:单核张苷酸棉多态敲性(SN哑P)、启重复作序列念等En单se菊mb愚l数据盏库结浊构图2、表迁达序渴列标徐签数悔据库db寄ES拴Tdb骡ES鹅T碧()是Ge常nB城an木k的一念个部粉分,为Ge她nB重an仆k的二逆级数后据库ES轻T(Ex奇pr章es斩se芬d疗Se摸qu欢en偷ce仍T沈ag奴s)方泊法已看被证夸明是识别葡转录再序列的最阅有效瞧方法态,主制要是罚从大长量不例同组湖织和
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 24司马光 第二课时 教学设计-2024-2025学年语文三年级上册统编版
- 旅行自行车项目可行性研究报告
- 纺织行业市场发展现状及趋势与投资分析研究报告
- 2025至2030年全自动鲜肉切片机项目投资价值分析报告
- 《3 信息技术的重要工具 计算机》教学设计-2023-2024学年华中师大版信息技术三年级上册
- 项目可行性研究报告安全评价
- 2025年高精密滤油机项目投资可行性研究分析报告
- 2025至2031年中国IC卡式保险箱行业投资前景及策略咨询研究报告
- 2025年禽病杀星口服液项目可行性研究报告
- 2025年玻璃钢转椅项目可行性研究报告
- 否定副词“不”和“没有”比较研究
- 19S406建筑排水管道安装-塑料管道
- 幼儿园木工坊安全教育
- 内科主任年终述职报告
- 船舶起重安全管理规定规定培训
- 2024年不停电电源UPS相关项目营销计划书
- 智慧农业中的农业机械与设备管理技术
- 公司SWOT分析表模板
- 解决问题的工作方案
- 理发店业务转让协议书范本
- 2024年潍坊护理职业学院高职单招(英语/数学/语文)笔试历年参考题库含答案解析
评论
0/150
提交评论