




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、复旦大学 实验四:蛋白质序列、结构的获取和显示实验四:蛋白质序列、结构的获取和显示杜杜 娟娟基因与蛋白质组学数据分析基因与蛋白质组学数据分析精选课件精选课件2实验项目四:蛋白质序列、结构的获取和显示实验项目四:蛋白质序列、结构的获取和显示一、 实验目的和要求: 掌握蛋白质序列数据库Uniprot的查询方法及格式特点 掌握蛋白质结构数据库PDB的及格式特点 掌握蛋白质结构显示软件Pymol的使用精选课件精选课件3 UniProt:Universal Protein Resource 收录蛋白质序列目录最广泛、功能注释最全面的数据库; 包含三个子库: UniProtKB(UniProt Knowl
2、edgebase) UniRef(UniProt Reference Clusters) UniParc(Uniprot Archive)一一 UniProt数据库数据库1. 1. 简介简介精选课件精选课件42. 数据来源European Bioinformatics Institute (EMBL-EBI)SIB Swiss Institute of BioinformaticsProtein Information Resource (PIR)Swiss-Prot and TrEMBLProtein Sequence Database (PIR-PSD)精选课件精选课件5UniProt的网
3、址:的网址: / 精选课件精选课件63.数据查询数据查询 Uniprot检索号,包括6个字符串,可由大写字母AZ和数字09组合而成。 也可以用关键词检索 精选课件精选课件7检索演示例例1:查询:查询草履虫草履虫细胞周期蛋白依赖的蛋白激酶(CDK2)的结构数据的结构数据(1)登陆Uniprot网站 /( 2 ) 在 搜 索 栏 选 中 “ P r o t e i n knowledgebase(UniProtKB)” ,在文本框中输入“Paramecium tetraurelia CDK2”,单击Site Sea
4、rch按钮,出现结果。精选课件精选课件8精选课件精选课件9精选课件精选课件10精选课件精选课件11精选课件精选课件12精选课件精选课件13与其他数据库的链接与其他数据库的链接精选课件精选课件14精选课件精选课件154. UniProt数据格式ID Q9XYV1_PARTE Unreviewed; 301 AA.AC Q9XYV1;DT 01-NOV-1999, integrated into UniProtKB/TrEMBL.DT 01-NOV-1999, sequence version 1.DT 21-MAR-2012, entry version 71.DE SubName: Full=
5、Cyclin-dependent protein kinase Cdk2;GN Name=CDK2;OS Paramecium tetraurelia.OC Eukaryota; Alveolata; Ciliophora; Intramacronucleata;OC Oligohymenophorea; Peniculida; Parameciidae; Paramecium.OX NCBI_TaxID=5888;头部区头部区序列名称序列名称序列编号序列编号序列来源的物种名序列来源的物种名序列来源的物种序列来源的物种学名和分类学位学名和分类学位物种分类号物种分类号序列简单说明序列简单说明精选
6、课件精选课件16引文区引文区RN 1RP NUCLEOTIDE SEQUENCE.RC STRAIN=51S;RX MEDLINE=99448661; PubMed=10519216;RX DOI=10.1111/j.1550-7408.1999.tb06065.x;RA Zhang H., Berger J.D.;RT A novel member of the cyclin-dependent kinase family in ParameciumRT tetraurelia.;RL J. Eukaryot. Microbiol. 46:482-491(1999).评论区评论区CC -CC
7、 Copyrighted by the UniProt Consortium, see /termsCC Distributed under the Creative Commons Attribution-NoDerivs LicenseCC -相关文献编号或递交序列的注册信息相关文献编号或递交序列的注册信息序列注释信息序列注释信息精选课件精选课件17交叉引用数据库区交叉引用数据库区DR EMBL; AF126147; AAD34354.1; -; Genomic_DNA.DR HSSP; P24941; 1OIQ.DR ProteinModelPo
8、rtal; Q9XYV1; -.DR GO; GO:0005524; F:ATP binding; IEA:UniProtKB-KW.DR GO; GO:0004674; F:protein serine/threonine kinase activity; IEA:InterPro.DR InterPro; IPR011009; Kinase-like_dom.DR InterPro; IPR000719; Prot_kinase_cat_dom.DR InterPro; IPR017441; Protein_kinase_ATP_BS.DR InterPro; IPR002290; Ser
9、/Thr_dual-sp_kinase_dom.DR InterPro; IPR008271; Ser/Thr_kinase_AS.DR Pfam; PF00069; Pkinase; 1.DR SMART; SM00220; S_TKc; 1.DR SUPFAM; SSF56112; Kinase_like; 1.DR PROSITE; PS00107; PROTEIN_KINASE_ATP; 1.DR PROSITE; PS50011; PROTEIN_KINASE_DOM; 1.DR PROSITE; PS00108; PROTEIN_KINASE_ST; 1.精选课件精选课件18序列区
10、KW ATP-binding; Cyclin; Kinase; Nucleotide-binding; Transferase.SQ SEQUENCE 301 AA; 34675 MW; E839F1A5EA0D5CB5 CRC64; MDLAQSEERY QKLEKIGEGT YGLVYKARDN QTGDIVALKK IRMDHEDEGV PSTAIREISL LKEVQHPNIV PLKDVVYDES RLYLIFDFVD LDLKKYMESV PQLDRMQVKK FINQMIQALN YCHQNRVIHR DLKPQNILVD IKQQNTQIAD FGLARAFGLP LKTYTH
11、EVIT LWYRAPEILL GQRQYSTPVD IWSLGCIFAE MAQKRPLFCG DSEIDQLFKI FKIMGTPKES TWPGVSTLPD FKSTFPRWPT PTNPAATLGK DITNLCPLGL DLLSKMITYD PYARITAEEA LKHAYFDELN N/ 与序列相关的关键词与序列相关的关键词氨基酸统计数氨基酸统计数精选课件精选课件19DNA代码精选课件精选课件20FASTA文件格式文件格式tr|Q9XYV1|Q9XYV1_PARTE Cyclin-dependent protein kinase Cdk2 OS=Paramecium tetraur
12、elia GN=CDK2 PE=4 SV=1ID 号号名称,基本性质简要说明名称,基本性质简要说明精选课件精选课件21在Uniprot中查询拟南芥的光敏色素phyE编码蛋白的详细信息,阅读序列格式的解释,列出共包含哪几个部分?标出头部区主要字段的含义。在Uniprot中查询(1)拟南芥油菜素内酯受体gibberellin receptor GID1C 、 (2)水稻独角金内酯水解酶strigolactone hydrolase D14的蛋白质序列,这两个蛋白包含多少个氨基酸?写出它们所对应的mRNA检索号(类似于这样的格式N*_*)、GeneID号。作作 业业精选课件精选课件22 PDB Pr
13、otein DataBank,美国Brookhaven国家实验室管理生物大分子三维空间结构原子坐标数据库 /pdb/ NCBI STRUCTURE: MMDB (Molecular Modelling DataBase),包含了从PDB获取的实验确定的生物高聚物结构分子模型数据库 。精选课件精选课件23PDB数据库(1. 简介简介 美国Brookhaven实验室1971年建立的大分子结构数据库PDB 蛋白质晶体结构资料数据蛋白质晶体结构资料数据库库 (Protein Data Bank)。 PDB数据库的维护由结构生物信息学研究合作组织(Research C
14、ollaboration for Structural Bioinformatics, RCSB)负责。精选课件精选课件242.数据来源数据来源 通过实验(X射线晶体衍射,核磁共振,电子显微镜方法等)测定的生物大分子的三维结构。 主要是蛋白质的三维结构,还包括核酸、糖类、蛋白质与核酸复合物的三维结构。 精选课件精选课件253.数据统计数据统计 截止2013年11月,PDB数据库已含有95644 个结构数据,其中约92.5%是蛋白质的结构。 精选课件精选课件26精选课件精选课件274.数据查询数据查询 PDB中的记录有唯一的PDB-ID,包括4个字符串,可由大写字母AZ和数字09组合而成。 PD
15、B和它的镜像站点提供每个PDB记录的查询,可按一些专门的查询项目(如提交数据、作者姓名、结构表达)进行检索。 精选课件精选课件28检索演示例例1:查询:查询的结构数据的结构数据(1)登陆PDB网站 /pdb/(2)在上方的搜索栏选中“Everything” ,在文本框中输入“HUMAN TEAR LIPOCALIN”,单击Site Search按钮,出现结果。精选课件精选课件29第一步:第一步: 输入关键字输入关键字“HUMAN HUMAN TEAR LIPOCALIN” TEAR LIPOCALIN” 也可输入也可输入IDID号号 精选课件精选课件30第二
16、步:第二步: 选择人类泪液载脂蛋选择人类泪液载脂蛋白白1XKI 1XKI 精选课件精选课件31数据查看:(3)分别单击标签3D view,Sequence,Annotations,Seq.Similarity, 3D Similarity, Literature, Biol.& Chem., Methods, Geometry观察数据信息。(4)回到Summary标签,在右侧的Biological Assembly区域可以观察蛋白的三维结构。(5)单击右侧目录中的Download Files下载不同格式和内容的文件;或下载FASTA序列文件;也可下载PDB文件(1XKI.pdb)。精选课件精选
17、课件32第三步:观察数据信息第三步:观察数据信息 1XKI1XKI精选课件精选课件33精选课件精选课件34第四步:第四步: 1XKI1XKI结构展示图结构展示图 精选课件精选课件35精选课件精选课件36下载下载PDB结结构文件构文件精选课件精选课件375.数据结构PDB中对于每一个结构记录,包含名称、参考文献、序列、一级结构、二级结构和原子坐标等信息。 每条记录有两种序列信息,一种是显式序列信息(explicit sequence),一种是隐式序列信息(implicit sequence)。精选课件精选课件38 在PDB文件中,以关键字SEQRES作为显式序列标记,以该关键字打头的每一行都是关
18、于序列的信息;PDB的隐式序列即为立体化学数据,包括每个原子的名称和原子的三维坐标。 精选课件精选课件39PDB文本文件,文本文件, 用写字板打开用写字板打开标题部分标题部分分子类别分子类别转运蛋白转运蛋白 该文件的公该文件的公布日期布日期 该化合物该化合物的的pdb代代码码 该化合物的该化合物的来源来源 结构测定者结构测定者名字名字 REMARK是此是此pdb文件的参文件的参考书目、最大分辨率、注解考书目、最大分辨率、注解等等 精选课件精选课件40精选课件精选课件41一级结构一级结构杂因子杂因子精选课件精选课件42二级结构二级结构连接注释连接注释晶胞特征及晶胞特征及坐标变换坐标变换精选课件精
19、选课件43连通性部分连通性部分 坐标部分坐标部分1-6 “ATOM 或或 HETATM”7-11 原原子子序序列列号号13-16 原原子子名名称称18-20 残残基基名名22 链链标标识识符符23-26 残残基基序序列列号号31-38 X坐坐标标39-46 Y坐坐标标47-54 Z坐坐标标55-60 位位置置61-66 温温度度因因子子79-80 原原子子带带的的电电荷荷77-78 元元素素符符号号 精选课件精选课件44三 结构显示软件-PyMOL简介/All指所有的对象,指所有的对象,3ODU指刚指刚才打开的文件,才打开的文件,(sele)是选择的是选择
20、的对象对象按钮按钮A:代表对这个对象的各种代表对这个对象的各种action,S:显示这个对象的某种样式,:显示这个对象的某种样式,H:隐藏某种样式,:隐藏某种样式,L:显示某种:显示某种label,C:显示的颜色:显示的颜色精选课件精选课件45点击点击all中的中的H,选择,选择everything,隐藏所有,隐藏所有点击点击3ODU中的中的S,选择,选择cartoon,以,以cartoon形式显示蛋白质形式显示蛋白质点击点击3ODU 中的中的C , 选择选择by ss , 以二级结构分配颜色,以二级结构分配颜色, 选择选择点击右下角的点击右下角的S,窗口上面出现蛋白质氨基酸序列,找到,窗口上面出现蛋白质氨基酸序列,找到1164位位ITD,是,是配体配体精选课件精选课件46点击选择点击选择ITD ,此时,此时sele中就包含中就包含ITD这个残基,点击(这个残基,点击(sele)行的)行的A,选择,选择rename selection,窗口中出现,窗口中出现更改更改sele为为IDT,点击(,点击(IDT)行的)行的S选择选择sticks,点击,点击C,选择,选择by element,选择,选择,调整窗口使此分子清楚显示。调整窗口使此分子清楚显示。精选课件精选课件47IDT行点击行点击A 选择选择find,选择,选择polar contacts,再根据需要选择,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 实习实训基地合作协议合同范本
- 企业间的战略合作伙伴合同
- 全职劳动合同参考合同
- 5守株待兔(教学设计)-2023-2024学年语文三年级下册统编版
- Unit 1 How can I get there?Part B(教学设计)-2024-2025学年人教PEP版英语六年级上册
- 常年法律顾问服务合同
- 11 浮力 第二课时 教学设计-2024-2025学年科学四年级上册苏教版
- 建筑项目材料检测委托合同
- 中保人寿瑞祥养老保险合同范本
- 标准化苗木购销合同范本详解
- 《恒瑞医药股权激励实施方案探析综述》6200字
- 傅佩荣论语三百讲(1-300讲)汇编
- 统编版一年级下册语文全册完整课件
- 《植树问题(两端都栽)》教学实录-2024-2025学年人教版五年级数学上册
- 智能 检测与监测 技术-智能建造技术专01课件讲解
- 2024年心理咨询师题库【综合题】
- 教育部《中小学校园食品安全和膳食经费管理工作指引》知识培训
- 石油工程设计大赛采油单项组
- 辽宁中考语文2024年真题考点全面解读
- 2025年高考语文复习知识清单第十章作文专题11:漫画作文写作指导(学生版+解析)
- 中国肥胖及代谢疾病外科治疗指南(2024版)
评论
0/150
提交评论