实验四蛋白质序列、结构的获取和显示_第1页
实验四蛋白质序列、结构的获取和显示_第2页
实验四蛋白质序列、结构的获取和显示_第3页
实验四蛋白质序列、结构的获取和显示_第4页
实验四蛋白质序列、结构的获取和显示_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、复旦大学 实验四:蛋白质序列、结构的获取和显示实验四:蛋白质序列、结构的获取和显示杜杜 娟娟基因与蛋白质组学数据分析基因与蛋白质组学数据分析实验项目四:蛋白质序列、结构的获取和显示实验项目四:蛋白质序列、结构的获取和显示一、 实验目的和要求: 掌握蛋白质序列数据库Uniprot的查询方法及格式特点 掌握蛋白质结构数据库PDB的及格式特点 掌握蛋白质结构显示软件Pymol的使用2 UniProt:Universal Protein Resource 收录蛋白质序列目录最广泛、功能注释最全面的数据库; 包含三个子库: UniProtKB(UniProt Knowledgebase) UniRef(

2、UniProt Reference Clusters) UniParc(Uniprot Archive)一一 UniProt数据库数据库31. 1. 简介简介2. 数据来源4European Bioinformatics Institute (EMBL-EBI)SIB Swiss Institute of BioinformaticsProtein Information Resource (PIR)Swiss-Prot and TrEMBLProtein Sequence Database (PIR-PSD)5UniProt的网址:的网址: / 3.

3、数据查询数据查询 Uniprot检索号,包括6个字符串,可由大写字母AZ和数字09组合而成。 也可以用关键词检索 检索演示例例1:查询:查询草履虫草履虫细胞周期蛋白依赖的蛋白激酶(CDK2)的结构数据的结构数据(1)登陆Uniprot网站 /( 2 ) 在 搜 索 栏 选 中 “ P r o t e i n knowledgebase(UniProtKB)” ,在文本框中输入“Paramecium tetraurelia CDK2”,单击Site Search按钮,出现结果。8910111213与其他数据库的链接与其他数据库的链接144. UniPro

4、t数据格式ID Q9XYV1_PARTE Unreviewed; 301 AA.AC Q9XYV1;DT 01-NOV-1999, integrated into UniProtKB/TrEMBL.DT 01-NOV-1999, sequence version 1.DT 21-MAR-2012, entry version 71.DE SubName: Full=Cyclin-dependent protein kinase Cdk2;GN Name=CDK2;OS Paramecium tetraurelia.OC Eukaryota; Alveolata; Ciliophora; Int

5、ramacronucleata;OC Oligohymenophorea; Peniculida; Parameciidae; Paramecium.OX NCBI_TaxID=5888;头部区头部区15序列名称序列名称序列编号序列编号序列来源的物种名序列来源的物种名序列来源的物种序列来源的物种学名和分类学位学名和分类学位物种分类号物种分类号序列简单说明序列简单说明引文区引文区RN 1RP NUCLEOTIDE SEQUENCE.RC STRAIN=51S;RX MEDLINE=99448661; PubMed=10519216;RX DOI=10.1111/j.1550-7408.1999.

6、tb06065.x;RA Zhang H., Berger J.D.;RT A novel member of the cyclin-dependent kinase family in ParameciumRT tetraurelia.;RL J. Eukaryot. Microbiol. 46:482-491(1999).评论区评论区CC -CC Copyrighted by the UniProt Consortium, see /termsCC Distributed under the Creative Commons Attribution

7、-NoDerivs LicenseCC -16相关文献编号或递交序列的注册信息相关文献编号或递交序列的注册信息序列注释信息序列注释信息交叉引用数据库区交叉引用数据库区DR EMBL; AF126147; AAD34354.1; -; Genomic_DNA.DR HSSP; P24941; 1OIQ.DR ProteinModelPortal; Q9XYV1; -.DR GO; GO:0005524; F:ATP binding; IEA:UniProtKB-KW.DR GO; GO:0004674; F:protein serine/threonine kinase activity; IE

8、A:InterPro.DR InterPro; IPR011009; Kinase-like_dom.DR InterPro; IPR000719; Prot_kinase_cat_dom.DR InterPro; IPR017441; Protein_kinase_ATP_BS.DR InterPro; IPR002290; Ser/Thr_dual-sp_kinase_dom.DR InterPro; IPR008271; Ser/Thr_kinase_AS.DR Pfam; PF00069; Pkinase; 1.DR SMART; SM00220; S_TKc; 1.DR SUPFAM

9、; SSF56112; Kinase_like; 1.DR PROSITE; PS00107; PROTEIN_KINASE_ATP; 1.DR PROSITE; PS50011; PROTEIN_KINASE_DOM; 1.DR PROSITE; PS00108; PROTEIN_KINASE_ST; 1.17序列区KW ATP-binding; Cyclin; Kinase; Nucleotide-binding; Transferase.SQ SEQUENCE 301 AA; 34675 MW; E839F1A5EA0D5CB5 CRC64; MDLAQSEERY QKLEKIGEGT

10、YGLVYKARDN QTGDIVALKK IRMDHEDEGV PSTAIREISL LKEVQHPNIV PLKDVVYDES RLYLIFDFVD LDLKKYMESV PQLDRMQVKK FINQMIQALN YCHQNRVIHR DLKPQNILVD IKQQNTQIAD FGLARAFGLP LKTYTHEVIT LWYRAPEILL GQRQYSTPVD IWSLGCIFAE MAQKRPLFCG DSEIDQLFKI FKIMGTPKES TWPGVSTLPD FKSTFPRWPT PTNPAATLGK DITNLCPLGL DLLSKMITYD PYARITAEEA LKH

11、AYFDELN N/ 18与序列相关的关键词与序列相关的关键词氨基酸统计数氨基酸统计数DNA代码1920FASTA文件格式文件格式tr|Q9XYV1|Q9XYV1_PARTE Cyclin-dependent protein kinase Cdk2 OS=Paramecium tetraurelia GN=CDK2 PE=4 SV=1ID 号号名称,基本性质简要说明名称,基本性质简要说明211. 在Uniprot中查询拟南芥的光敏色素phyE编码蛋白的详细信息,阅读序列格式的解释,列出共包含哪几个部分?标出头部区主要字段的含义。2. 在Uniprot中查询(1)拟南芥油菜素内酯受体gibber

12、ellin receptor GID1C 、 (2)水稻独角金内酯水解酶strigolactone hydrolase D14的蛋白质序列,这两个蛋白包含多少个氨基酸?写出它们所对应的mRNA检索号(类似于这样的格式N*_*)、GeneID号。作作 业业 PDB Protein DataBank,美国Brookhaven国家实验室管理生物大分子三维空间结构原子坐标数据库 /pdb/ NCBI STRUCTURE: MMDB (Molecular Modelling DataBase),包含了从PDB获取的实验确定的生物高聚物结构分子模型数据库 。PDB数据库

13、(1. 简介简介 美国Brookhaven实验室1971年建立的大分子结构数据库PDB 蛋白质晶体结构资料数据蛋白质晶体结构资料数据库库 (Protein Data Bank)。 PDB数据库的维护由结构生物信息学研究合作组织(Research Collaboration for Structural Bioinformatics, RCSB)负责。2.数据来源数据来源 通过实验(X射线晶体衍射,核磁共振,电子显微镜方法等)测定的生物大分子的三维结构。 主要是蛋白质的三维结构,还包括核酸、糖类、蛋白质与核酸复合物的三维结构。 3.数据统计数据统计 截止2013年11月,PDB数据库已含有956

14、44 个结构数据,其中约92.5%是蛋白质的结构。 4.数据查询数据查询 PDB中的记录有唯一的PDB-ID,包括4个字符串,可由大写字母AZ和数字09组合而成。 PDB和它的镜像站点提供每个PDB记录的查询,可按一些专门的查询项目(如提交数据、作者姓名、结构表达)进行检索。 检索演示例例1:查询:查询的结构数据的结构数据(1)登陆PDB网站 /pdb/(2)在上方的搜索栏选中“Everything” ,在文本框中输入“HUMAN TEAR LIPOCALIN”,单击Site Search按钮,出现结果。第一步:第一步: 输入关键字输入关键字“HUMAN H

15、UMAN TEAR LIPOCALIN” TEAR LIPOCALIN” 也可输入也可输入IDID号号 第二步:第二步: 选择人类泪液载脂蛋选择人类泪液载脂蛋白白1XKI 1XKI 数据查看:(3)分别单击标签3D view,Sequence,Annotations,Seq.Similarity, 3D Similarity, Literature, Biol.& Chem., Methods, Geometry观察数据信息。(4)回到Summary标签,在右侧的Biological Assembly区域可以观察蛋白的三维结构。(5)单击右侧目录中的Download Files下载不同

16、格式和内容的文件;或下载FASTA序列文件;也可下载PDB文件(1XKI.pdb)。第三步:观察数据信息第三步:观察数据信息 1XKI1XKI第四步:第四步: 1XKI1XKI结构展示图结构展示图 下载下载PDB结结构文件构文件5.数据结构PDB中对于每一个结构记录,包含名称、参考文献、序列、一级结构、二级结构和原子坐标等信息。 每条记录有两种序列信息,一种是显式序列信息(explicit sequence),一种是隐式序列信息(implicit sequence)。 在PDB文件中,以关键字SEQRES作为显式序列标记,以该关键字打头的每一行都是关于序列的信息;PDB的隐式序列即为立体化学数

17、据,包括每个原子的名称和原子的三维坐标。 PDB文本文件,文本文件, 用写字板打开用写字板打开标题部分标题部分分子类别分子类别转运蛋白转运蛋白 该文件的公该文件的公布日期布日期 该化合物该化合物的的pdb代代码码 该化合物的该化合物的来源来源 结构测定者结构测定者名字名字 REMARK是此是此pdb文件的参文件的参考书目、最大分辨率、注解考书目、最大分辨率、注解等等 一级结构一级结构杂因子杂因子二级结构二级结构连接注释连接注释晶胞特征及晶胞特征及坐标变换坐标变换连通性部分连通性部分 坐标部分坐标部分1-6 “ATOM 或或 HETATM”7-11 原原子子序序列列号号13-16 原原子子名名称

18、称18-20 残残基基名名22 链链标标识识符符23-26 残残基基序序列列号号31-38 X坐坐标标39-46 Y坐坐标标47-54 Z坐坐标标55-60 位位置置61-66 温温度度因因子子79-80 原原子子带带的的电电荷荷77-78 元元素素符符号号 三 结构显示软件-PyMOL简介/All指所有的对象,指所有的对象,3ODU指刚指刚才打开的文件,才打开的文件,(sele)是选择的是选择的对象对象按钮按钮A:代表对这个对象的各种代表对这个对象的各种action,S:显示这个对象的某种样式,:显示这个对象的某种样式,H:隐藏某种样式,:隐藏某种样式,

19、L:显示某种:显示某种label,C:显示的颜色:显示的颜色点击点击all中的中的H,选择,选择everything,隐藏所有,隐藏所有点击点击3ODU中的中的S,选择,选择cartoon,以,以cartoon形式显示蛋白质形式显示蛋白质点击点击3ODU 中的中的C , 选择选择by ss , 以二级结构分配颜色,以二级结构分配颜色, 选择选择点击右下角的点击右下角的S,窗口上面出现蛋白质氨基酸序列,找到,窗口上面出现蛋白质氨基酸序列,找到1164位位ITD,是,是配体配体点击选择点击选择ITD ,此时,此时sele中就包含中就包含ITD这个残基,点击(这个残基,点击(sele)行的)行的A,选择,选择rename selection,窗口中出现,窗口中出现更改更改sele为为IDT,点击(,点击(IDT)行的)行的S选择选择sticks,点击,点击C,选择,选择by element,选,选择,调整窗口使此分子清楚显示。择,调整窗口使此分子清楚显示。IDT行点击行点击A 选择选择fi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论