实验四蛋白质序列结构获取和显示_第1页
实验四蛋白质序列结构获取和显示_第2页
实验四蛋白质序列结构获取和显示_第3页
实验四蛋白质序列结构获取和显示_第4页
实验四蛋白质序列结构获取和显示_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、关于实验四蛋白质序列结构的获取和显示第一张,PPT共五十七页,创作于2022年6月实验项目四:蛋白质序列、结构的获取和显示一、 实验目的和要求: 掌握蛋白质序列数据库Uniprot的查询方法及格式特点掌握蛋白质结构数据库PDB的及格式特点 掌握蛋白质结构显示软件Pymol的使用第二张,PPT共五十七页,创作于2022年6月2UniProt:Universal Protein Resource 收录蛋白质序列目录最广泛、功能注释最全面的数据库;包含三个子库:UniProtKB(UniProt Knowledgebase)UniRef(UniProt Reference Clusters)UniP

2、arc(Uniprot Archive)一 UniProt数据库1. 简介第三张,PPT共五十七页,创作于2022年6月32. 数据来源European Bioinformatics Institute (EMBL-EBI)SIB Swiss Institute of BioinformaticsProtein Information Resource (PIR)Swiss-Prot and TrEMBLProtein Sequence Database (PIR-PSD)第四张,PPT共五十七页,创作于2022年6月4UniProt的网址: / 第五张,PPT共五十七页,创作于2022年6月

3、53.数据查询 Uniprot检索号,包括6个字符串,可由大写字母AZ和数字09组合而成。 也可以用关键词检索 第六张,PPT共五十七页,创作于2022年6月检索演示例1:查询草履虫细胞周期蛋白依赖的蛋白激酶(CDK2)的结构数据(1)登陆Uniprot网站 /(2)在搜索栏选中“Protein knowledgebase(UniProtKB)” ,在文本框中输入“Paramecium tetraurelia CDK2”,单击Site Search按钮,出现结果。第七张,PPT共五十七页,创作于2022年6月第八张,PPT共五十七页,创作于2022年6月8第九张,PPT共五十七页,创作于202

4、2年6月9第十张,PPT共五十七页,创作于2022年6月10第十一张,PPT共五十七页,创作于2022年6月11第十二张,PPT共五十七页,创作于2022年6月12与其他数据库的链接第十三张,PPT共五十七页,创作于2022年6月13第十四张,PPT共五十七页,创作于2022年6月144. UniProt数据格式ID Q9XYV1_PARTE Unreviewed; 301 AA.AC Q9XYV1;DT 01-NOV-1999, integrated into UniProtKB/TrEMBL.DT 01-NOV-1999, sequence version 1.DT 21-MAR-2012

5、, entry version 71.DE SubName: Full=Cyclin-dependent protein kinase Cdk2;GN Name=CDK2;OS Paramecium tetraurelia.OC Eukaryota; Alveolata; Ciliophora; Intramacronucleata;OC Oligohymenophorea; Peniculida; Parameciidae; Paramecium.OX NCBI_TaxID=5888;头部区序列名称序列编号序列来源的物种名序列来源的物种学名和分类学位物种分类号序列简单说明第十五张,PPT共五

6、十七页,创作于2022年6月15引文区RN 1RP NUCLEOTIDE SEQUENCE.RC STRAIN=51S;RX MEDLINE=99448661; PubMed=10519216;RX DOI=10.1111/j.1550-7408.1999.tb06065.x;RA Zhang H., Berger J.D.;RT A novel member of the cyclin-dependent kinase family in ParameciumRT tetraurelia.;RL J. Eukaryot. Microbiol. 46:482-491(1999).评论区CC -

7、CC Copyrighted by the UniProt Consortium, see /termsCC Distributed under the Creative Commons Attribution-NoDerivs LicenseCC -相关文献编号或递交序列的注册信息序列注释信息第十六张,PPT共五十七页,创作于2022年6月16交叉引用数据库区DR EMBL; AF126147; AAD34354.1; -; Genomic_DNA.DR HSSP; P24941; 1OIQ.DR ProteinModelPortal; Q9XYV1; -.DR GO; GO:0005524

8、; F:ATP binding; IEA:UniProtKB-KW.DR GO; GO:0004674; F:protein serine/threonine kinase activity; IEA:InterPro.DR InterPro; IPR011009; Kinase-like_dom.DR InterPro; IPR000719; Prot_kinase_cat_dom.DR InterPro; IPR017441; Protein_kinase_ATP_BS.DR InterPro; IPR002290; Ser/Thr_dual-sp_kinase_dom.DR InterP

9、ro; IPR008271; Ser/Thr_kinase_AS.DR Pfam; PF00069; Pkinase; 1.DR SMART; SM00220; S_TKc; 1.DR SUPFAM; SSF56112; Kinase_like; 1.DR PROSITE; PS00107; PROTEIN_KINASE_ATP; 1.DR PROSITE; PS50011; PROTEIN_KINASE_DOM; 1.DR PROSITE; PS00108; PROTEIN_KINASE_ST; 1.第十七张,PPT共五十七页,创作于2022年6月17序列区KW ATP-binding; C

10、yclin; Kinase; Nucleotide-binding; Transferase.SQ SEQUENCE 301 AA; 34675 MW; E839F1A5EA0D5CB5 CRC64; MDLAQSEERY QKLEKIGEGT YGLVYKARDN QTGDIVALKK IRMDHEDEGV PSTAIREISL LKEVQHPNIV PLKDVVYDES RLYLIFDFVD LDLKKYMESV PQLDRMQVKK FINQMIQALN YCHQNRVIHR DLKPQNILVD IKQQNTQIAD FGLARAFGLP LKTYTHEVIT LWYRAPEILL G

11、QRQYSTPVD IWSLGCIFAE MAQKRPLFCG DSEIDQLFKI FKIMGTPKES TWPGVSTLPD FKSTFPRWPT PTNPAATLGK DITNLCPLGL DLLSKMITYD PYARITAEEA LKHAYFDELN N/与序列相关的关键词氨基酸统计数第十八张,PPT共五十七页,创作于2022年6月18DNA代码氨基酸代码第十九张,PPT共五十七页,创作于2022年6月19FASTA文件格式tr|Q9XYV1|Q9XYV1_PARTE Cyclin-dependent protein kinase Cdk2 OS=Paramecium tetraur

12、elia GN=CDK2 PE=4 SV=1ID 号名称,基本性质简要说明第二十张,PPT共五十七页,创作于2022年6月20在Uniprot中查询拟南芥的光敏色素phyE编码蛋白的详细信息,阅读序列格式的解释,列出共包含哪几个部分?标出头部区主要字段的含义。在Uniprot中查询(1)拟南芥油菜素内酯受体gibberellin receptor GID1C 、 (2)水稻独角金内酯水解酶strigolactone hydrolase D14的蛋白质序列,这两个蛋白包含多少个氨基酸?写出它们所对应的mRNA检索号(类似于这样的格式N*_*)、GeneID号。作 业第二十一张,PPT共五十七页,

13、创作于2022年6月21二 蛋白质结构数据库PDB Protein DataBank,美国Brookhaven国家实验室管理生物大分子三维空间结构原子坐标数据库 /pdb/ NCBI STRUCTURE: MMDB (Molecular Modelling DataBase),包含了从PDB获取的实验确定的生物高聚物结构分子模型数据库 。第二十二张,PPT共五十七页,创作于2022年6月PDB数据库( protein data bank )1. 简介 美国Brookhaven实验室1971年建立的大分子结构数据库PDB 蛋白质晶体结构资料数据库 (Protein Data Bank)。 PDB

14、数据库的维护由结构生物信息学研究合作组织(Research Collaboration for Structural Bioinformatics, RCSB)负责。第二十三张,PPT共五十七页,创作于2022年6月2.数据来源 通过实验(X射线晶体衍射,核磁共振,电子显微镜方法等)测定的生物大分子的三维结构。 主要是蛋白质的三维结构,还包括核酸、糖类、蛋白质与核酸复合物的三维结构。 第二十四张,PPT共五十七页,创作于2022年6月3.数据统计 截止2013年11月,PDB数据库已含有95644 个结构数据,其中约92.5%是蛋白质的结构。 第二十五张,PPT共五十七页,创作于2022年6月

15、第二十六张,PPT共五十七页,创作于2022年6月4.数据查询 PDB中的记录有唯一的PDB-ID,包括4个字符串,可由大写字母AZ和数字09组合而成。 PDB和它的镜像站点提供每个PDB记录的查询,可按一些专门的查询项目(如提交数据、作者姓名、结构表达)进行检索。 第二十七张,PPT共五十七页,创作于2022年6月检索演示例1:查询人类泪液载脂蛋白的结构数据(1)登陆PDB网站 /pdb/(2)在上方的搜索栏选中“Everything” ,在文本框中输入“HUMAN TEAR LIPOCALIN”,单击Site Search按钮,出现结果。第二十八张,PPT共五十七页,创作于2022年6月第

16、一步: 输入关键字“HUMAN TEAR LIPOCALIN” 也可输入ID号 第二十九张,PPT共五十七页,创作于2022年6月第二步: 选择人类泪液载脂蛋白1XKI 第三十张,PPT共五十七页,创作于2022年6月数据查看:(3)分别单击标签3D view,Sequence,Annotations,Seq.Similarity, 3D Similarity, Literature, Biol.& Chem., Methods, Geometry观察数据信息。(4)回到Summary标签,在右侧的Biological Assembly区域可以观察蛋白的三维结构。(5)单击右侧目录中的Down

17、load Files下载不同格式和内容的文件;或下载FASTA序列文件;也可下载PDB文件(1XKI.pdb)。第三十一张,PPT共五十七页,创作于2022年6月第三步:观察数据信息 1XKI第三十二张,PPT共五十七页,创作于2022年6月第三十三张,PPT共五十七页,创作于2022年6月第四步: 1XKI结构展示图 第三十四张,PPT共五十七页,创作于2022年6月第三十五张,PPT共五十七页,创作于2022年6月下载PDB结构文件第三十六张,PPT共五十七页,创作于2022年6月5.数据结构PDB中对于每一个结构记录,包含名称、参考文献、序列、一级结构、二级结构和原子坐标等信息。 每条记

18、录有两种序列信息,一种是显式序列信息(explicit sequence),一种是隐式序列信息(implicit sequence)。第三十七张,PPT共五十七页,创作于2022年6月 在PDB文件中,以关键字SEQRES作为显式序列标记,以该关键字打头的每一行都是关于序列的信息;PDB的隐式序列即为立体化学数据,包括每个原子的名称和原子的三维坐标。 第三十八张,PPT共五十七页,创作于2022年6月PDB文本文件, 用写字板打开标题部分分子类别转运蛋白 该文件的公布日期 该化合物的pdb代码 该化合物的来源 结构测定者名字 REMARK是此pdb文件的参考书目、最大分辨率、注解等 第三十九张

19、,PPT共五十七页,创作于2022年6月第四十张,PPT共五十七页,创作于2022年6月一级结构杂因子第四十一张,PPT共五十七页,创作于2022年6月二级结构连接注释晶胞特征及坐标变换第四十二张,PPT共五十七页,创作于2022年6月连通性部分坐标部分1-6 “ATOM 或 HETATM”7-11 原子序列号13-16 原子名称18-20 残基名22 链标识符23-26 残基序列号31-38 X坐标39-46 Y坐标47-54 Z坐标55-60 位置61-66 温度因子79-80 原子带的电荷77-78 元素符号 第四十三张,PPT共五十七页,创作于2022年6月三 结构显示软件-PyMOL

20、简介/All指所有的对象,3ODU指刚才打开的文件,(sele)是选择的对象按钮A:代表对这个对象的各种action,S:显示这个对象的某种样式,H:隐藏某种样式,L:显示某种label,C:显示的颜色第四十四张,PPT共五十七页,创作于2022年6月点击all中的H,选择everything,隐藏所有点击3ODU中的S,选择cartoon,以cartoon形式显示蛋白质点击3ODU 中的C , 选择by ss , 以二级结构分配颜色, 选择点击右下角的S,窗口上面出现蛋白质氨基酸序列,找到1164位ITD,是配体第四十五张,PPT共五十七页,创作于2022年6月点击选择ITD ,此时sele中就包含ITD这个残基,点击(sele)行的A,选择rename selection,窗口中出现更改sele为IDT,点击(IDT)行的S选择sticks,点击C,选择by element,选择,调整窗口使此分子清楚显示。第四十六张,PPT共五十七页,创作于2022年6月IDT行点击A 选择find,选择polar contacts,再根据需要选择,这里选择to other atoms in object ,分子显示窗口中出现几个黄色的虚线,这就是氢键

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论