蛋白结构数据库课件_第1页
蛋白结构数据库课件_第2页
蛋白结构数据库课件_第3页
蛋白结构数据库课件_第4页
蛋白结构数据库课件_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

4.3蛋白质结构数据库目录4.3.1PDB数据库4.3.2MMDB数据库4.3.3SCOP数据库4.3.4DSSP数据库引言2.数据来源

通过实验(X射线晶体衍射,核磁共振,电子显微镜方法等)测定的生物大分子的三维结构。主要是蛋白质的三维结构,还包括核酸、糖类、蛋白质与核酸复合物的三维结构。3.数据统计截止2008年4月,PDB数据库已含有50277个结构数据,其中约93%是蛋白质的结构。Other包括

proteinsnucleicacidscomplexesX-rayNMRMicroscopy

例1:查询“PDBID=1ADZ”的结构数据(1)登陆PDB网站(2)在上方的搜索栏选中“PDBIDorkeyword”,在文本框中输入“1ADZ”,单击SiteSearch按钮,出现结果。生物学与化学标签

方法标签序列标签摘要标签例2:查询“人calmodulin(钙调素蛋白:一种钙结合蛋白)”(1)登陆PDB网站(2)单击Advancedsearch→将StructureTitle限制为human和calmodulin→单击EvaluateQuery(3)得到多个结构数据,其中“PDBID=1GGZ”的搜索结果最符合要求,是人上皮细胞中的钙调素样蛋白,单击此ID,进入1GGZ的具体界面。

电子教程

在PDB文件中,以关键字SEQRES作为显式序列标记,以该关键字打头的每一行都是关于序列的信息;PDB的隐式序列即为立体化学数据,包括每个原子的名称和原子的三维坐标。PDB数据库的详细字段说明如下:HEADER分子类,公布日期,ID号OBSLTE注明该ID号已改为新号TITLE说明试验方法类型CAVEAT可能的错误提示COMPND化合物分子组成SOURCE化合物来源KEYWDS关键词EXPDTA测定结构所用的试验方法AUTHOR结构测定者REVDAT修订日期及相关内容SPRSDE已撤销或更改的相关记录JRNL发表坐标集的文献REMARK1有关文献REMARK2最大分辨率REMARK3用到的程序和统计方法REMARK4其他注解DBREF其他序列库的有关记录SEQADVPDB与其它记录的出入LINK残基间化学键HYDBND氢键SLTBRG盐桥CISPEP顺势残基SITE特性位点CRYST1晶胞参数ORIGXn直角-PDB坐标SCALEn直角部分结晶学坐标MTRIXn非晶相对称TVECT转换因子MODEL多亚基时显示亚基号ATOM标准基团的原子坐标SIGATM标准差ANISOU温度因子SIGUIJ各种温度因素导致的标准差TER链末端HETATM非标准基团原子坐标ENDMDL亚基结束CONECT原子间的连通性有关记录MASTER版权拥有者END文件结束(4)单击RasMol主菜单上的“”载入“人上皮细胞calmodulin样蛋白”的结构数据(即1GGZ.pdb)。(5)蛋白质分子的外观立体结构观察:

利用RasMol主菜单上的“Display”命令中的不同显示模式来变换分子的三维立体结构的外观。(6)蛋白质分子的外观立体结构的颜色显示模式:

利用主菜单上的“Colours”命令来选择不同的颜色显示模式,以进一步更直观、清晰地展示所要观察的分子的立体结构。

(7)蛋白质分子三维结构的选择性显示:

RasMol主菜单中的“Display”和“Colours”命令主要用于分子的正常显示,在主菜单上还有一个“Options”选项命令,可以进行一些非正常的显示。(8)蛋白质分子三维结构的旋转显示:①鼠标点击窗口右方与下方的滚卷条,将以X轴或Y轴旋转。②将鼠标移至主屏幕区,按住鼠标左键,移动鼠标,就可以任意旋转此分子。按住Shift键,同时按住鼠标的右键,移动鼠标,即可实现以Z轴旋转。③通过命令行方式。(9)蛋白质三维立体结构图像的输出习题:1.PDB和RSCB的中英文全称分别是什么?2.PDB中的数据主要来源于哪两种实验测定的生物大分子三维结构?3.PDB中的每条记录有哪两种序列信息?4.PDB记录中的EXPDTA,HELIX,SSBOND各代表什么含义?4.3.2MMDB数据库1.简介

分子模型数据库MMDB(MolecularModelingDatabase)是一个关于三维生物分子结构的数据库,是美国生物技术信息中心(NCBI)所开发的生物信息数据库集成系统Entrez的一个部分。MMDB是来源于PDB三维结构的一部分,MMDB重新组织和验证了这些信息,从而保证在化学和大分子三维结构之间的交叉参考。2.查询(1)登陆网站

(2)在文本框中输入“1ggz”(或者右下角的PDB/MMDBCode文本框中),单击Go按钮,显示查询结果。家族构成3D大分子结构保守区域数据库3.三维结构显示程序Cn3DCn3D是MMDB一个配套的三维结构显示程序,它具有可靠的显示三维数据库结构的能力。图像以动画形式显示,用户可以旋转或缩放结构,也可以用条带图、空间结构图、热能分布图等方式来显示,掌握分子结构的不同功能(1)在刚才的查询结果页,单击左侧结构图下方的Viewoptions,展开选项。(2)Tasks选择Save选择Cn3D,Drawing选择Backbone。(3)在结构图上单击,下载文件3。(4)下载并安装Cn3D软件。(5)开始→程序→NCBI→Cn3D→Cn3D4.1注:MMDB采用ASN.1的记录格式,而非PDB格式。4.3.3SCOP数据库1.简介蛋白质结构分类数据库SCOP(StructuralClassificationofProteins)的目标是提供关于已知结构蛋白质之间的结构和进化关系的信息,所涉及的蛋白质包括结构数据库PDB中的所有条目。SCOP数据库除了提供蛋白质结构和进化关系信息外,对于每一个蛋白质还包括下述信息:到PDB的链接,序列,参考文献,结构的图像等。SCOP的结构分类主要是通过人工来完成的,通过图形显示器观察和比较蛋白质结构,并借助于一些软件工具进行分析。2.分类的层次结构(1)家族:

具有明显进化关系的蛋白质聚集到一个家族中,意味着两个蛋白质之间的等同氨基酸残基数超过30%。然而,在某些情况下,虽然两个蛋白质序列不相似,但它们具有相似的结构和相似的功能,表明属于同一个家族。(2)超家族:

超家族中的成员具有远源进化关系,具有共同的进化源。(3)折叠:

无论有无共同的进化起源,只要具有相同排列和拓扑结构的主要二级结构,即将蛋白质分类为具有相同的折叠。3.SCOP查询(1)网址:

(2)单击topofthehierarchy

SCOP首先从总体上将蛋白质进行分类,例如全型,全型,以平行折叠为主的/型,以反平行折叠为主的+型等。例如:

SCOP1.73版本有46456个全型蛋白质,该结构类型下有258个折叠类。在这258个折叠类中的第一个超家族是类球蛋白;类球蛋白又包含4个家族,其中第一个家族包含6个结构域;每个结构域下面有很多蛋白质成员。

也可以直接利用查找工具,查找特定的蛋白质1GGZ。

4.3.4DSSP数据库1.简介

蛋白质二级结构数据库DSSP(DatabaseofSecondaryStructureofProtein)是一个二级结构推导数据库。对生物大分子数据库PDB中的任何一个蛋白质,根据其三维结构推导出对应的二级结构。

2.分类结构描述分类α-helixH310helixGπ-helixIβ-strandEβ-bridgeBorbCoilC,LorspaceTurnTBendS3.DSSP查询(1)网址:

(2)DSSP的输出文件1adz.dssp(3)DSSPcont查询http:///services/DSSPcont/

习题:1.MMDB,SCOP和DSSP的中英文全称分别是什么?2.DSSP数据库中二级结构共分为几类,分别代表什么?3.简要描述一下SCOP数据库的分类层次。补充:MATLAB软件下可用于PDB数据库的函数

1.getpdb(RetrieveproteinstructuredatafromPDBdatabase)Data=getpdb('PDBid','PropertyName',PropertyValue...)例如:pdbstruct=getpdb('1gg

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论