




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Outline生物学基本知识常用的生物数据及数据库处理生物数据的基本处理方法目前一页\总数四十六页\编于十七点生物学两种主要信息载体生物基础核酸分子与蛋白质分子目前二页\总数四十六页\编于十七点核酸分子生物基础核酸的基本单元式核苷酸。核苷酸有一个磷酸基团、一个糖基团和一个含有氮原子的碱基基团构成。根据糖基不同,核苷酸可分为:脱氧核糖核苷酸核糖核苷酸碱基糖基磷酸DNA(脱氧核糖核酸)RNA(核糖核酸)核苷+磷酸碱基+糖基核苷酸核酸聚合目前三页\总数四十六页\编于十七点核酸分子–DNA和RNA生物基础DNA的磷酸基团和糖基团都相同,碱基分为4种类型:腺嘌呤--A鸟嘌呤--G胞嘧啶--C胸腺嘧啶--TA只能与T配对C只能与G配对ACGT目前四页\总数四十六页\编于十七点核酸分子–DNA和RNA生物基础多个脱氧核苷酸通过5’和3’形成磷酸二酯键连接而成的长DNA单链。通过碱基互补配对形成互补链,两条相互平行的DNA单链形成双螺旋结构。A--UC--GG--URNA通常是单链形式。RNA只有尿嘧啶(U)而没有胸腺嘧啶(T)DNA主要存在于细胞核内,RAN在细胞核外也存在。配对原则:目前五页\总数四十六页\编于十七点蛋白质分子–生命活动的执行者生物基础蛋白质是由氨基酸通过肽键相链接形成的聚合物。氨基酸-蛋白质的基本组成单位,存在自然界中的氨基酸有300余种,但组成人体蛋白质的氨基酸仅有20种。氨基酸有一个位于中心的碳原子(Cα)以及用共价键相连的四个基团组成。氨基酸的通式RCα氨基羧基侧链甘氨酸HCH3丙氨酸氨基酸之间的差异主要体现在侧链部分目前六页\总数四十六页\编于十七点蛋白质分子–生命活动的执行者生物基础20种标准氨基酸氨基酸名称英文缩写简写氨基酸名称英文缩写简写甘氨酸GlyG丝氨酸SerS丙氨酸AlaA苏氨酸ThrT缬氨酸ValV天冬酰胺AsnN异亮氨酸IleI谷酰胺GlnQ亮氨酸LeuL酪氨酸TyrY苯丙氨酸PheF组氨酸HisH脯氨酸ProP天冬氨酸AspD甲硫氨酸MetM谷氨酸GluE色氨酸TrpW赖氨酸LysK半胱氨酸CysC精氨酸ArgR目前七页\总数四十六页\编于十七点蛋白质分子–生命活动的执行者生物基础氨基酸之间的差异主要体现在侧链部分氨基酸的侧链决定了不同氨基酸的物理化学性质RCα氨基羧基侧链目前八页\总数四十六页\编于十七点蛋白质分子–生命活动的执行者生物基础氨基酸的分类碱性氨基酸酸性氨基酸极性中性氨基酸非极性疏水氨基酸目前九页\总数四十六页\编于十七点蛋白质分子的结构生物基础目前十页\总数四十六页\编于十七点蛋白质分子的结构生物基础蛋白质的一级结构定义:蛋白质的一级结构指多肽链中氨基酸的排列顺序。主要化学键:肽键一级结构是蛋白质空间构象和特异生物功能的基础。胰岛素的一级结构目前十一页\总数四十六页\编于十七点蛋白质分子的结构生物基础蛋白质的二级结构定义:蛋白质分子中某一段肽链的局部空间结构,即该段肽链主链骨架原子的相对空间位置,并不涉及氨基酸残基侧链的构象。主要化学键:氢键HHHH肽单元(peptideunit)目前十二页\总数四十六页\编于十七点蛋白质分子的结构生物基础肽平面及二面角目前十三页\总数四十六页\编于十七点蛋白质分子的结构生物基础二级结构主要有以下几种形式:螺旋(-helix)折叠(-sheet)转角(-turn)无规卷曲(coil)
多肽链中有60%的区段为螺旋和折叠目前十四页\总数四十六页\编于十七点蛋白质分子的结构生物基础-螺旋多肽链主链围绕中心轴形成右手螺旋状结构,侧链伸向螺旋外侧每个氨基酸残基(第n个)的羰基与多肽链C端方向的第4个残基(第4+n个)的酰胺氮形成氢键目前十五页\总数四十六页\编于十七点蛋白质分子的结构生物基础-折叠多肽链充分伸展,相邻肽单元之间折叠成锯齿状结构,侧链位于锯齿结构的上下方两段以上的β-折叠结构平行排列,两链间可顺向平行,也可反向平行两链间的肽键之间形成氢键,以稳固β-折叠结构。氢键与螺旋长轴垂直。目前十六页\总数四十六页\编于十七点蛋白质分子的结构生物基础-转角含4个氨基酸残基,第一个残基的CO基团和第四个残基的NH基团之间形成氢键,使多肽链的方向发生“U”形改变。目前十七页\总数四十六页\编于十七点蛋白质分子的结构生物基础超二级结构在蛋白质分子中,特别是球状蛋白质中,由若干相邻的二级结构单元(即α-螺旋、β-折叠和β-转角等)彼此相互作用组合在一起,,形成有规则、在空间上能辨认的二级结构组合体,充当三级结构的构件单元,称超二级结构。目前十八页\总数四十六页\编于十七点蛋白质分子的结构生物基础蛋白质三级结构在二级结构基础上的肽链再折叠形成的构象。整条肽链中全部氨基酸残基的相对空间位置,即肽链中所有原子在三维空间的排布位置。目前十九页\总数四十六页\编于十七点蛋白质分子的结构生物基础结构域(domain)多肽链在超二级结构基础上进一步绕曲折叠而成的相对独立的三维实体称结构域蛋白质结构中具有特异结构和独立功能的区域。目前二十页\总数四十六页\编于十七点蛋白质分子的结构生物基础结构域(domain)目前二十一页\总数四十六页\编于十七点蛋白质分子的结构生物基础肌红蛋白的三级结构分子中多肽主链由长短不等的8段直的α螺旋组成最大的螺旋含23个残基最短的7个残基,分子中几乎80%的氨基酸残基都处于α螺旋区中。拐弯是由1—8个残基组成的无规则卷曲。目前二十二页\总数四十六页\编于十七点蛋白质分子的结构生物基础蛋白质四级结构每条完整三级结构的多肽链,称为亚基(subunit)蛋白质分子中各亚基的空间排布及亚基接触部位的布局和相互作用,称为蛋白质的四级结构。目前二十三页\总数四十六页\编于十七点Outline生物学基本知识常用的生物数据及数据库处理生物数据的基本处理方法目前二十四页\总数四十六页\编于十七点生物信息学数据库Background生物分子数据高速增长
分子生物学及相关领域研究人员迅速获得最新实验数据
建立生物分子数据库
目前二十五页\总数四十六页\编于十七点生物信息学数据库Background应满足5个方面的主要需求:(1)时间性(2)注释(3)支撑数据(4)数据质量(5)集成性目前二十六页\总数四十六页\编于十七点生物信息学数据库Background生物信息数据库具备的几个明显特征:数据库的更新速度不断加快数据库使用频率增长更快数据库的复杂程度不断增加数据库网络化面向应用先进的软硬件配置目前二十七页\总数四十六页\编于十七点蛋白质结构数据库BackgroundPDB(ProteinDataBank)是目前最主要的蛋白质分子结构数据库。1970由美国Brookhaven国家实验室建立,1988年,由美国RCSB(researchcollaboratoryforstructuralbiology)管理;含有通过实验(X射线晶体衍射,核磁共振
NMR,冷冻电子显微镜)测定的生物大分子(蛋白质、核酸
、糖类
、复合物)的三维结构。以文本格式存放数据,包括原子坐标、物种来源、测定方法、提交者信息、一级结构、二级结构等;
目前二十八页\总数四十六页\编于十七点蛋白质结构数据库BackgroundPDB(ProteinDataBank)目前二十九页\总数四十六页\编于十七点蛋白质结构数据库BackgroundPDB(ProteinDataBank)Jan08,2013目前三十页\总数四十六页\编于十七点蛋白质结构数据库BackgroundPDB的文件格式物种来源、测定方法、提交者信息、蛋白质序列一级结构蛋白质二级结构构成蛋白质的氨基酸的每个原子的三维坐标目前三十一页\总数四十六页\编于十七点蛋白质结构分类数据库BackgroundSCOP(StructuralClassificationofProteins)提供已知结构的蛋白质之间结构和进化关系的详细描述。按结构和进化关系对蛋白质分类,分类结果是一个具有层次结构的树,其主要的层次是家族、超家族和折叠:家族:具有明显的进化关系超家族:具有远源进化关系,具有共同的进化源折叠类:主要结构相似ROOT(根)CLASS(类)FOLD(折叠)SUPERFAMILY(超家族)FAMILY(家族)PROTEIN(蛋白)SPECIES(种)目前三十二页\总数四十六页\编于十七点蛋白质结构分类数据库BackgroundSCOP(StructuralClassificationofProteins)目前三十三页\总数四十六页\编于十七点蛋白质结构分类数据库BackgroundCATH(Class,Architecture,Topology,Homology)CATH数据库的分类基础是蛋白质结构域。与SCOP不同的是,CATH把蛋白质分为4类,即a主类、b主类,a-b类(a/b型和a+b型)和低二级结构类。
类型(Clase):二级结构构架(Architecture):超二级结构排列方式拓扑结构(Topology):二级结构的形状和二级结构间的联系同源性(Homology):序列同源性目前三十四页\总数四十六页\编于十七点Outline生物学基本知识常用的生物数据及数据库处理生物数据的基本处理方法目前三十五页\总数四十六页\编于十七点生物数据的基本处理方法Method生物信息学所用的方法和技术:数学统计方法动态规划方法机器学习与模式识别技术数据库技术及数据挖掘人工神经网络技术分子模型化技术量子力学和分子力学计算生物分子的计算机模拟因特网(Internet)技术目前三十六页\总数四十六页\编于十七点生物数据的基本处理方法数学统计方法:生物活动常常以大量、重复的形式出现,既受到内在因素的制约,又受到外界环境的随机干扰。因此概率论和数学统计是现代生物学研究中一种常用的分析方法数据统计、因素分析、多元回归分析是生物学研究必备的工具隐马尔科夫模型(HiddenMarkovModels)在序列分析方面有着重要的应用。与隐马尔科夫模型相关的技术是马尔科夫链(MarkovChain)数学统计方法Method目前三十七页\总数四十六页\编于十七点生物数据的基本处理方法2.动态规划方法:动态规划(DynamicProgramming)是一种解决多阶段决策过程的最优化方法或复杂空间的优化搜索方法动态规划解决问题的基本过程是:将一个问题的全局解分解为局部解,逆序递推求出局部最优解,随着执行过程的推进,“局部”逐渐接近“全局”,最终获得全局最优解Method目前三十八页\总数四十六页\编于十七点生物数据的基本处理方法3.机器学习与模式识别技术:机器学习:模拟人类的学习过程,以计算机为工具获取知识、积累经验遗传算法采用随机搜索方法,具有自适应能力和便于并行计算神经网络的理论是基于人脑的结构,其目的是揭示一个系统是如何向环境学习的,这一种方法被称为联接主义模式识别:机器学习的一个主要任务。模式是对感兴趣客体定量的或者结构的描述,而模式识别就是利用计算机对客体进行鉴别,将相同或者相似的客体归入同种类别中。模式识别主要有两种方法:根据对象的统计特征进行识别根据对象的结构特征进行识别Method目前三十九页\总数四十六页\编于十七点生物数据的基本处理方法3.机器学习与模式识别技术:环境知识库执行反馈学习Method目前四十页\总数四十六页\编于十七点生物数据的基本处理方法4.数据库技术及数据挖掘:数据库技术数据仓库虚拟数据库技术(VirtualDatabase,简称VDB)数据挖掘(datamining)又称作数据库中的知识发现(KnowledgeDiscoveryinDatabase),它是从数据库或数据仓库中发现并提取隐藏在其中的信息的一种新技术,它能自动分析数据,对它们进行归纳性推理和联想,寻找数据间内在的某些关联,从中发掘出潜在的、对信息预测和决策行为起着十分重要作用的模式数据挖掘过程一般分为4个基本步骤:数据选择、数据转换、数据挖掘和结果分析Method目前四十一页\总数四十六页\编于十七点生物数据的基本处理方法5.人工神经网络技术:人工神经网络(ArtificialNeuralNetwork,简称ANN)是通过模拟神经元的特性以及脑的大规模并行结构、信息的分布式和并行处理等机制建立的一种数学模型在生物信息学中,使用得最多的是反向传播神经网络(BackPropagationNeuralNetwork,简称BP网)。BP网被认为是稳定性和鲁棒性较强的人工神经网络之一,而且属于有监督学习的网络模型。标准的BP网由三层神经元组成:输入层、隐藏层和输出层Method目前四十二页\总数四十六页\编于十七点生物数据的基本处理方法5.人工神经网络技术:输入层隐藏层输出层反向传播神经网络结构示意Method目前四十三页\总数四十六页\编于十七点生物数据的基本处理方法6.分子模型化技
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年五年级语文上册 第五单元 16 太阳配套教学实录 新人教版
- 9寒冷的冬天 教学设计-2024-2025学年科学二年级上册冀人版
- 2024年五年级语文下册 第一单元 1 古诗三首新学习单教学实录 新人教版
- 2023一年级数学下册 7 找规律第1课时 找规律(1)配套教学实录 新人教版
- 3 雪地里的小画家 教学设计-2024-2025学年统编版语文一年级上册
- 2023-2024学年清华版(2012)信息技术三年级上册 第三单元《12课 写字万花筒-字型、手写、语音输入》教学设计
- 11《爸爸妈妈在我心中》(第2课时)教学设计-2024-2025学年道德与法治三年级上册统编版
- 二零二五年度法拍房屋拍卖议价与交易税费分担协议
- 2025年度桶装水电商平台合作运营与市场拓展合同
- 二零二五年度个人对个人知识产权借款合同
- 手机摄影教程全套课件
- 2025届宁夏银川一中高三上学期第五次月考英语试题及答案
- 2025年皖西卫生职业学院单招职业适应性测试题库完整
- 空调原理培训课件
- 2024年国网陕西省电力有限公司招聘考试真题
- 血液透析患者饮食的健康宣教课件
- 课件:从哪吒2与DeepSeek中感悟创新中国力量 创造更加美好明天
- 2025年熊胆眼药水项目可行性研究报告
- Unit 1 Home 单元测试卷 重难点提优卷(含答案)译林版(2024)七年级英语下册
- 现代康复治疗
- 《材料科学与工程专业生产实习》课程教学大纲
评论
0/150
提交评论