下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于特征提取的酶识别问题研究【关键词】酶识别;支持向量机;特征提取;自检法;留一法;【英文关键词】enzymeidentification;supportvectormachine;featureselection;self-consistencytest;leave-one-outtest;【中文摘要】在生物信息学中,将酶从蛋白质识别出来一直是对酶进行进一步研究的一个前提。其研究方法都是将已知的酶作为研究对象,找出一种对已知酶进行准确识别的方法,然后推广到对未知酶识别的应用中。传统的酶识别方法多是采用序列比对的方法,虽然后人对这种方法有不断地改进,但是仍需要较大的存储空间与比对时间。近些年,机器学习的方法也开始的应用到这个领域中。支持向量机SupportVectorMachine,SVM) 一种基于统计学理论的机器学习方法借助自己的无局部最小点和防止过适应等优点,迅速成为研究的热点并且在酶识别领域表现出不错的效果。为了得到好的机器学习效果,机器学习需要研究者根据实际问题的不同提出一套完整的机器学习方案。本文以支持向量机为基础,采用了一种基于特征提取的机器学习方案,通过选取合适数量的特征作为训练数据形成分类精度最高的酶识别器。之所以选用特征提取的方法主要是因为:在实验中,蛋白质的功能域被看做它的特征,并不是所有的功能域都对形成准确的分类器起到好的作用,并且我们推测这些功能域特征中存在噪声,因此应该剔除其中一些起到反作用的特征。基于以上的原因,文中选用了1-rule法和信息增益法两种...【英文摘要】Inbioinformatics,identifyingenzymesfromproteinsisaprerequisiteforfurtherresearchinenzymes.Itsmethodofresearchisthattakingknownenzymesasresearchobjectandfindingamethodcouldidentifyenzymeswithhighaccuracy,thenapplyinginidentifyingunknownenzymes.Thetraditionalmethodusedinenzymesidentificationisalignment.Althoughmanyscientistsdolotsofworktoimprovealignment,themethodstillneedsbigstoragespaceandcomputingtime.Inrecentyears,machinelearningh...摘要5-6Abstract6第1章绪论9-141.1研究的背景、目的及意义9-101.2国内外研究现状及评价10-121.3本文的内容和章节安排12-131.4本文的创新点13-14第2章基础理论14-242.1支持向量机的理论知识14-17线性可分14-162.1.2线性不可分16-172.2特征提取的原因17-182.2.1什么是特征17原因17-182.3几种特征提取方法18-241-rule18-202.3.2信息增益法20-24第3章实验步骤24-323.1实验数据24-253.1.1蛋白质酶的获取243.1.2非酶蛋白质的获取24-253.2实验数据的筛选253.3基于功能结构域组成的蛋白质数字化表示25-27Pfam数据库25-263.3.2数字化表示26-273.4特征信息计算27-281-rule法特征信息计算27-283.4.2信息增益法特征信息计算283.5学习机的选择28-293.6训练数据的选择与测试29-313.7实验过程流程图31-32第4章实验结果分析32-394.1误差率32自检法32-334.3留一法334.4实验结果33-361-rule法实验结果33-354.4.2信息增益法实
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年洗车场绿色环保技术与设备转让合同3篇
- 2024版精密机房建造协议条款版
- 2024聘请教练合同
- 二零二四平面模特演艺事业聘用合同-影视界签约范本9篇
- 2024版设备进口采购协议中英文版版B版
- 2024门窗安装安全协议与合同书
- 2025年度铝合金门窗行业绿色建筑认证合同4篇
- 2025年版IT咨询服务合同样本6篇
- 二零二四南京租房合同家具家电使用及维修协议3篇
- 2024英伦游学夏令营境外紧急联络与协助服务合同3篇
- 2025年度土地经营权流转合同补充条款范本
- 南通市2025届高三第一次调研测试(一模)地理试卷(含答案 )
- 2025年上海市闵行区中考数学一模试卷
- 2025中国人民保险集团校园招聘高频重点提升(共500题)附带答案详解
- 0的认识和加、减法(说课稿)-2024-2025学年一年级上册数学人教版(2024)001
- 重症患者家属沟通管理制度
- 医院安全生产治本攻坚三年行动实施方案
- 法规解读丨2024新版《突发事件应对法》及其应用案例
- 信息安全意识培训课件
- Python试题库(附参考答案)
- 成都市国土资源局关于加强国有建设用地土地用途变更和
评论
0/150
提交评论