本科院校-基础医学-生物信息学-第八章 基因注释与功能分类_第1页
本科院校-基础医学-生物信息学-第八章 基因注释与功能分类_第2页
本科院校-基础医学-生物信息学-第八章 基因注释与功能分类_第3页
本科院校-基础医学-生物信息学-第八章 基因注释与功能分类_第4页
本科院校-基础医学-生物信息学-第八章 基因注释与功能分类_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

本科院校-基础医学-生物信息学-第八章基因注释与功能分类

单选题A11.KEGG存储化学信息的6个数据库的内容不包括答案:(D)A:化学物质B:酶化反应C:酶分子D:处方药品

单选题A12.下列哪一选项不是KEGG的子数据库答案:(D)A:KEGGPATHWAYB:KEGGGENOMEC:KEGGORTHOLOGYD:KEGGMEDICINE

单选题A13.GO数据库最初的基因信息来源不包括答案:(C)A:果蝇B:小鼠C:拟南芥D:酵母

单选题A14.GO数据库的三个分支中不包括答案:(B)A:生物学过程(biologicalprocess)B:基因组功能注释(gnomeannotation)C:分子功能(molecularfunction)D:细胞组分(cellularcomponent)

多选题5.KEGG的子数据库被分成哪三个类别答案:(ABD)A:系统信息B:基因组信息C:物理信息D:化学信

多选题6.下面哪些情况下的两个基因被认为可能是功能相关的答案:(ABCD)A:具有序列同源性B:在GO上有相同或相关的注释结点C:在同一个蛋白质模块中D:在同一个通路中出现

名词解释题7.KO标识答案:(KEGGOrthology,KEGG通过KO标识对基因进行注释,每个KO标识代表一个来自不同物种的直系同源基因组。在KEGG通路中,每个KO标识代表着通路图中一个网络结点(在通路图中以一个方盒子表示)。在KEGG对每个对象的功能及其他等级划分中,KO标识则代表着底层的叶子结点。)

名词解释题8.富集分析答案:(如果一个生物学过程在已知的研究中发生异常,则共同发挥功能的基因极可能被选择出来作为一个与这一过程相关的基因集合。因此,富集分析方法通常是分析一组基因在某个功能结点上是否过出现。这个原理可以由单个基因的注释分析发展到大基因集合的成组分析。检验基因在某节点上是否过出现,一般用统计方法,如累计超几何分布、Fisher精确检验等。)

名词解释题9.KEGG答案:(京都基因与基因组百科全书(Kyotoencyclopediaofgenesandgenomes,KEGG)是系统分析基因功能、基因组信息的数据库,它整合了基因组学、生物化学以及系统功能组学的信息,有助于研究者把基因及表达信息作为一个整体网络进行研究。KEGG提供的整合代谢途径查询十分出色,包括碳水化合物、核苷酸、氨基酸等代谢及有机物的生物降解,不仅提供了所有可能的代谢途径,还对催化各步反应的酶进行了全面的注解,包含其氨基酸序列、到PDB数据库的链接等。KEGG数据库是进行生物体内代谢分析、代谢网络分析等研究的强有力工具之一。)

名词解释题10.GeneOntology答案:(基因本体(geneontology,GO)数据库是GO组织(GOconsortium)在2000年构建的一个结构化的标准生物学模型,旨在建立基因及其产物知识的标准词汇体系,涵盖了基因的细胞组分(cellularcomponent)、分子功能(molecularunction)、生物学过程(biologicalprocess)三个方面,目前已经成为应用最广泛的基因注释体系之一。GO术语在多个合作数据库中的统一使用,促进了各类数据库对基因描述的一致性。)

简答题11.基于不同的算法原理,可以将目前的常用富集分析工具分为哪三类,并简述其特点。答案:(常用的富集分析工具分为三类:单一富集分析、基因富集分析和模块富集分析。特点:第一类富集分析方法利用预先选定的注释基因计算每个GO结点的显著性,之后显著富集的结点被列出,这一方法是最传统的算法,也是最常用的方法。第二类基因集富集分析方法的特点是:无须预先选择感兴趣的基因集,实验值整合成p值计算。第三类模块富集分析方法继承了单一富集分析的主要思想,但是在计算p值时考虑了结点间或基因间关系。这一方法的优点是考虑了结点间或基因问关系的生物学意义,而这些生物意无法由单个基因体现。这种模块化的分析更接近生物数据结构的本质。)

简答题12.简述基于模块的方法将蛋白质互作网络用于基因功能预测的思想。答案:(蛋白质相互作用网络能够利用蛋白质之间的相关性,对未知功能的基因进行注释。一个功能模块指其中的蛋白质所处的细胞位置以及相互作用使得它们可以实:既一个特定的功能。基于模块的方法首先将网络相关的蛋白质组成不同的模块,然后根据该模块中成员的功能来得到整个模块所共有的可能的功能,从而用来预测其中未知成员的功能。基于功能模块的蛋白质功能注释方法不是单独的预测单个蛋白质的功能,而是试图发现模:央中所有蛋白质的共同内在的功能。一旦模块确定,那么可以通过一些简单的方法来预测其功能,比如该模块中如果大部分的蛋白质都具有某种功能,那么这种功能就将赋予该模块。)

简答题13.简述基因注释的主要原理和意义。答案:(原理:某个物种的基因组包括成千上万的基因甚至更多,它们在分子水平的复杂网络中相互作用。这些分子网络趋于模块化,相近的模块再形成一种组合的单元发挥功能。进一步地,这些模块可以按照进化时间组装成层级结构来发挥更高级的功能。意:快速有效的基因注释对进一步识别基因,识别基因转录调控信息,研究基因的表达调控机制,研究基因在生物体代谢途径中的地位,分析基因、基因产物之间的相互作用关系,绘制基因调控网络图,预测和发现蛋白质功能,揭示生命的起源和进化等具有重要的意义。)

简答题14.简述当前基于GO或KEGG的基因功能预测策略。答案:(首先,从总体上宏观地概括抽取信息,如不同样本问、不同时间点间全部差异基因;其次,通过GO或KEGG分析,即从GO分类结果找到实验涉及的显著功能类别或将差异基因映射到通路中,根据基因在通路中的位置及表达水平的变化算出受影响显著的通路,从而预测未知的基因功能等。)

简答题15.试述GO注释系统包含哪三个分支,并简述基于GO的基因功能预测的基本流程。答案:(GO包含的三个分支:生物学过程、分子功能和细胞组分。基于GO的基因功能预测的基本流程:首先,选定一个GO结点作为深层预测的目标结点,定义它的任何一个祖先结点为预测空间,按照GO注释的提示,将注释到预测空间而没有注释到它的任何一个子结点的基因定义为已知部分功能的基因,即预测对象;然后,通过连接注释在预测空间中互作的基因构建一个功能特异的子网,孤立的基因被排除在外,在互作子网中,注释到目标结点的蛋白质被当作阳性样本,而除预测对象外的其他蛋白质被当作阴性样本。通常一个蛋白质被赋予与其直接相互作用的邻居蛋白质中出现频率最高的几个功能。)

简答题16.富集分析中常用的统计方法有累计超几何分布、Fisher精确检验等,试简述其原理。答案:(累计超几何分布公式:《imgstyle="width:154px;height:44px"alt=""src="/Files/Image/001/001002/001002003/001002003001/001002003001021/001002003001021008/7c00bba9282249a7a049c26ad3ecb7f7.jpg"/》;其中N为注释系统中基因总数,n为将要考察的结点或通路本身注释的基因数,m为感兴趣的基因集大小,x为基因集与结点或通路的交集数目。Fisher精确检验公式:《imgstyle="width:113px;height:38px"alt=""src="/Files/Image/001/001002/001002003/001002003001/001002003001021/001002003001021008/4628d5f810b94e9eb754e4a74167d371.jpg"/》;n为系统中基因总数,a为感兴趣的基因集中的基因数目,b为将要考察的结点或通路本身所注释的基因数目,c为去除感兴趣基因以外的基因数目,d为待考察结点基因去除与感兴趣基因重合的数目。)

简答题17.试述富集分析中使用多重检验校正的过程和作用。答案:(由于在进行富集分析检验时通常需要同时进行大量检验,每个结点单:触进行检验,每个都生成一个p值。对于p值截断点0.05,单个结点通过检验的概率允许5%的随机误差。如果检验一组10000个结点,指定p值截断点为0,05,则根据概率可能会发现这些结点中有500个存在误差。基于这些统计,如果不使用多重检验修正有100个结点通过统计分析,则会有许多(如果不是全部)结点是属于正误识。因此,在对一组结点执行统计检验时,修正每个结点的p值很重要。多重检验校正会调整每个结点的个体p值,以保持总体误差率小于等于用户指定的p值截断点。)

简答题18.KEGG

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论