中山大学生物信息学期末试卷_第1页
中山大学生物信息学期末试卷_第2页
中山大学生物信息学期末试卷_第3页
中山大学生物信息学期末试卷_第4页
中山大学生物信息学期末试卷_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中山大学生物信息学期末试卷一、名词解释1、生物信息学:广义指生命科学与数学、计算机科学和信息科学等交汇融合所形成的一门交叉学科。它应用先进的数据管理技术、数学分析模型和计算软件对各种生物信息(特别是分子生物学信息)进行提取、储存、处理和分析,旨在掌握复杂生命现象的形成于演化规律。狭义专指应用信息技术储存和分析分子生物学数据,尤其是基因组序列产生的分子序列机器相关数据,也被称为分子生物信息学。2、人类基因组计划:是由美国科学家于1985年率先提出,于1990年正式启动的。美国、英国、法兰西共和国、德意志联邦共和国、日本和我国科学家共同参与了这一预算达30亿美元的人类基因组计划。3、基因芯片:又叫DNA芯片,是一种高密度的寡聚核苷酸阵列。它采用原位组合合成化学和微电子芯片的光蚀刻技术等方法,将大量特定序列的DNA片段直接固定在玻璃或硅衬底上,从而构成存储有大量信息的DNA芯片。4、中心法则:是指遗传信息从DNA传递给RNA,再从RNA传递给蛋白质,即完成遗传信息的转录和翻译的过程。也可以从DNA传递给DNA,即完成DNA的复制过程。5、一级数据库:记录实验结果和做一些初步解释的数据库。二、名词辨析1)信息技术与生物信息学:信息技术(informationscience)是研究信息的获取、传输和处理的技术,由计算机技术、通信技术、微电子技术结合而成,即是利用计算机进行信息处理,利用现代电子通信技术从事信息采集、存储、加工、利用以及相关产品制造、技术开发、信息服务的新学科。生物信息学是研究生物信息的采集,处理,存储,传播,分析和解释等各方面的一门学科,它通过综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。信息技术和生物信息学都是高新技术,二者在新经济中并非此消彼长的关系,而是相辅相成,共同推进21世纪经济的快速发展。2)基因与基因组:基因是指具有遗传效应的DNA片段。而基因组指的是单倍体细胞中的全套染色体,或是单倍体细胞中的全部基因。3)相似性与同源性:相似性是指不同染色体之间基因序列的相似或相异程度。同源性是指两个核酸分子的核苷酸序列或两个蛋白质分子的氨基酸序列间的相似程度。4)Blastn与Tblastn:blastn方法是用检测序列核酸搜索核酸序列数据库,它适合寻找分值较高的匹配,不适合远源关系。而tblastn是用检测序列蛋白质搜索由核酸序列数据库按6条链翻译成的蛋白质序列数据库。它适合寻找数据库中尚未标注的编码区。5)CDS与cDNA:CDS是内容分发服务的缩写,内容分发服务是互联网的一项新技术。与RNA链互补的单链DNA,以其RNA为模板,在适当引物的存在下,由RNA与DNA进行一定条件下合成的,就是cDNA。6)直系同源与旁系同源:直系同源指的是不同物种之间的同源性,例如蛋白质的同源性,DNA序列的同源性。旁系同源是那些在一定物种中的来源于基因复制的蛋白,可能会进化出新的与原来有关的功能。用来描述在同一物种内由于基因复制而分离的同源基因。7)敏感性与特异性:昆虫对某些低剂量的化学物质或其他物理因子能迅速地引起反应的特性。特异性是指成对、成组对象相互之间的必然对应选择关系。8)序列相似性比较与序列同源性分析:9)数据库搜索和数据库查询:数据库搜索在生物信息学中有特定的含义,它是指通过特定的序列相似性比对算法,找出核酸或蛋白质序列数据库中与检测序列具有一定程度相似性的序列。而所谓数据库查询,是指对序列、结构以及各种二次数据库中的注释信息进行关键词匹配查找。数据库查询有时也称为数据库检索,它和互联网上通过搜索引擎查找需要的信息是一个概念。三、简答题1)生物信息学数据库的组成包括哪些部分?数据库有哪些类型?答案:生物信息学数据库的组成包括一级数据库和二级数据库。数据库的类型包括核算和蛋白质一级结构序列数据库、基因组数据库、生物大分子三维空间结构数据库、以上述3类数据库和文献资料为基础构建的二次数据库。2)简要介绍GenBank中的DNA序列格式。答案:GenBank中的DNA序列格式可以分成三个部分,第一部分为描述符,从第一行LOCUS行到ORIGIN行,包含了关于整个记录的信息;第二部分为特性表,从FEATURES行开始,包含了注释这一纪录的特性,是条目的核心,中间使用一批关键字;第三部分是核苷酸序列的本身。3)简要介绍FASTA序列格式答案:FASTA格式,又叫Pearson格式,是最简单的,使用最多的格式。它的基本形式分为三个部分:⑴第一行:大于号(>)表示一个新的序列文件的开始,为标记符。后面可以加上文字说明,GenBank检索号,LOCUS名称等信息。⑵第二行:序列本身,为DNA的标准符号,通常大小写均可。⑶结束:无特殊标志,但建议多留一个空行,以便将序列和其他内容区分开。4)生物信息学数据库的要求和基本特征是什么?答案:略。5)生物信息学的基本方法有哪些?答案略6)生物信息学的目标和任务?答案:收集和管理生物分子数据;数据分析和挖掘;开发分析工具和实用软件:生物分子序列比较工具、基因识别工具、生物分子结构预测工具、基因表达数据分析工具。7)生物信息学主要研究内容。答案(1)生物分子数据的收集与管理;(2)数据库搜索及序列比较;(3)基因组序列分析;(4)基因表达数据的分析与处理;(5)蛋白质结构预测。8)为什么要构建生物分子数据库。答案:(1)生物分子数据高速增长(2)分子生物学及相关领域研究人员迅速获得最新实验数据。9)预测基因的一般步骤是什么?答案:⑴获取DNA目标序列⑵查找ORF并将目标序列翻译成蛋白质序列,利用相应工具查找ORF并将DNA序列翻译成蛋白质序列⑶在数据库中进行序列搜索,利用BLAST进行ORF核苷酸序列和ORF翻译的蛋白质序列搜索⑷进行目标序列与搜索得到的相似序列的全局对比⑸查找基因家族进行多序列比对,获得比对区段的基因家族信息⑹查找目标序列中的特定模序,分别在Prosite、BLOCK、Motif数据库中进行profile、模块(block)、模序(motif)检索⑺预测目标序列蛋白质结构,利用PredictProtein(EMBL)、NNPREDICT等预测目标序列的蛋白质二级结构。10)生物信息学所用的方法和技术。答案(1)数学统计方法;(2)动态规划方法;(3)机器学习与模式识别技术;(4)数据库技术及数据挖掘;(5)人工神经网络技术;(6)专家系统;(7)分子模型化技术;(8)量子力学和分子力学计算;(9)生物分子的计算机模拟;(10)因特网(Internet)技术。11)国际上权威的核酸序列数据库有那些?答案:(1)欧洲分子生物学实验室的EMBL。(2)美国生物技术信息中心的GenBank。(3)日本遗传研究所的DDBJ。12)生物信息学在基因芯片中的应用有哪些?答案:(1)确定芯片检测目标。(2)芯片设计。(3)实验数据管理与分析。13)生物信息学分析的数据对象主要有哪几种?这些数据之间存在着什么关系?答案:其研究重点主要落实在核酸和蛋白质两个方面,包括它们的序列、结构和功能。生物信息学以基因组DNA序列信息分析作为出发点,破译遗传语言,认识遗传信息的组织规律,辨别隐藏在DNA序列中的基因,掌握基因调控信息,对蛋白质空间结构进行模拟和预测,依据蛋白质结构和功能的关系进行药物分子设计。14)基因芯片对于生物分子信息检测的作用和意义?答案:在生命科学领域中,基因芯片为分子生物学、生物医学等研究提供了强有力的手段。利用基因芯片技术,可研究生命体系中不同部位、不同生长发育阶段的基因表达,比较不同个体或物种之间的基因表达,比较正常和疾病状态下基因及其表达的差异。基因芯片技术也有助于研究不同层次的多基因协同作用的生命过程,发现新的基因功能,研究生物体在进化、发育、遗传过程中的规律。15)在基因组序列分析方面,科学家关注哪些信息?答案:就人类基因组而言,编码区域在人类基因组所占的比例不超过3%。其余97%是非编码序列。对于非编码序列,人们了解得比较少,尚不清楚其含义或功能。然而,非编码区域对于生命活动具有重要的意义。这部分序列主要包括内含子、简单重复序列、移动元件(mobileelement)及其遗留物、伪基因(pseudogene)等。16)为什么要进行序列片段组装?在进行序列片段组装时会遇到哪些问题?答案:大规模基因组测序得到待测序列的一系列序列片段,这些序列片段覆盖待测序列,序列片段之间也存在着相互覆盖或者重叠。遇到的问题:碱基标识错误;不知道片段的方向;存在重复区域;缺少覆盖。17)序列分析的任务和目的分别是什么?答案:任务(1)发现序列之间的相似性;(2)辨别序列之间的差异。目的:(1)相似序列:相似的结构,相似的功能(2)判别序列之间的同源性(3)推测序列之间的进化关系18)PCR引物设计有哪些原则?答案:⑴产物不能形成二级结构;⑵引物长度一般在15~30个碱基之间;⑶G+C含量在40%~60%之间;⑷碱基要随机分布;⑸引物自身不能有连续4个碱基互补;⑹引物之间不能有连续4个碱基的互补;⑺引物5‘端可以修饰;⑻引物3’不可修饰;⑼引物3’端要避开密码子的第三位。19)生物分子数据类型有哪些?答案:DNA序列数据、蛋白质序列数据、生物分子结构数据、生物分子功能数据、20)基因识别:答案:基因识别,是生物信息学的一个重要分支,使用生物学实验或计算机等手段识别DNA序列上的具有生物学特征的片段。基因识别的对象主要是蛋白质编码基因,也包括其他具有一定生物学功能的因子,如RNA基因和调控因子。21)生物信息学研究意义?答案:(1)认识生物本质了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系。(2)改变生物学的研究方式改变传统研究方式,引进现代信息学方法(3)在医学上的重要意义为疾病的诊断和治疗提供依据,为设计新药提供依据22)DNA双螺旋结构模型的意义(1)为合理解释遗传物质的各种功能、解释生物的遗传和变异、揭示自然界色彩纷纭的生命现象奠定了理论基础;(2)揭示了生命世界多样性和生命本质的一致性的辨正统一;(3)现代生命科学的里程碑。23)什么是序列比对?及其基本分类?答案:序列比对(SequenceAlignment)是通过在序列中搜索一系列单个性状或性状模式来比较2个(双序列比对)或更多(多重序列比对)序列的方法。序列比对的分类:A、双序列比对:两条序列的比对。B、多序列比对:三条或以上序列的比对四、论述题1)简述人类基因组计划与生物信息学之间的相互促进关系。答案:人类基因组计划(HumanGenomeProject,HGP)是美国在1990年提出实施的一项伟大的科学计划,与阿波罗登月计划、曼哈顿原子弹计划同称为人类自然科学史上的三大计划。自实施以来,该计划在世界各国引起了很大反响。在人类基因组计划中,人们准备用15年时间,投入30亿美元,完成人类全部24条染色体中3×109个碱基对(bp,basepair)的序列测定,其主要任务包括作图(遗传图谱、物理图谱的建立及转录图谱的绘制)、测序和基因识别,还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序,以及信息系统的建立。随着人类基因组计划的提出和实施,实验数据和可利用信息急剧增加,人类基因组计划提供了以往不可想象的巨量的生物学信息资源。基因组信息的收集、储存、分发、分析显得越来越紧迫和重要,信息的管理和分析成为人类基因组计划实施过程中的一项重要工作,人类基因组计划向信息学提出了巨大的挑战。值得庆幸的是,人类基因组计划一开始就与计算机技术、信息高速公路同步发展,信息技术为生物信息学的发展提供了非常好的条件,为生物信息学的研究和应用提供了非常好的支撑。生物信息学与人类基因组计划紧密结合,互相渗透,生物信息学成为基因组计划不可分割的一部分。事实证明,人类基因组计划在生物信息学的支持下,前进步伐大大加快,已经提前完成计划,功能基因组研究也已经全面展开。而人类基因组计划反过来又大大促进了生物信息学的发展,HGP丰富了生物信息学的研究内容,促进生物信息学新思想、新方法的产生,生物信息学在最近10年迅速发展的历程证明了这一点。2)生物序列相似性搜索的blast程序包括那些版本?各自有何区别?介绍各自的分析过程。答:程序数据库查询简述方法:蛋白质可能找到具有远源进化关系的用检测序列蛋白质搜索蛋白质序列数据库的匹配序列。核酸核苷酸适合寻找分值较高的匹配,用检测序列核酸搜索核酸序列数据库不适合远源关系。蛋白质核酸(翻译)适合新DNA序列和EST序列将核酸序列按6条链翻译成蛋白质序列后搜索蛋白的分析质序列数据库。核苷酸(翻译)蛋白质适合寻找数据库中尚未标注用检测序列蛋白质搜索由核酸序列数据库按6条的编码区链翻译成的蛋白质序列数据库。核酸(翻译)核酸(翻译)适合分析EST序列将核酸序列按6条链翻译成蛋白质序列后搜索由核酸序列数据库按6条链翻译成的蛋白质序列数据库。3)掌握蛋白质结构有什么意义?为什么要

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论