生物信息学试题集锦_第1页
生物信息学试题集锦_第2页
生物信息学试题集锦_第3页
生物信息学试题集锦_第4页
生物信息学试题集锦_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一 、简答。(本题满分70分)1、简述生物信息学产生的历史必然性,以及生物信息学的主要研究内容?(本小题满分20分)答:生物信息学的产生,是生物科学与计算机技术的结合。20世纪后期,生物科学技术迅猛发展,无论从数量上还是从质量上都极大地丰富了生物科学的数据资源。数据资源的急剧膨胀迫使人们寻求一种强有力的工具去组织这些数据,以利于储存、加工和进一步利用。而海量的生物学数据中必然蕴含着重要的生物学规律,这些规律将是解释生命之谜的关键,人们同样需要一种强有力的工具来协助人脑完成对这些数据的分析工作。另一方面,以数据分析、处理为本质的计算机科学技术和网络技术迅猛发展?并日益渗透到生物科学的各个领域。于

2、是,一门崭新的、拥有巨大发展潜力的新学科生物信息学悄然兴起。 生物信息学的诞生及其重要性早在1956年,在美国田纳西州盖特林堡召开的首次“生物学中的信息理论研讨会”上,便产生了生物信息学的概念。但是,就生物信息学的发展而言,它还是一门相当年轻的学科。直到20世纪8090年代,伴随着计算机科学技术的进步,生物信息学才获得突破性进展。1987年,林华安博士正式把这一学科命名为“生物信息学”(Bioinformatics)。此后,其内涵随着研究的深入和现实需要的变化而几经更迭。1995年,在美国人类基因组计划第一个五年总结报告中,给出了一个较为完整的生物信息学定义:生物信息学是一门交叉科学,它包含了

3、生物信息的获取、加工、存储、分配、分析、解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。生物信息学不仅是一门新学科,更是一种重要的研究开发工具。从科学的角度来讲,生物信息学是一门研究生物和生物相关系统中信息内容与信息流向的综合系统科学。只有通过生物信息学的计算处理,人们才能从众多分散的生物学观测数据中获得对生命运行机制的系统理解。从工具的角度来讲,生物信息学几乎是今后所有生物(医药)研究开发所必需的工具。只有根据生物信息学对大量数据资料进行分析后,人们才能选择该领域正确的研发方向。生物信息学不仅具有重大的科学意义,而且具有巨大的经济效

4、益。它的许多研究成果可以较快地产业化,成为价值很高的产品。 生物信息学的研究内容生物信息学的研究内容是伴随着基因组研究而发展的。广义地说,生物信息学从事对基因组研究相关生物信息的获取、加工、存储、分配、分析和解释。这个定义的含义是双重的:一是对海量数据的收集、整理与服务,即管理好这些数据;二是从中发现新的规律,也就是用好这些数据。具体地说,生物信息学是把基因组DNA(脱氧核糖核酸)序列信息分析作为源头,找到基因组序列中代表蛋白质和RNA(核糖核酸)基因的编码区。同时,阐明基因组中大量存在的非编码区的信息实质,破译隐藏在DNA序列中的遗传语言规律。在此基础上,归纳、整理与基因组遗传信息释放及其调

5、控相关的转录谱和蛋白质谱的数据,从而认识代谢、发育、分化、进化的规律。纵观当今生物信息学界的现状可以发现,大部分研究人员都把注意力集中在基因组、蛋白质组、蛋白质结构以及与此密切相关的药物设计上。1 基因组基因组研究的首要目标是获得人的整套遗传密码。人的遗传密码有32亿个碱基,而现在的DNA测序仪每个反应只能读取几百到上千个碱基。这样,要得到人的全部遗传密码,首先要把人的基因组打碎,测完一个个小段的序列后再把它们重新拼接起来。而基因组大规模测序的每一个环节,都同信息分析紧密相关,每一步都紧密依赖于生物信息学的软件和数据库。2 蛋白质组基因组对生命体的整体控制必须通过它所表达的全部蛋白质来执行。由

6、于基因芯片技术只能反映从基因组到RNA的转录水平上的表达情况,而从RNA到蛋白质还有许多中间环节的影响,这样,仅凭基因芯片技术人们还不能最终掌握生物功能的具体执行者蛋白质的整体表达状况。因此,近年在发展基因芯片的同时,人们还发展了一套研究基因组所有蛋白质产物表达情况的技术蛋白质组研究技术,包括二维凝胶电泳技术和质谱测序技术。然而,最重要的是如何运用生物信息学的方法去分析获得的海量数据,从中还原出生命运转和调控的整体系统的分子机制。3 蛋白质结构及新药设计基因组和蛋白质组研究的迅猛发展,使许多新蛋白序列涌现出来。要了解它们的功能,只有氨基酸序列是远远不够的。得到这些新蛋白的完整、精确和动态的三维

7、结构,是摆在人们面前的紧迫任务。近年,随着结构生物学的发展,相当数量的蛋白质以及一些核酸、多糖的三维结构获得了精确的测定。根据生物大分子结构的知识,有针对性地设计药物成为热点。生物信息学的研究不仅可以提供生物大分子空间结构的信息,还能提供电子结构的信息,如能级、表面电荷分布、分子轨道相互作用以及动力学行为的信息。但是,生物信息学的任务远不止于此,最重要的是如何运用数理理论成果,对生物体进行完整系统的数理模型描述,以便使人类能够从一个更明确的角度、以一种更易于操作的方式,来认识和控制自身以及其他生命体。2、通过一个具体实例分析,说明利用生物信息学进行DNA序列分析鉴定的策略(本小题满分20分)答

8、:(1)慢性粒细胞性白血病WT1基因WT1基因是人体内一个复杂的基因,它在一些恶性肿瘤患者体内呈现有规律的表达,这使它一直成为多年来研究的热点.WT1在人类多数急性白血病(AL)细胞异常地高表达,而在正常人的骨髓则无表达或极微量表达。.(2)在NCBI上查询WT1基因,如下图。(3)在“Top Organisms(Tree)”里选择“Homo sapiens”,如下图所示。选择后的结果:(4)选择第8条记录结果并打开,结果如下图。(5)用RepeatMasker分析和屏蔽重复序列,结果没有重复序列,如下图所示。(6)通过NCBI / VecScreen在线分析载体污染,结果为“No signi

9、ficant similarity found”,说明无载体污染详细步骤:将序列贴入,并点击【Run VecScreen】按钮,结果如下。点击 【View report 】按钮,结果如下。“No significant similarity found”,说明无载体污染(7)通过“NCBI / ORF Finder”在线分析得开放阅读框如下图所示:(网址)单击OrfFind按钮,得到如下结果:(8)采用BDGP:Neural Network Promoter Prediction来预测该序列的启动子,可通过Home(BDGP) Software Tools(Analysis Tools) Pr

10、omoter Prediction程序进入该网站。该网站能预测人和果蝇的启动子,预测结果如下:(网址)3、通过一个具体的实例分析,说明利用生物信息学进行蛋白质结构研究的策略,要求最终得到蛋白质3D建模结果(本小题满分30分)。答:1982年Prusiner(布鲁西纳)从仓鼠中分离出了一种蛋白质因子,它具有感染性,是绵羊瘙痒病和库鲁症等致命疾病的致病因子。后来的研究发现,在神经突触膜上有一种穿膜糖蛋白,肽链中富含螺旋,它是Prnp基因的正常表达产物,是prion的前身物。prion肽链中富含折叠,是致病因子,具有感染性。组成prion的物质是不含核酸的蛋白质,这种蛋白质称为prion蛋白质(pr

11、ion protein)。本题以prion蛋白质为例,利用生物信息学进行蛋白质结构研究。(1)利用BioEdit软件分析Prion的氨基酸组成:Sequence Protein Amino Acid Composition,结果如下。Protein: Prion ProteinLength = 253 amino acidsMolecular Weight = 27627.84 DaltonsAmino Acid Number Mol% Ala A 10 3.95 Cys C 4 1.58 Asp D 6 2.37 Glu E 9 3.56 Phe F 7 2.77 Gly G 45 17.7

12、9 His H 10 3.95 Ile I 9 3.56 Lys K 10 3.95 Leu L 12 4.74 Met M 11 4.35 Asn N 12 4.74 Pro P 17 6.72 Gln Q 15 5.93 Arg R 11 4.35 Ser S 15 5.93 Thr T 13 5.14 Val V 15 5.93 Trp W 9 3.56 Tyr Y 13 5.14(2)利用BioEdit软件分析Prion的亲水性(hydrophilicity)、疏水性(Hydrophobicity)情况:Sequence Protein Kyte & Doolittle Scale M

13、ean Hydrophobicity Profile,结果如下:(3)NCBI Blast bBlast(蛋白对蛋白的)可分别得该Prion的保守结构域,如下图:(4)利用“Motif Scan”网站对Prion蛋白质进行motif结构分析,分析结果如下图所示,其中,Summary一栏是该蛋白列所包含的全部motif,而Match Details一栏则是对所有这些motif的评分,即符合程度分析:(网址gi-bin/PFSCAN)(5)利用“Prosite”网站对Prion蛋白质进行motif结构分析,分析结果如下图所示(网站y.ch/prosite/):(6)利用PredictProtein

14、网站对人Prion Protien序列的二级结构预测,结果如下。(要先Register,再sign in,中间等待时间长,网址/)结果如下:(7)利用Swiss-Model网站对Prion蛋白进行高级结构预测和同源建模:ModelingmyWorkplaceAutomated Mode,只有两种结果,如下,使用rasmol软件能使蛋白空间结构可视化。二 、以一个基因或者酶蛋白,查询10个物种以上此基因或者酶蛋白的序列,用本地软件做系统树分析,并简单点评你的结果。(本题满分30分)答:在这里仍以Prion蛋白为例做系统树分析,步骤如下:(1)从NCBI查

15、询Prion蛋白序列,下载其中12个物种的,以“fasta格式”格式保存;(2)对下载的每个序列用记事本打开,检查序列的格式是否统一,并复制、粘贴到其中任意一个文件里;(3)在MEGA界面中,选择Alignment Alignment Explorer/CLUSTAL,出现下面的对话框:单击“OK”,出现如下选择框,在此我选择“Create a new alignment”。 单击“OK”,出现如下选择框:单击“NO”即可。(4)在M4界面中,单击Date Open Retrieve Sequences from File ,选择已保存的FASTA格式文件;(4)在M4界面中,双击文件名可以进

16、行修改,然后右键菜单点击删除Clustal X中附带 “”的行,然后点击Ctrl+A选中所有序列,依次点击AlignmentAlign by ClustalW出现的界面点击 OK;(5)在M4界面中,选择Data Expert Alignment MEGAFormat(保存该文件并命名),即把FASTA格式文件转化为MEGA格式文件;(6)关闭M4界面,出现界面Open The Data File in MEGA 点击YES 出现一个新界面,在MEGA4界面中,选择Phlogeny Construct Phlogeny 选择(NJ、ME、MP、UPGMA)等进化树结构类型Compute,即可得到进化树;(7)在MEGA4界面中,选择Phlogeny Bootstrap Test of Phylogeny 选择进化树结构类型(NJ、ME、MP、UPGMA) Compute,即可得到进化树;(8)在有进化树的M4界面选择Image Copy to Clipboard 直接粘贴到Word文档。图1:原始进化树图2:Bootst

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论