生物信息学及实验课程介绍_第1页
生物信息学及实验课程介绍_第2页
生物信息学及实验课程介绍_第3页
生物信息学及实验课程介绍_第4页
生物信息学及实验课程介绍_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物信息学及实验课程介绍 Bioinformatics一、课程编号:060355二、课程类型:限选课 适用专业:生物技术本科专业 授课时间:大四上学期 课程学时/学分:48学时/3学分(理论40学时/2.5学分;实践教学8学时/0.5学分) 先修课程:动物学、植物学、细胞生物学、遗传学、基因组学三、内容简介:生物信息学(Bioinformatics)是80年代末随着人类基因组计划的启动而兴起的一门新的交叉学科,最初常被称为基因组信息学。广义地说,生物信息学是用数理和信息科学的观点、理论和方法去研究生命现象、组织和分析呈现指数增长的生物学数据的一门学科。首先是研究遗传物质的载体DNA及其编码的大

2、分子蛋白质,以计算机为其主要工具,发展各种软件,对逐日增长的浩如烟海的DNA和蛋白质的序列和结构进行收集、整理、储存、发布、提取、加工、分析和研究,目的在于通过这样的分析逐步认识生命的起源、进化、遗传和发育的本质,破译隐藏在DNA序列中的遗传语言,揭示人体生理和病理过程的分子基础,为人类疾病的预测、诊断、预防和治疗提供最合理和有效的方法或途径。生物信息学已经成为生动医学、农学、遗传学、细胞生物学等学科发展的强大推动力量,也是药物设计、环境监测的重要组成部分。 生物信息学是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也

3、将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学(Genomics)和蛋白组学(Proteomics)两方面,具体说,是从核酸和蛋白质序列出发,分析序列中表达的结构与功能的生物信息。目前基因组学的研究出现了几个重心的转移:一是将已知基因的序列与功能联系在一起的功能基因组学研究。二是从作图为基础的基因分离转向以序列为基础的基因分离。三是从研究疾病的起因转向探索发病机理。四是从疾病诊断转向疾病易感性研究。生物芯片(Biochip)的应用将为上述研究提供最基本和必要的信息及依据,将成为基因组信息学研究的主要技术支撑。生物信息学的发展为生命科学的进一步突破及药物研制过程革命性的变革提供

4、了契机。就人类基因组来说,得到序列仅仅是第一步,后一步的工作是所谓后基因组时代 (post-genome era)的任务,即收集、整理、检索和分析序列中表达的蛋白质结构与功能的信息,找出规律。生物信息学将在其中扮演至关重要的角色。 生物学与信息科学是当今世界上发展最迅速、影响最大的两门科学。而这两门科学的交叉融合形成了广义的生物信息学,正以崭新的理念吸引着科学家的注意。生物信息学(Bioinformatics)是生命科学领域中的新兴学科,面对人类基因组计划所产生的庞大的分子生物学信息,生物信息学的重要性将越来越突出,它无疑将会为生命科学的研究带来革命性的变革。生物信息学是根据生物信息学院及相关

5、学科各年级学生对生物信息科学领域相关的一些主要技术的理论与实践操作进行开设。它的主要目的是在理解实验理论的基础上着重于实践操作过程中的问题解决,也就是如何熟练地做好漂亮的实验。比如:如何加强对分子生物学实验结果的预测与分析等等。将有助于提高学生的工作、学习和今后的科研工作中分析合解决问题的能力。四、选用教材:生物信息学概论 罗静初等译, 北京大学出版社 2002生物信息学及实验教学大纲一、课程编号:060355二、课程类型:限选课 适用专业:生物技术本科专业 授课时间:大四上学期 课程学时:理论教学40学时/2.5学分;实践教学8学时/0.5学分 先修课程:动物学、植物学、细胞生物学、遗传学、

6、基因组学三、生物信息学课程介绍 生物信息学(Bioinformatics)是80年代末随着人类基因组计划的启动而兴起的一门新的交叉学科,最初常被称为基因组信息学。广义地说,生物信息学是用数理和信息科学的观点、理论和方法去研究生命现象、组织和分析呈现指数增长的生物学数据的一门学科。首先是研究遗传物质的载体DNA及其编码的大分子蛋白质,以计算机为其主要工具,发展各种软件,对逐日增长的浩如烟海的DNA和蛋白质的序列和结构进行收集、整理、储存、发布、提取、加工、分析和研究,目的在于通过这样的分析逐步认识生命的起源、进化、遗传和发育的本质,破译隐藏在DNA序列中的遗传语言,揭示人体生理和病理过程的分子基

7、础,为人类疾病的预测、诊断、预防和治疗提供最合理和有效的方法或途径。生物信息学已经成为生动医学、农学、遗传学、细胞生物学等学科发展的强大推动力量,也是药物设计、环境监测的重要组成部分。 生物信息学是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学(Genomics)和蛋白组学(Proteomics)两方面,具体说,是从核酸和蛋白质序列出发,分析序列中表达的结构与功能的生物信息。目前基因组学的研究出现了几个重心的转移:一是将已知基因的序列与功能联系在一起的功

8、能基因组学研究。二是从作图为基础的基因分离转向以序列为基础的基因分离。三是从研究疾病的起因转向探索发病机理。四是从疾病诊断转向疾病易感性研究。生物芯片(Biochip)的应用将为上述研究提供最基本和必要的信息及依据,将成为基因组信息学研究的主要技术支撑。生物信息学的发展为生命科学的进一步突破及药物研制过程革命性的变革提供了契机。就人类基因组来说,得到序列仅仅是第一步,后一步的工作是所谓后基因组时代 (post-genome era)的任务,即收集、整理、检索和分析序列中表达的蛋白质结构与功能的信息,找出规律。生物信息学将在其中扮演至关重要的角色。四、生物信息学课程的性质和任务 生物学与信息科学

9、是当今世界上发展最迅速、影响最大的两门科学。而这两门科学的交叉融合形成了广义的生物信息学,正以崭新的理念吸引着科学家的注意。生物信息学(Bioinformatics)是生命科学领域中的新兴学科,面对人类基因组计划所产生的庞大的分子生物学信息,生物信息学的重要性将越来越突出,它无疑将会为生命科学的研究带来革命性的变革。 生物信息学是根据生物信息学院及相关学科各年级学生对生物信息科学领域相关的一些主要技术的理论与实践操作进行开设。它的主要目的是在理解实验理论的基础上着重于实践操作过程中的问题解决,也就是如何熟练地做好漂亮的实验。比如:如何加强对分子生物学实验结果的预测与分析等等。将有助于提高学生的

10、工作、学习和今后的科研工作中分析合解决问题的能力。五、生物信息学讲授纲要及学时分配(根据具体情况可作适当调整)(一)理论教学内容:第1章 生物信息学概论1.1 生物信息学的概念和发展历史1.1.1 生物信息学的定义1.1.2 生物信息学兴起的生物学和计算机技术背景1.1.3 国内外生物信息学发展历史1.2 生物信息学的生物学基础 1.2.1 分子生物学基础1.2.2 基因组学基础1.3 生物信息学的计算机和网络基础1.3.1 计算机硬件平台(PC、MACINTOSH、Workstation、Supercomputer)1.3.2 计算机操作系统(WINDOWS、MAS OS、UNIX/LINU

11、X)1.3.3 数据库技术1.3.4 计算机算法1.3.5 计算机编程语言(C+, VB, PERL, HTML, XML)1.3.6 网络技术(WWW、FTP、BBS、EMAIL、)1.4 生物信息学的数学基础1.4.4 离散数学1.4.2 概率论与数理统计1.4.3 人工神经网络1.4.4 数据挖掘1.5 生物信息学的产业化1.5.1 生物信息学的产业化1.5.2 国内外生物信息学公司和著名产品简介1.6 生物信息学研究内容和发展前景展望1.6.1生物信息学的主要研究内容1.6.2 后基因组时代生物信息学的研究方向1.6.3 生物信息学的发展前景第2章 分子生物学数据库2.1 生物学数据库

12、概述2.1.1 数据库的分类2.1.2 数据格式2.1.3数据库的冗余与偏误2.2 核苷酸序列与基因组数据库 2.2.1 GenBank数据库与ENTREZ网络服务(2.1.1 1 GenBank序列数据库简介, 一级和二级数据库, 数据库格式 数据库, 剖析GenBank Flatfile)2.2.2 EMBL核苷酸序列库与EBI网络服务2.2.3 DDBJ数据库2.2.4密码子使用与核苷酸信号数据库2.2.5基因组序列数据库GSDB2.2.6人类基因组数据库GDB2.2.7模式生物基因组数据库MGD、ECDC、NRSub2.2.

13、8基因组的图形交互显示和检索、浏览工具资源2.3 蛋白质序列与模式、同源性数据库 2.3.1蛋白质序列数据库PIR-International2.3.2蛋白质序列数据库SWIIS-PROT2.3.3 蛋白质家族分类数据库2.3.4蛋白质基序与结构域数据库( Prosite、Blocks、PRINTS和SBASE数据库)2.4 结构数据库2.4.1结构数据库简介2.4.2 PDB:Brookhaven国家实验室蛋白质数据库2.4.3 MMDB:NCBI的分子建模数据库2.4.4 结构文件格式2.4.5 结构信息显示2.4.6 数据库结构浏览器2.5 基因和分子的互作和代谢途径信息数据库2.5.1

14、基因和基因组百科全书数据库KEGG2.5.2 E.coliK-12基因组和代谢途径数据库2.5.3 E.coli基因及其产物的数据库GenProtEC2.5.4果蝇的遗传和分子数据的数据库FlyBase 2.6 RNA核苷酸序列数据库2.6.1 18S RNA2.6.2 28S RNA2.6.3 5S RNA2.6.4 Mt rna2.7 线粒体DNA数据库2.7.1 MITOMAP2.7.2 MmtDB 2.8 免疫球蛋白、T细胞受体、MHC的整合数据库lMGT 2.9 突变数据库 2.10 放射杂交作图数据库Rhdb 2.11 限制酶数据库REBASE与分子探针数据库MPOB 2.12 其

15、它遗传学与分子生物学资源2.13 数据库中存在的问题及使用注意事项第3章 序列比对与数据库检索3.1 序列比对概述3.1.1序列比对的概念和进化理论基础3.1.2序列比对的分类(双序列比对和多序列比对)3.2 双序列比对3.2.1 Needleman-Wunsch 算法3.2.2 Smith-Waterman 算法3.2.3 Karlin-Altchul 统计方法3.2.4 替换矩阵 ( 替换矩阵的一般原理; PAM 氨基酸替换矩阵; BLOSUM 氨基酸替换矩阵; DNA 替换矩阵) 3.2.5相似性得分、取代罚分与空位(Gap)罚分3

16、.3 比对的统计学显著性3.3.1 Monte Carlo仿真法 3.3.2 BLAST得分显著性的Karlin-Altschul公式 3.3.3局部配准的统计显著性3.3.4短序列配准的显著性评价3.3.5核酸序列比较的显著性评价3.4 多序列比对 3.4.1多序列比对的算法 3.4.2 DNA多序列比对及其常用软件 3.4.3 蛋白质多序列比对及其常用软件3.5数据库搜索 3.5.1 BLAST:核酸数据库搜索3.5.2 BLAST:蛋白质数据库搜索3.5.3 FASTA:另一种搜索策略3.5.4 有空位对准的BLAST程度与位置特异的迭代BLAST程序3.6基因组长序列比对第4章 DNA

17、序列的统计学与信息学分析4.1单一序列的组成、关联性与信息学分析4.1.1 碱基组成4.1.2 碱基相邻频率4.1.3同向与反向重复序列分析4.1.4 DNA 序列的几何学分析Z 曲线4.1.5核苷酸序列的长程相关与非线性方法4.1.6长程互作对DNA的结构和可变性的作用4.1.7重复对熵的影响4.1.8编码片段的相互信息4.1.9 DNA序列的模式结构4.1.10 语言学复杂性测度4.1.11 非编码区(“Junk”DNA)基因组序列 4.2 密码子指纹与密码子使用偏好性分析4.2.1单、双核苷酸的相对丰度和基因组指纹分析4.2.2密码子频率和密码子指纹4.2.3基因间和基因类间的异质性 4

18、.3编码DNA片段的长度与GC含量 4.4重叠基因的信息论问题4.7 功能相关基因在两个基因组间或内部的聚类关系 4.7.1基因组比较与基于功能组成的物种间的比较4.7.2两个细菌基因组间或内部的聚类关系4.8 真核生物的基因表达调控(表达促进网络)4.8.1相对同义密码子使用值与密码子适应指数4.8.2信息聚类方法与自身一致信息聚类4.8.3碱基组成及相关性与基因表达的关系 第5章 核酸序列的信号和功能识别5.1 固定序列模式检索5.2 短寡聚核苷酸序列的随机出现机率5.3 编码区DNA寡聚体出现频率5.5 蛋白质基因识别5.5.1开放阅读框架分析5.5.2编码区识别碱基组成偏

19、歧法密码子使用法密码子偏歧法5.5.3基因识别GenLang基因识别GRAIL基因识别5.5.4基因识别的一些相关程序发现和屏蔽重复序列相似性与标纹数据库搜索整合的基因识别序列片段的编码区分析其它功能信号识别5.4 核酸序列的特殊信号检索5.4.1基准序列频率表和权值矩阵法5.4.2启动子分析5.4.3内含子/外显子剪接位点识别5.4.4 翻译起始位点和翻译终止位点识别 5.6 编码序列翻译5.7限制性酶作图5.7.1限制性酶位点寻找5.7.2 绘制限制酶作图5.8 P

20、CR引物和寡核苷酸探针设计5.8.1 引物设计( PCR引物的类型和一般要求; 通用 PCR引物设计方法; 特异性PCR引物设计方法; 从蛋白质序列设计简并引物; OLIGO6和PRIMER PREMIER 软件使用)5.8.2 用于检测相关基因的简并探针设计第6 章NA序列分析与结构预测6.1 RNA标纹识别和局部结构配对61.1信号搜索:概率方法61.2信号搜集:模式匹配方法61.3 tRNA的二级结构预测61.4 RNA序列的局部结构配准 第7 章蛋白质序列分析与结构预测方法71 多肽理化性质计算与预测71.1

21、 多肽分子量、等电点、电荷分布和酶切特征预测7.1.2 多肽亲水性/疏水性分析与制图7.1.3 多肽抗原位点分析7.1.4 多肽7.2 蛋白质家族与蛋白质分类 7.2.1蛋白质家族与超家族7.2.2 蛋白质分类的方法( Blocks分类方法加权特征标纹分类方法 Profile方法)7.3蛋白质序列模式和结构域模式分析7.3.1基准序列(序列模式):标纹、标志、指纹和地点7.3.2序列结构域与模式匹配方法频率表方法权值矩阵法:Profile分析6.4蛋白质结构预测与分子设计 6.4.1蛋白质结构预测6.4.2蛋白质二级结构和和

22、折叠类预测6.4.3三级结构预测6.4.3合理药物分子设计第8章 核酸和蛋白质序列的进化分析8.1 分子系统发育概述8.2 系统发育模型的组成8.2 系统发育数据分析的一般步骤8.3 建立数据模型(比对)8.4 决定取代模型8.5 建树方法 8.5.1 距离矩阵法(UPGMA,NJ) 8.5.2 最简约法 8.5.3 极似然法8.6 进化树搜索8.7 确定树根8.8 评估进化树和数据8.9 系统发育软件(MEGA2, PAUP*, MACCLADE, PHYLIP)第9章 基因组测序与分析9.1 DNA 测序与序列片段的拼接9.1.1 DNA 测序的一般方法9.1.2 DNA 测序策略(9.1

23、.2.1 从遗传图谱、物理图谱到基因组序列图谱; 鸟枪测序法(shotgun sequencing); 引物步查法(primer walking ); 限制性酶切-亚克隆法(restriction endonuclease digestion and subcloning)9.1.3 序列片段的拼接方法9.2 编码蛋白质基因区域的预测9.2.1 从序列中寻找基因 ( 基因及基因区域预测; 发现基因的一般过程; 解读序列)9.2.2基于编码区特性的最长ORF 法等9.2.3 数据库相似性搜索法9.2.4 神经网络

24、法9.2.5 隐马尔可夫模型法(HMM)9.3 基因组的比较9.3.1比较基因组学9.3.2 基因组多样性9.3.3 基因组比较的方法9.4 人类基因组制图与测序 9.4.1人类基因组制图 (遗传图, 物理图, 序列图, 转录图(表达图)与cDNA文库构建)9.4.2 基因组遗传图的构建方法 (检测连锁与估计重组率, 估计相对图距和推测多位点测序, 2.2.1图距与交叉干涉, 2.2.2推测多位点测序)9.5 基因组物理图谱与测序 (克隆与克隆库, 随机克隆重叠构图)9.6锚定法作图

25、9.7检测重叠的Bayes方法9.5.1重叠构型9.5.2重叠检测9.8由随机克隆的指纹法组装物理图9.9用YAC克隆构造人类基因组图谱的策略设计9.10采用高冗余度的亚克隆库9.11 Conting图或克隆定序9.12 直接作图法9.11有序鸟枪测序作图的仿真分析9.14定位克隆的流水线鸟枪策略9.15放射杂交作图和FISH作图(二)实践教学内容: 实验1. 常用分子生物学数据库的使用和数据格式、数据库查询与下载实验2. DNA序列的统计学、信息学和功能分析实验3 蛋白质序列分析和结构预测实验4. 核酸和蛋白质序列的进化分析(CLUSTALX)实验5. 使用Premier3软件设计PCR引物

26、实验6. 常用重要生物信息学软件使用方法(VectorNT suite)(三)教学学时安排:章   目授课学时第1章 生物信息学概论2第2章 分子生物学数据库4第3章 序列比对与数据库检索6第4章 DNA序列的统计学与信息学分析4第5章 核酸序列的信号和功能识别6第6章 RNA序列分析与结构预测2第7章 蛋白质序列分析与结构预测方法4第8章 核酸和蛋白质序列的进化分析6第9章 基因组测序与分析6实验1. 常用分子生物学数据库的使用和数据格式、数据库查询与下载1实验2. DNA序列的统计学、信息学和功能分析2实验3 蛋白质序列分析和结构预测1实验4. 核酸和蛋白质序列的进化分

27、析(CLUSTALX)1实验5. 使用Oligo和Primer3软件设计PCR引物1实验6. 常用重要生物信息学软件使用方法(VectorNT suite)2总计48六、课程教学的基本要求 1以现代观点审视和重新组织教学内容,使课程的内容和结构、概念的提法、名词的解释和语言运用等都适合生物学以及信心科学迅速发展的要求,建立新的、优化的生物信息学课堂教学体系。 2在教学中以“实例导向”、“实际操作”的方法反映当代生物信息学科的成就,使学生在学习基础知识的同时,通过一定的“实例”看到学科发展的前沿,通过“实际操作”看到目前学的知识的应用价值,看到基础知识的延伸及与其他相关学科的密切联系,使学生在学

28、习基础知识的同时获得一定量的最新信息,满足和激发学生的求知欲和主动学习的兴趣。 3采用多媒体等现代化教学手段辅助教学,丰富教学内容,提高教学质量。 4课堂教学与学生的课后复习、讨论相接合,并注意通过各种渠道保持与学生的联系,随时了解他们对教学的意见和要求,不断改进教学方法和教学手段。七、课程内容的重点和深广度要求 第1章 生物信息学概论:掌握生物信息学概念,初步熟悉生物信息学研究内容,了解生物信息学生物基础、计算机和网络基础、以及数学基础。 第2章 分子生物学数据库:了解各个数据库名称,所存储信息,初步了解查找数据库的方法。 第3章 序列比对与数据库检索:熟悉序列比对的概念和进化理论基础、分类

29、,了解BLAST,了解各算法特性。初步了解各软件使用方法。 第4章 DNA序列的统计学与信息学分析:熟悉单一序列的组成、关联性与信息学分析,熟悉真核生物的基因表达调控。了解密码子指纹与密码子使用偏好性分析,编码DNA片段的长度与GC含量,重叠基因的信息论问题以及功能相关基因在两个基因组间或内部的聚类关系。 第5章 核酸序列的信号和功能识别:熟悉固定序列模式检索与蛋白质基因识别,了解短寡聚核苷酸序列的随机出现机率以及编码区DNA寡聚体出现频率以及核酸序列的特殊信号检索。 第6章 RNA序列分析与结构预测:熟悉RNA标纹识别和局部结构配对、信号搜索:概率方法、信号搜集:模式匹配方法等。了解tRNA

30、的二级结构预测以及 RNA序列的局部结构配准。 第7章 蛋白质序列分析与结构预测方法:熟悉蛋白质家族与蛋白质分类,多肽理化性质计算与预测。了解蛋白质序列模式和结构域模式分析和蛋白质结构预测与分子设计。 第8章 核酸和蛋白质序列的进化分析:熟悉分子系统发育概述、系统发育模型的组成系统、发育数据分析的一般步骤以及建树方法、进化树搜索等 第9章 基因组测序与分析:熟悉DNA 测序与序列片段的拼接、编码蛋白质基因区域的预测、基因组的比较以及各种作图方法。了解人类基因组制图与测序。八、对学生课外作业的要求 了解与生物信息学相关的一些数据库、研究工具和工作平台,要求学生对其中重要的内容按所给题目写出读书报告。九、本课程与后续课程的关系 无十、对学生能力培养的要求 本课程是生物信息学院的专业基础课,使学生掌握处理以基因组序列信息为主的当前海量生物信息数据的原理、方法和工具,能熟悉当前生物信息学科的现状和发展方向,了解生物信息学在其他领域的应用前景。十一、教材及主要参考书 教材:生物信息学概论 罗静初等译, 北京大学出版社 2002 参考书:1. 生物信息学:基因和蛋白质分析的实用指南 李衍达, 孙之荣等译, 清华大学出版社, 2000; 2. 蛋白质分子结构(第一版) 阎隆飞, 孙之荣主编

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论