生物信息学 第七章 基因组信息学_第1页
生物信息学 第七章 基因组信息学_第2页
生物信息学 第七章 基因组信息学_第3页
生物信息学 第七章 基因组信息学_第4页
生物信息学 第七章 基因组信息学_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物信息学第七章 基因组信息学生物科学与技术学院2本课目录一、总括二、基因组组装三、基因芯片四、PCR引物设计3一、总括基因组基因组( (Genome):一个细胞、细胞器或病毒中的所有DNA(或RNA)功能基因组学:功能基因组学:以解释基因组的功能及控制机制控制机制为目标,其核心问题是研究基因组多样性,表达及调节,模式生物比较基因组学:比较基因组学:将不同物种基因组进行比较,其有助于根据同源性方法分析基因组功能;有助于发现人类和其他生物的本质差异,探索遗传语言的奥秘。4真核生物(eukaryote)的基因组 动物、植物、真菌(fungi)等真核生物的细胞内包含膜结构的部分,如细胞核、细胞器(如

2、线粒体,植物的叶绿体),大小107-1011bp 重复序列多,LINE(long interspersed nuclear elements,长散布重复序列), SINE(short interspersed nuclear elements,短散布重复序列), LTR, transposon(转座子),微卫星(microsatellite) 较低等的真核生物基因更紧凑,内含子少 细菌和古细(生)菌(archaea)等的细胞内不包含膜结构的部分,多数基因组为单个环状DNA分子,还可含有环状或线性的质粒(plasmid),大小105-107bp 基因比低等真核生物更紧凑,有操纵子(operon)

3、,无内含子(除少数古细菌外),重复序列少(只有少数转座子)原核生物(prokaryote)的基因组5高等、低等真核生物和原核生物的基因组酿酒酵母酿酒酵母6基因组作图(mapping genomes)对生物的基因进行鉴定(测序),以此测定它的染色体对生物的基因进行鉴定(测序),以此测定它的染色体上的特定位置,然后用图示的方式把它表示出来,就形上的特定位置,然后用图示的方式把它表示出来,就形成了基因图谱。成了基因图谱。为什么要作图?主要是为了测序一次一次实验一般只能得到100b)芯片,多是PCR产物,点样法制备,用于RNA表达分析lmacroarray/high density filter:25

4、点/cm2,用于初步测试mRNA丰度lmicroarray: 1千点/cm2, 数万点/片,2002000bp2、短的寡核苷酸探针(25b)芯片(oligonucleotide chip)l在片合成法制备,用于RNA表达或序列分析l30万点/cm2 (光刻法可达百万),3万基因基因芯片制备方法1、在片(原位)合成法:它通过一组定位模板来决定基片表面上不同化学单体的偶联位点和次序。在片合成法制备DNA芯片的关键是高空间分辨率的模板定位技术高空间分辨率的模板定位技术和固相合成化学固相合成化学技术技术的精巧结合。目前,已有多种模板技术用于基因芯片的在片合成,如光去保护并行合成法、光刻胶保护合成法、微

5、流体模板固相合成技术、分子印章多次压印原位合成的方法、喷印合成法。在片合成法可以发挥微细加工技术的优势,很适合制作大规模DNA探针阵列芯片,实现高密度芯片的标准化和规模化生产。在片在片( (原位原位) )合成法合成法探针手臂阵列探针手臂阵列荧光标记靶基因荧光标记靶基因杂交后发出荧光信号区域杂交后发出荧光信号区域2、点样法:首先按常规方法制备cDNA(或寡核苷酸)探针库,然后通过特殊的针头和微喷头,分别把不同的探针溶液,逐点分配在玻璃、尼龙或者其它固相基底表面上不同位点,并通过物理和化学的结合使探针被固定于芯片的相应位点。这种方式较灵活,探针片段可来自多个途径,除了可使用寡聚核苷酸探针,也可使用

6、较长的基因片段以及核酸类似物探针(如PNA等)。探针制备方法可以用常规DNA探针合成方法、或PCR扩增的cDNA、EST文库等。固定的方式也多种多样。点样法的优越性在于可以充分利用原有的合成寡核苷酸的方法和仪器或cDNA探针库,探针的长度可以任意选择,且固定方法也比较成熟,灵活性大适合于研究单位根据需要自行制备科研型基因芯片,制作点阵规模较小的商品基因芯片。生物信息学在基因芯片中的作用1.确定芯片检测目标提取什么信息 (what)2.芯片设计如何提取信息 (how)可靠性分析 (whether)3.实验数据管理与分析如何处理和利用信息/数据挖掘 (data-mining)芯片设计主要包括两个方

7、面:1、探针的设计:通过数据库搜索:,取得序列数据、序列特征(突变等)2、探针布局的设计:根据变异检测型芯片的要求,设计出能检测出发生变异的位置,能发现发生了什么样的变化的芯片。注意:检测变化点应位于探针中心,以得到最大分辨率基于芯片的序列分析测序:通过与寡核苷酸探针(长度为k,有重叠)的杂交结果确定靶序列中存在的所有k长度片段,然后根据这些片段重构靶序列。直接检测目标序列探针的长度在20到30之间,同一组探针之间相互尽可能不重叠或少重叠,以提高探针的敏感性和特异性。突变检测(对于目标序列上已知的突变点)单探针设计:以该点为中心,从目标序列选取一个片段,作为设计探针的参考单探针设计:以该点为中

8、心,从目标序列选取一个片段,作为设计探针的参考序列,根据参考序列,分别设计四个高度特异的探针,这四个探针除中心位置外序列,根据参考序列,分别设计四个高度特异的探针,这四个探针除中心位置外均相同并与参考序列互补均相同并与参考序列互补多探针设计:将上面的四个变异探针改为多探针设计:将上面的四个变异探针改为( (组内互有重叠的组内互有重叠的) )四组探针四组探针单探针和多探针的突变检测芯片设计示意单探针单探针多探针(其中一组)多探针(其中一组)基于芯片的基因功能分析基因表达分析1、表达型基因芯片:采用高通量(high-throughput)基因表达检测技术,全面分析基因的表达水平,了解基因的功能。2

9、、基因表达图谱:基于芯片的表达监控实验产生大量的数据,在这些数据背后隐藏着丰富的基因相互作用、基因功能信息,需通过数据分析揭示这些信息。这种根据基因芯片获得的表达图谱有别于以前的物理图和功能图,能更直接地揭示基因组中各基因相互关系。基因芯片检测结果的分析荧光检测图像处理1、图像的预处理(除噪等)2、基因芯片与样本杂交后,用图像扫描仪器捕获芯片上的荧光图像,计算机的图像常由象素点所组成,每个象素点的灰度值或颜色对应一个数检测结果可靠性分析1、根据实验误差,计算可靠性(后)2、(更精确)建立芯片杂交过程的计算机仿真实验模型),以便在制作芯片之前分析所设计芯片的性能,预测可靠性基因芯片信息的管理和利

10、用 芯片信息管理 芯片信息管理数据库 主要收集、管理表达型基因芯片的实验数据 数据集成和交叉索引30PCR引物设计(PCR primer design) 什么是PCR(polymerase chain reaction) ?31PCR引物设计内容 目的:是为了找到一对合适的核苷酸片段,使其能有效地扩增模板DNA序列。 引物的优劣直接关系到PCR的特异性与成功与否 一般引物长度为1530b,理想的扩增片段长度为2001000bp 方法:Step 1、找到DNA序列的保守区Step 2、预测将要扩增的片段单链是否形成二级结构一些概念退火(annealing/hybridisation):两条互补单

11、链由氢键形成双链,退火温度Ta解链温度(melting temperature, Tm):将双链解开成单链所需的温度,Tm = 4(G + C) + 2(A + T)度,若buffer中有盐(gi|297794616|ref|XM_002865147.1| Arabidopsis lyrata subsp. lyrata 16S rRNA processing protein RimM family, mRNA AAGAGATAATGCTGAGACCTTCGCTTCTCTGTTCTTCGGCCTCAATCACTTTCACTCCAATTCAACTATTCAATCCCAATTTCTCCCCTCAT

12、TTCCAAAGCTTCGAAGTATCTCGTCCCGTCTCGGCTTTGTCTCGTACCAAAAATTGTCACTTCAGTCTCGTGAGAGCTCGTGGGAAATCCAGCTTCCTCGTTCGTAGCACCGCTACTCAAGAAGCTGTTGAAACCAGTAGTAAAAGTGAATTGGATTTAGTTGAAGTTGGATTCTTGTCTGGTGTTCATGGCTTACAAGGCGAGATTTGCATAAAACCAAACACTGATTTTCCTGATTTACGTTTCTCCAAGCCTGGTAGAAGATGGTTAAAACAACAATTGATGGGACAAGAAAAAATT

13、GATGAGGTTGAATTAGTTGAAGGAAGACCTCATCCTGCCCAGAAGAGTTGGATTCTTAAGTTTCGAGGGTTGGATGATGTTGATCAGGTGAGACAACTCGTTGGTGCAACTCTGCTTGCTGAGGACGATGATCGTCCTGAGCTTGATGATGATGAATTTTACTCTCGTGATCTTGTAGGCATGAAAGTTCTTCTCAAGGAGACGGGTCAACTTGTTGGAACTGTTGCTAATATTTTCGACAATGGAGGAAATGATCTTCTACACGTTTTGCTTGACTCATCCATGGAAGTCTGCAACGGG

14、AGTGCAAAGACCAATCAGCTTGTGTGGATACCTTTTGTAGACGCAATTGTTCCTGATGTTGATTTAGAAAGAAAAGAGATGTATATAACTCCCCCGAAGGGACTCCTCGAGGTGAATATGCGAGCAGATGATCGGTCCAAGAAAGAAAGGCGGCAGCTTGAATGGAAAGAAAGAAAAAAGCAGCAGAAGCGTCTTATTTCTGCTAAAAAGAAGTTATGTGAATTGGAGCAAAAGCATGTGTTTGATGGATTAAGGTTTGGAGAAAAGTCTCAAAGGAATTTACTTGCTGATCATATCCTT

15、GACGTAAACTCCACACTGCTTCAGAAAGCGTTGCAAAGTATTGACACCTCATCGAAGAGATGGAATGTAATTGAGGAAATCAATGAGCTGAGAGCTAGAGTATCGGAATGTACTCTGAATGTGTCACGAGAATGCCTTAGTTTTGATGCAAGCAAAGAGAAAATGGGTGATAACTTCAGTTACCTTCAACAAGGGAAAAGTCTATTCTCTGAGGGTAAAGTTTCTATTTGTTTGGTTCTCAATGATCACGAGAACGAACAACCAGAAGGTGAGAATGGTGTAGTCTCGTACCTTCATACA

16、CTACTTGATGAGGAGCAGAGTTTCATAAAGGAAGAAGATCACGCTTGCGTGCCACTTGTCATAGTTTCCCCTGAACATACCGTTGAAGCTCTGCAGAAGCTATTTCAGATAATGATCATTTTGGATTTGAAGCAGAAAAGATCTGGATTCTCAAAGAAGAAACGCTTCCAGTAGTATGTAGCTCACCAGAGGAACCGAAAAAGCACAAGATTTTGATGAAATCTCCATGGGAGATACTTAAGTCCCCGGTTGGCTCTGGAGGAGTCTTGAGCATCCTTGCTTCACATGGAATTACAGACT

17、CTCTTTCCAGTCTGGGAATCGATTATCTTCAGGTACACAGCATTGAAACAAAACCACAACCTTCGCAACATTACATCAATCCGATGCTCGTTGGATTTGCTAGTGCAAAAGGTGCTGAGATTGGGATCCAGATGACCGAAGAATCTGTATTCAAGAACTTGGAAATGGCATTCTCAATGAAGTTTTTGAAGAGATTAAAGGGCAAAATCGAGTTTGAAGCTGTTATGAAGATGCACTCACATGTTCAGAAGGTTGAAAAGGAGTGGGTTGAGTCCGTACCATCAGAACCGAACTCGTTGA

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论