基因组学技术概要_第1页
基因组学技术概要_第2页
基因组学技术概要_第3页
基因组学技术概要_第4页
基因组学技术概要_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一讲绪论Genomics:以生物信息学分析为手段研究基因组的组成、结构、参加进行了人体基因作图,测定人体23对染色体由3×109核苷酸组成的全部HGP的目标:(1)人类DNA测序(2)发展测序技术(3)鉴定人类基因组变异(4)发展有效的基因组学技术(5)比较基因组学mn11(1)基因组学依赖于测序;(2)基因组学是数据引导的学科,而不是假说驱动的;第二章基因组研究主要网站介绍•蛋白质序列(已知的和预测的)ibusdbSNPetceO快速找到与长度大于40个碱基的序列的相似性大于等于95%的序列,是BLAST-LikeAlignmentTool,但不是BLAST,可用于找到序列在基因组中的位22atedwithatrackintextformattocalculateintersections第三章测序原理与进展一组(4种)荧光标记引物,其序列相同,但标记的荧光染料颜色不同。定义:将荧光染料标记在作为终止底物的双脱氧单核苷酸上荧光标记终止底物法的异同点:33SOLiDSOLiD测序(杂交的方法)[本版本重点介绍杂交过程]R碱基,反复进行循环,便可以边合成边测序)IIuminasequencingtechnology测序:完成扩增,这时每一个DNA片段都在平板上扩增为了一簇;判断第一个碱基(每一轮合成都加入四种不同荧光素序44N[附注:细心的同学可能会有这样的疑问:每一种颜色的荧光都对应四种碱基对 (见上图),在确定序列时怎样确定第一个碱基呢?老师上课时也没有讲清楚,优缺点DNA100bp的片段,将DNA分子变性后在其末端连接A剪切掉碱基上的阻断集团,在加入其他种类的dNTP,同样的步骤进行合成测序……第四讲遗传图谱与物理图谱真核生物在减数分裂过程中染色体进行重组和交换,染色体上任意两点之间发生重组和交换的概率随着两点之间相对距离的远近而发生变化。构建遗传图谱的意义:55通过连锁分析,可以找到某一致病基因或表型的基因与某一标记邻近(紧密连锁)的证据,从而可把这一基因定位与染色体的特定区域,再对基因进行不同的DNA结构按其在染色体上的原始顺序和实际距(1)序列标签位点(sequence-taggedsite,STS)图谱(2)DNA重叠群(DNAcontig)图谱:3遗传作图的标记(1)可识别性:亲本间存在多态性(即差异)(2)可遗传性:亲本间存在的多态性在后代中可以重演(1)基因标记(性状标记)a.形态学性状标记,个体上可以看见的遗传标记基因(如花色\株高\体b.生化性状基因(如血型系列\血清蛋白\免疫蛋白\同工酶)(2)DNA标记(DNAmarkers):以DNA片段为标记,通过DNA片段的电泳66DNA)物77repeat,VNTR)重复单位长度为几十个核苷酸在不同生物体中存在不同类型,如人类(AC)n(AAN)n植物(AT)n水稻(GA)n(GT)n--检测STR:不同样本重复区域有差异(重复次数不同)但PCR引物结合区域--STR应用:微卫星具有很大变异性(基因组复制的“滑移”现象)因此用来建立医鉴定、亲缘鉴定等88(1)理论上等位型最多为4,实际多为2(3)数量极大(4)SNP与人类易感性疾病有关,涉及药物基因组学(5)编码区SNP主要分布于密码子的第3个碱基(1)DNA芯片技术(详见下图)(2)液相杂交技术(详见下图)7遗传作图--一些概念介绍:孟德尔遗传定律(分离、自由组合)。连锁与部分连锁。重组99--遗传作图的理论基础(也学过瞄一眼就行)&图谱构建:(2)重组热点的存在(3)近端粒区&远着丝粒区重组率高(4)性别之间有重组率差异(5)双交换的存在1、有性杂交(老鼠\果蝇\水稻)2、系谱分析(人\多年生树木)3、DNA转移(不能减数分裂的生物细菌\酵母)(1)亲本分析:a亲本间多态性程度与亲缘距离:正相关,因此要扩大亲本亲缘关系,以获b度:有关-识别位点碱基数越多,多态性片段越长,多态性越高同限制酶产生的片段不同,多态性有差异-筛选具多态性的分子标记-筛选高多态性的限制酶-控制多态性标记在图谱中数量合适、均匀分布(2)作图群体分析(以双亲为对照,观察分子标记的带型重组情况):b.图谱长度(各连锁群长度、基因组总长)c.标记密度(分子标记密度足够大时称高密度图谱)--遗传图谱局限性:分辨率有限(交换数目&后代有限)、覆盖面低、排列会有差错环节:染色体(大分子DNA提取)->DNA(大片段DNA克隆)->作图文库(物理作图)->物理图谱a.低等生物基因组物理作图A法息(1)在染色体上位置独一无二(2)序列已知,方便PCR检测 (1)表达序列标签(expressedsequencetagEST)来源于cDNA克隆EST来(2)SSLP可以建立遗传图谱与物理图谱的联系(3)随机基因组测序(注:ppt上原话是“随机基因组顺序”)A.放射杂交量载体中所产生的的物理作图中目优点:单拷贝复制,不会基因重组发生嵌合;的最好方法——克隆指纹排序15为何绘制遗传图谱&物理图谱(1)由上至下:全基因组鸟枪法测序(2)由下至上:基于克隆物理图的测序-克隆重叠群指导的测序(1)由上至下:全基因组鸟枪法测序shotgun称“霰弹法”,“鸟枪法”(2)由下至上:基于克隆物理图的测序-克隆重叠群指导的测序法:NAerprintingdatabase每五个泳道就是一个已知分子量的分子量每五个泳道就是一个已知分子量的分子量的makerHindIII切为小片段凝胶电泳,填补上空位ceFISH(fluorescenceinsituhybridization)荧光标记的原位杂交技术——证实小片段在染色体上的位置。wer(4)Autofinish:填补空缺,提高序列质量等。可为填补空缺自动挑选模板和Hamilton路径类算法自成一个结点Lander—Waterman模型——计算覆盖度(2)DeBruijnGraph(DBG)——EULERPath类算法a转换成图论问题deBruijn图边:两个K-mers重叠(K-1)个单元hingoingarcmerge(1)首先移除tips(节点末端不连接的部分),有两个标准:(2)再移除bubbles(起始和终止节点相同的路径):TourBus算法(3)最后移除错误的连接困难:(1).基因组组中的重复序列似,比测序的读长长很多(2)基因组覆盖的不均一性(3)处理数据量测序错误与基因组序列的多态性第六讲:基因组注释组成了人类基因组的45%,涉及到RNA调节物(反转录转座子)或者DNA调节物(DNA转座子)。长末端重复的转座子(RNA介导)长的散置的片段(LINES)编码逆转录酶短的散置片段(SINEs)(RNA介导)包括Alu重复。DNA转座子(组成了人类基因组的3%)4就像失活的拷贝(在这些拷贝中,转座酶不在发挥作用)fer变,不能编码有功能的蛋白。(4)部分复制s连续存在的多拷贝重复序列:这包括端粒的重复和着丝粒的重复。重复(“垃圾DNA”)(3)序列多样性体现在核苷酸水平而不是蛋白质水平,所以很难检测同源性。(1)利用非PolyA依赖的克隆方法分离(2)微阵列tRNARNA证据(ESTs)1确定已知基因共有的特征2建立一个计算框架/模型,用来精确的描述这些现象。可用来进行基因预测的统计学特征:的模型及方法:构的限制性基因功能,包括结构域分析你感兴趣的特异性功能地图11基因本体论(GO):第七章转录组研究Abundant3用标记的探针进行杂交2逆转录择(1)5’端 (3)两端测序(1)去除低质量的序列f剪切。发现新基因是基因组研究的热点,使用生物信息学方法预测新基因是后基因组时代必不可少的方法。利用对某一特异组织或某一生长发育阶段的cDNA文库,进行随机部分测序所ESTs序列在以上数据库中存在同源序列,可对该ESTs所代表基因的分开性的时T癌症基因组解析计划P所 (2)将短片段标签相互连接形成长的DNA分子,对该克隆进行测序得到大量特定的序列标签的出现次数就反应了对应的基因的表达丰度。同时测定细胞内数千个基因的表达情况样品的检测A.按技术手段、探针类型分类sAffymetrixB.按实验要求分类Stanford开发设计,通常为双通道,常用于差异表达基因的筛选。A.选择硅片、玻璃片、瓷片或聚丙烯膜、尼龙膜等支持物B.采用光导化学合成和照相平板印刷技术在硅片等表面合成寡核苷酸探针;或相应位置上7微阵列实验的优点:NA程度等)4.探针的标记5.RNA的抽提6.加样7.其他因芯片的数据分析(1)差异表达基因的分析(2)基因共表达分析(3)基因表达数据的聚类(4)基因表达数据的分类(1)差异表达基因的分析调的基因•如果处理本身并不显著,则结果无意义(2)基因共表达分析:相似的表达谱,可能存在正关联:相反的表达谱,可能存在负调控(3)基因表达数据的聚类将表达谱相似的基因聚类在一起(4)基因表达数据的分类根据基因表达的数据将样本分成两类或多类–癌症的亚型、不同阶段(良性的vs.恶性的)进TRssDNA。单链DNA病毒。基因组小(2-7kb),且一般为环状;二十面体衣dsRNA。双链RNA病毒。二十面体衣壳;衣壳完整地留在细胞内(保护基A受损;(3)蛋白质合成受抑制是普遍现象。是与宿主有相同的命运,宿主死亡,则病毒也无法生存);侵染多种宿主(优势优化)。和释放。16、HIV病毒。系统发育分析表明,HIV病毒从猿类中起源(生物信息学工具——LANL)。物具有较高的GC含量)和突变假说。LGT的要求&步骤:临近供体DNA;DNA在环境中有稳定性;载体传递;吸收9、MUMmer:比较两个高度相关的序列,遍历所有至少为某一长度(比如20第13讲利用新一代测序仪进行转录组学研究1.基因:表达,可变剪切3.一些重复序列copyDNAshearDNA>linkers连接起来fSOLiD乳胶PCRg)SOLiD测序Primaryanalysis个distributereadsC:落在基因外显子的mappablereads数量1.分配单一mappringreadsN:mappablereads总数(库间标准化)2.基因表达标准化L:基因外显子长度(库内标准化)比对,从概率上分拼接,形成两个子库(已知junctionA分析:因表达谱分析:基因表达谱聚类分析•非编码区鉴定与注释2.整合所有的已知转录区,并根据数据库排序为这些区域命名效的检测•重复序列表达分析•内含子表达分析(如候选polyA转录本,候选-表达情况尚不明确)芯片-相对表达(去背景过程中可能去掉了与调控相关)RNA-seq:绝对表达➢基因产物直系同源簇的分析(COG)EST(表达序列标签)的代谢途径分析-KEGG➢优势:•未知基因组序列的物种的高通量转录组研究•(相对于芯片技术)-对于基因表达谱有非常宽的检测范围。在有内显示出了较高的准确度和可重复性。•不需要克隆,样本少,可以在单细胞水平进行表达谱分析•通量高,成本低A挑战 •海量短序列数据的比对或拼接情况复杂,对重复序列和多匹配序列剪接和反式剪接的鉴定仍有相当的误差。 •测序深度的确定因物种、器官、组织、时期而变,很难有统一公式 线虫纲;昆虫:果蝇、按蚊;海胆450MYA:鱼310MYA:恐龙、鸡5-50MYA:灵长目动物第一个基因组被测出的多细胞生物•估测异染色质长度:通过直接在减数分X上异染色质block有多态性(1/3~1/2)Y几乎全部异染色质化DNA9%转座子(长度67%单一序列乎全部序列是重复性的4蚊(Mosquito)➢特征:相似性:➢埃及伊蚊基因组•注释•与其他生物进化关系:5紫海胆(Strongylocentrotuspurpuratus)[非脊索后口动物中唯一被测序的,帮助我们了解生物过程(如气味感知和免疫过程)的进化]A特征:棘皮动物门,放射对称的壳,移动缓慢,食藻类,体外受精A基因组•高杂合性因组,补充全基因组鸟枪法测序组装6玻璃海鞘(Cionaintestinalis)A高等位基因多态性•转座序列少但是多样性高•有全基因组复制(WGD):辅鳍鱼世系中的WGD有争议-WGD产紧跟着WGD,染色体重排发生(分裂,融合,易位),减少到218鸡(Gallusgallus)s 一个祖先开始的染色体易位都很少,而染色体内部重排(如倒位)更常见•多基因家族的扩展和收缩是哺乳类和鸟类各自独立进化的主要因素复序列中反转录酶具有高特异性(CR1LINE)MB的基因数和岛数-负相关d.平均基因长度(内含子正相关,外显子负9有袋目负鼠(Opposum)A基因组anislupusfamiliaris•哺乳动物基因组差异:狗-最低转座子插入率鼠-最高删除率人-最低核苷酸•哺乳动物中有一套常用的功能序列•50%高保守nc序列cluster在~200基因缺乏区域。大部分含有在识别中起重要作用的基因(如转录因子,轴突指导受体)•鼠特异基因扩展:嗅觉受体基因家族•替换率和插入/缺失率都比人高A黑猩猩基因组:的CpG替换率在雄性与雌性精子中比非CpG区域更接近•插入删除比单碱基替换少(逆转录病毒序列)•人类和黑猩猩的同源蛋白十分相似•原始人类进化中的正选择个更小的蛋白质歧化率•外显子沉默位点的替换比相邻的内含子位点低>更弱的清洁选择低重组区域:G+C低>高分歧;反之……(2)雄性减数分裂的突变率是雌性的两倍,大多数突变发生在雄性当中。(3)超过1.4百万个单核苷酸突变多态性被确定。(3)D组中心粒在染色体的一端。(4)18号染色体具有最低的基因密度。(5)19号染色体具有最高的基因密度。(6)Y染色体包括中心粒(1M),长臂(40M),island(400kb)(1)单基因疾病(常显常隐),(2)复杂基因疾病(中枢神经疾病)(3)基因组疾病(染色体数目变化)(4)感染疾病(5)环境疾病(1)基因组太大。(2)突变机制较多。(1)比较正常和患者基因(2)基因定位(3)突变效果(4)功能基因组(5)(1)连接分析(家系)(2)GWAS(全基因组关联分析)(3)染色体异常鉴定(4)DNA测序.分子进化:基因或蛋白的进化模式和机制,有时涵盖序列基础上的系统发生学。 .进化遗传学:群体遗传学和近缘物种中的物种形成。 .进化发育生物学(EvoDevo):主要生物(门)的发育和它们的进化结果的基因进化基因组学的初步定义研究基因组进化的机制以及在基因组水平研究物种及其特征进化的遗传机制(也称比较基因组学)的一门生物学学科。进化基因组学的研究方法1.计算生物学手段:数据分析、挖

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论