基因组学与比较基因组学演示文稿课件_第1页
基因组学与比较基因组学演示文稿课件_第2页
基因组学与比较基因组学演示文稿课件_第3页
基因组学与比较基因组学演示文稿课件_第4页
基因组学与比较基因组学演示文稿课件_第5页
已阅读5页,还剩129页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十一章基因组学与比较基因组学ByHongweiGuo,PekingUniversity,2008.12.29GenomicsandComparativeGenomics第十一章基因组学与比较基因组学ByHongweiGuo基础分子生物学期末安排考试时间:

2009年

1月

12日下午

2:00-4:00考试地点:三教/301(60人)、三教/304(38人)、三教/306(37人)、三教/308(37人)

基础分子生物学期末安排考试时间:2009年1月12基因组计划基因组(genome)是生物体内遗传信息的集合,是某个特定物种细胞内全部DNA分子的总和。基因组学(genomics)是指研究并解析生物体整个基因组的所有遗传信息的学科。基因组计划(GenomeProject)是指对人类以及其它生物体全基因组的测序工作(sequencing)。人类基因组计划(HumanGenomeProject,HGP):90年代提出并已基本完成,同40年代原子弹爆炸,60年代人类登月一起被认为是二十世纪科技发展史上的三大创举。基因组计划基因组(genome)是生物体内遗传信息的集合,是HistoryoftheHumanGenomeProject1990OfficialstartofHGPwith3billion$anda15yearhorizon.1999SangerCentrepublisheschromosome222001DraftGenomepublished:Celera&Public2003Completion(almost)ofHumanGenomeCelera:CraigVenterIntl.Cons:FrancisCollinsHistoryoftheHumanGenomePrPubliceffort-strategy:Celera-strategy:SequencingStrategiesCelera’sviewofInternationalConsortiumInternationalConsortium’sviewofCeleraUnfaircompetition:ICdeliveringthesamegoodsbutwithstatefunding.Unfaircompetition:CeleradeliveringthesamegoodsbutcanuseICdata,whileICcannotuseCeleradata.Publiceffort-strategy:CeleraPubliceffort-strategy:

基因组DNA大片段文库的构建

YAC(yeastartificialchromosome,酵母人工染色体):含有三种必需成分:着丝粒、端粒和复制起点。是迄今容量最大的克隆载体,插入片段平均长度为200-1000Kbp,最大的可以达到2Mbp。BAC(Bacterialartificialchromosome),用细菌的F质粒及其调控基因构建了细菌染色体克隆载体,其克隆能力在125~150Kbp左右。以BAC为基础的克隆载体形成嵌合体的频率较低,转化效率高,而且以环状结构存在于细菌体内,易于分辨和分离纯化,已被科学界广泛接受。Publiceffort-strategy:

基因组DNBAC的构建pBAC108L来自细菌的一个小型F质粒,其中oriS和repE控制了质粒的复制起始,parB和parA控制了拷贝数。100-150KbpinsertionBAC的构建100-150Kbpinsertion遗传图谱(GeneticMap)

vs

物理图谱(PhysicalMap)遗传图又称为连锁图(LinkageMap),是指基因或DNA标志在染色体上的相对位置(或距离),通常以基因或DNA片段在染色体交换过程中的分离频率(cM)来表示。cM值越大,两者之间遗传距离越远。物理图谱是指以已知序列的DNA片段(序列标签位点,sequence-taggedsite,STS)在染色体上的实际位置,位点之间的距离(图距)以碱基对(bp,kb,Mb)作为测量单位的基因组图。遗传图谱(GeneticMap)

vs

物理图谱(PhDNA遗传标记(DNAmarker)第一代DNA遗传标记是RFLP(RestrictionFragmentLengthPolymorphism)。DNA序列上的微小变化,甚至1个核苷酸的变化,也能引起限制性内切酶切点的丢失或产生,导致酶切片段长度的变化。第二代DNA遗传标记SSLP(SimpleSeqeuceLengthPolymorphism)利用了存在于人类基因组中的大量重复序列,包括重复单位长度在15-65个核苷酸左右的小卫星DNA(minisatelliteDNA),重复单位长度在2-6个核苷酸之间的微卫星DNA(microsatelliteDNA)。第三代DNA遗传标记SNP

(singlenucleotidepolymorphism),也是最广泛的遗传标记,是分散于基因组中的单个碱基的差异。这种差异包括单个碱基的缺失和插入,但更常见的是单个核苷酸的替换,即单核苷酸的多态性。到目前为止已经在人类基因组发现了超过1000万个SNP位点,平均每300bp中就有一个SNP!DNA遗传标记(DNAmarker)第一代DNA遗传标RFLPmarkerSSLPmarkersWTmutRFLPmarkerSSLPmarkersWTmutSNPmarkerSNPmarker酵母第三号染色体遗传图(右)和物理图(左)的比较

由于实验方法不同,不少markers之间的遗传距离并不等于它们在物理图上的距离。酵母第三号染色体遗传图(右)和物理图(左)的比较由于实验方鸟枪法序列测定技术全基因组鸟枪法测序(shotgunsequencing)技术:随机挑选带有基因组DNA的质粒进行末端序列测定,然后用计算机程序进行序列拼接。鸟枪法测序的主要缺点是,随着所测基因组总量增大,所需测序的片段大量增加;其次,高等真核生物(如人类)基因组中有大量重复序列,导致判断失误鸟枪法序列测定技术全基因组鸟枪法测序(shotgunseqDNAtargetsampleSHEAR&SIZEe.g.,10Kbp±8%std.dev.EndReads/MatePairsCLONE&ENDSEQUENCE590bp10,000bpMate-PairShotgunDNASequencingDNAtargetsampleSHEAR&SIZEe大规模DNA序列拼接

DNA序列拼接问题与组合数学中的最短超串问题相似。最短超串问题即给定一个字符串的集合,找出一最短的字符串称为超串,并将集合中的任何一元素作为其子串。PopularAssemblersTIGRAssembler(TIGR)Phrap(WashU)CeleraAssembler(Celera,TIGR)Arachne(MITBroad)Phusion(Sanger–usesPhrap)Atlas(BaylorHGSC)大规模DNA序列拼接DNA序列拼接问题与组合数学中的最短超AssemblyoftheIndividualSequencesIndividualsequencingreadsarecomparedtoeachotherandwheretheyoverlapcanbeassembledtocreatecontigsAssemblyoftheIndividualSeqAssemblyoftheIndividualSequencesKeepaddingindividualsequencingreadstobuildlargerandfewercontigsAssemblyoftheIndividualSeqAssemblyoftheIndividualSequencesEventuallyallsequencingreads

mergetoasingleconsensussequence(alargecontig)foreachchromosome.AssemblyoftheIndividualSeq鸟枪法测序技术不能鉴别高等真核生物基因组中的重复序列

鸟枪法测序技术不能鉴别高等真核生物基因组中的重复序列改进后的鸟枪法(adoptedbybothICandCelera)改进后的鸟枪法(adoptedbybothICand高通量DNA序列分析技术

人类基因组计划的成功很大程度上得益于有效减少DNA测序成本的技术更新。通过改良测序方法,不断提升其自动化程度,DNA测序的成本降低了100倍,从20世纪70-80年代$10/bp降低到本世纪初$0.1/bp!如果一个熟练的DNA序列分析人员采取早期80年代方法每天测定1000bp计算,人类基因组(约3×109bp)的全序列分析,至少也得需要100名这样的工人花上100年的时间才能完成。而2000年代的高通量测序仪可达到月测序1-6Mbp!目前???$2/1Mbp3Gbp/machine/day高通量DNA序列分析技术人类基因组计划的成功很大程度上得益DNAsequencingtechnologies

•“Classical” –Sangerdideoxysequencing•“NextGeneration”,commercialized

–Roche454Pyrosequencing –Solexa/Illuminacyclicalbaseaddition –ABISOLiDsequencingbyligation•Singlemolecule(tetheredDNApolymerase)

–Heliscope(cyclicalbaseaddition) –VisiGen(realtime,FRET-based)DNAsequencingtechnologiesIllumina/SolexaGeneticAnalyzer2000Mb/runAppliedBiosystemsABI3730XL1Mb/dayRoche/454GenomeSequencerFLX100Mb/runAppliedBiosystemsSOLiD3000Mb/runIllumina/SolexaAppliedBiosSangersequencing13maybe800bplong42Sangersequencing13maybe800bRoche/454:GenomeSequencerFLXRealTimeSequencingbySynthesisChemiluminescencedetectioninpicotiterplatesAmplification:emulsionPCRPyrosequencingupto400,000reads/runonaverage250bases/readupto100Mb/runRoche/454GenomeSequencerFLX100Mb/runRoche/454:GenomeSequencerPyrosequencing---454SequencingGenomesequencinginmicrofabricatedhigh-densitypicolitrereactorsMargulies,M.Eghold,M.etal.Nature.2005Sep15;437(7057):326-7Pyrosequencing---454Sequencin基因组学与比较基因组学演示文稿课件基因组学与比较基因组学演示文稿课件AsectionofPyrosequencingreadsAsectionofPyrosequencingreIllumina/Solexa:GeneticAnalyzerRealTimeSequencingbySynthesisClonalSingleMoleculeArrayAmplification:bridgingPCR60millionreads/runupto50bases/read2Gb/run8channels,app.5mioreads/channelFluorescentlabelsReversible3‘OHblockingIllumina/SolexaGeneticAnalyzer2000Mb/runIllumina/Solexa:GeneticAnaReversibleterminator-basedsequencing(Solexa)Reversibleterminator-basedseFragmentDNAandligateadaptorsFragmentDNAandligateadapto基因组学与比较基因组学演示文稿课件基因组学与比较基因组学演示文稿课件ComparisonWGS454SolexaCloningYesNoNoChemistrySangerpyrosequencingreversibleterminatorsCost$$$$to$$$$$$$$$$$AccuracyConsensus99.99%Singleread>99.5%;Consensus>99.99%?AssemblyBestBetterBadGapClosureandFinishingToughTougherPossible?ComparisonWGS454SolexaCloningRealTimeSequencingbyLigationEmulsionPCRandBeadsonslides85millionreads/runUpto35bases/read3Gb/rundualfluorescentlabels8individualchannels/flowcell2flowcells/runAppliedBiosystemsSOLiD3000Mb/runOligonucleotide

Ligation&Detection(SOLiD)AppliedBiosystemsOligonucleotSOLiD:Substrateattachment;dibaseprobesMakesequencinglibrarybyshearingandadapterligationAttachDNAfragmentstobeadsandamplifypoloniesinemulsionAttachbeadstoslideSOLiD:SOLiD:SequencingligationcyclesSOLiD:SequencingligationcycSOLiD:DataCollectionandImageAnalysisSOLiD:DataCollectionandImaSOLiD:DecodingthesequenceMardis2008SOLiD:Mardis2008Comparisonof“NextGeneration”SequencingTechnologiesComparisonof“NextGenerationApplicationsGeneticAnalyzerApplicationsGeneticAnalyzerSingleMolecule

SequencingTechnologies:onthehorizon

•ArrayoftetheredDNApolymerasemolecules•Boundtotemplatestrand+primer•Heliscope –Cyclicalbaseaddition(similartoSolexa)•VisiGen –Realtime,imagingFRETflashes –Hopefulprediction:1Mb/sec“NextGeneration”Sequencing

Technologies:RateLimitingFactors

•Frontend:Makingthesequencinglibrary•Backend:Bioinformaticstomakesenseof

the“sequencetsunami”---essemblySingleMoleculeSequencingTecWhatdowesequence?denovogenomesequencinggenomeresequencing(SNPidentification)metagenomesorcomplexsamplestranscriptomeprofilingsmallRNAidentification(applications)Whatdowesequence?denovogeExamplesofApplicationsof“NextGeneration”SequencingTechnologiesBestfor“re-sequencing”,i.e.,aligninggeneratedsequencetoareferencegenomeNextgenerationDNAtechnologiesmayreplacemicroarraysforsomeapplicationsShendure&Ji2008ExamplesofApplicationsof“NThe“$10,000humangenomesequencing”prize•Tothefirstteamthatcanbuildadeviceanduseittosequence:–100humangenomeswithin10daysorless,–Accuracy:atmost1errorper100,000bases,–Accuratecoverageofatleast98%ofthegenome,–Recurringcostofnomorethan$10,000(US)pergenome.•Prize:$10million•Deadline:12:01AMPST,October4,2013.•Donors:XFoundation,J.CraigVenterFoundationThe“$10,000humangenomesequHumanHapMapProjectHapMap的构建分为三个步骤:(a)在多个个体的DNA样品中鉴定单核苷酸多态性(SNPs);(b)将群体中频率大于1%的那些共同遗传的相邻SNPs组合成单体型;(c)在单体型中找出用于识别这些单体型的标签SNPs。通过对图中的三个标签SNPs进行基因分型,可以确定每个个体拥有哪一个单体型。HumanHapMapProjectHapMap的构建分SCIENCE315:1781(30MARCH2007)Metagenomesor

complexsamplesSCIENCE315:1781(30MARCH20转录图(transcriptprofiling)

基因转录图(cDNA图),或者基因的cDNA片段图,即表达序列标签图(EST,expressedsequencetag),是基因组图的重要组成部分。大规模生产EST的主要程序如下:分离特定组织在某一发展阶段或某种生理条件下的总mRNA,合成双链cDNA,克隆到plasmid中并进行两端测序。转录图(transcriptprofiling)基因转录PyrosequencingProvidesEvidenceforNovelTranscriptsandTranscriptArchitecture

PyrosequencingProvidesEvidensmallRNAidentification

(i.e.microRNA)smallRNAidentification(i.e.到2006年底已完成的基因组项目(/)

根据2007年1月的数据,全球已启动2296个基因组项目,其中607个项目已经完成,已经公开发表481个基因组序列,包括403个细菌基因组,33个古细菌基因组和45个真核生物基因组。其它基因组计划到2006年底已完成的基因组项目根据2007年1月的数据,全到2006年12月全世界主要基因组计划的进展情况

到2006年12月全世界主要基因组计划的进展情况Whydowesequencegenomes?Tocatalogallthegenespresentinoneorganism.Tocomparethegenecontentofoneorganismtoanotherorganism.Tostudygene/genomeevolution.Tostudyorganismalevolution.Asafoundationforfutureexperimentation.Whydowesequencegenomes?To不同模式生物基因组的比较物种基因组大小估计基因数尿殖道支原体

Mycoplasmagenitalium580Kb467肺炎支原体

Mycoplasmapneumoniae816Kb677流感嗜血杆菌

Haemophilusinfluenzae1.8Mb1709枯草芽孢杆菌

Bacillussubtilis4.2Mb4100大肠杆菌

Escherichiacoli4.6Mb4288酿酒酵母

Saccharomycescerevisiae13Mb6275线虫

Caenorhabditiselegans100Mb18891拟南芥

Arabidopsisthaliana125Mb25498果蝇

Drosophilamelanogaster165Mb14113人类

Homosapiens3Gb约2.5万不同模式生物基因组的比较物种基因组大小估计基因数尿比较基因组学(Comparativegenomics)比较基因组学的威力在于它能根据对一种生物相关基因的认识来理解、诠释甚至克隆分离另一种生物的基因。远缘基因组间的比较为认识生物学机制的普遍性,寻找研究复杂生理和病理过程所需的实验模型提供了理论依据,而近缘基因组间的比较则为认识基因结构与功能等细节提供了参数。物种名基因数目转录因子数量比例拟南芥约2938815335.9酵母约58852093.5线虫约188916693.5果蝇约133796354.5比较基因组学(Comparativegenomics)比较FunctionalCategoriesinEukaryoticProteomesFunctionalCategoriesinEukarApplicationstoMedicineAkeyapplicationofhumangenomeresearchistofinddiseasegenesbypositionalcloningThismethodinvolvesmappingthechromosomalregioncontainingthegenebylinkageanalysisinaffectedfamiliesThehumangenomicsequenceinpublicdatabasesallowsrapididentificationinsilicoofcandidategenes,followedbymutationscreeningofrelevantcandidates,aidedbyinformationongenestructureForamendeliandisorder,agenesearchcannowoftenbecarriedoutinamatterofmonthswithonlyamodestlysizedteamApplicationstoMedicineAkey基因组学与比较基因组学演示文稿课件NextStepsonHGPFinishthehumansequenceLarge-scaleidentificationofregulatoryregionsSequencingofadditionallargegenomesCompletingthecatalogueofhumanvariationFromsequencetofunctionNextStepsonHGPFinishthehuFutureTechnologyDevelopmentFunctionalgenomics-aimstounderstandhowgenesareregulatedandwhattheydo,largelythroughmassivelyparallelstudiesofgeneexpressioninavarietyoftissuesProteomics–promisestomaketheidentityofeachproteinknownandelucidateprotein-proteininteractionsBioinformatics–enhancetheabilityofresearcherstomanipulate,collectandanalyzedatamorequicklyandinnewwaysFutureTechnologyDevelopmentF基因组学与比较基因组学演示文稿课件基因组学与比较基因组学演示文稿课件基因组学与比较基因组学演示文稿课件基因组学与比较基因组学演示文稿课件祝同学们新年快乐!考试顺利!祝同学们新年快乐!考试顺利!个人观点供参考,欢迎讨论!个人观点供参考,欢迎讨论!第十一章基因组学与比较基因组学ByHongweiGuo,PekingUniversity,2008.12.29GenomicsandComparativeGenomics第十一章基因组学与比较基因组学ByHongweiGuo基础分子生物学期末安排考试时间:

2009年

1月

12日下午

2:00-4:00考试地点:三教/301(60人)、三教/304(38人)、三教/306(37人)、三教/308(37人)

基础分子生物学期末安排考试时间:2009年1月12基因组计划基因组(genome)是生物体内遗传信息的集合,是某个特定物种细胞内全部DNA分子的总和。基因组学(genomics)是指研究并解析生物体整个基因组的所有遗传信息的学科。基因组计划(GenomeProject)是指对人类以及其它生物体全基因组的测序工作(sequencing)。人类基因组计划(HumanGenomeProject,HGP):90年代提出并已基本完成,同40年代原子弹爆炸,60年代人类登月一起被认为是二十世纪科技发展史上的三大创举。基因组计划基因组(genome)是生物体内遗传信息的集合,是HistoryoftheHumanGenomeProject1990OfficialstartofHGPwith3billion$anda15yearhorizon.1999SangerCentrepublisheschromosome222001DraftGenomepublished:Celera&Public2003Completion(almost)ofHumanGenomeCelera:CraigVenterIntl.Cons:FrancisCollinsHistoryoftheHumanGenomePrPubliceffort-strategy:Celera-strategy:SequencingStrategiesCelera’sviewofInternationalConsortiumInternationalConsortium’sviewofCeleraUnfaircompetition:ICdeliveringthesamegoodsbutwithstatefunding.Unfaircompetition:CeleradeliveringthesamegoodsbutcanuseICdata,whileICcannotuseCeleradata.Publiceffort-strategy:CeleraPubliceffort-strategy:

基因组DNA大片段文库的构建

YAC(yeastartificialchromosome,酵母人工染色体):含有三种必需成分:着丝粒、端粒和复制起点。是迄今容量最大的克隆载体,插入片段平均长度为200-1000Kbp,最大的可以达到2Mbp。BAC(Bacterialartificialchromosome),用细菌的F质粒及其调控基因构建了细菌染色体克隆载体,其克隆能力在125~150Kbp左右。以BAC为基础的克隆载体形成嵌合体的频率较低,转化效率高,而且以环状结构存在于细菌体内,易于分辨和分离纯化,已被科学界广泛接受。Publiceffort-strategy:

基因组DNBAC的构建pBAC108L来自细菌的一个小型F质粒,其中oriS和repE控制了质粒的复制起始,parB和parA控制了拷贝数。100-150KbpinsertionBAC的构建100-150Kbpinsertion遗传图谱(GeneticMap)

vs

物理图谱(PhysicalMap)遗传图又称为连锁图(LinkageMap),是指基因或DNA标志在染色体上的相对位置(或距离),通常以基因或DNA片段在染色体交换过程中的分离频率(cM)来表示。cM值越大,两者之间遗传距离越远。物理图谱是指以已知序列的DNA片段(序列标签位点,sequence-taggedsite,STS)在染色体上的实际位置,位点之间的距离(图距)以碱基对(bp,kb,Mb)作为测量单位的基因组图。遗传图谱(GeneticMap)

vs

物理图谱(PhDNA遗传标记(DNAmarker)第一代DNA遗传标记是RFLP(RestrictionFragmentLengthPolymorphism)。DNA序列上的微小变化,甚至1个核苷酸的变化,也能引起限制性内切酶切点的丢失或产生,导致酶切片段长度的变化。第二代DNA遗传标记SSLP(SimpleSeqeuceLengthPolymorphism)利用了存在于人类基因组中的大量重复序列,包括重复单位长度在15-65个核苷酸左右的小卫星DNA(minisatelliteDNA),重复单位长度在2-6个核苷酸之间的微卫星DNA(microsatelliteDNA)。第三代DNA遗传标记SNP

(singlenucleotidepolymorphism),也是最广泛的遗传标记,是分散于基因组中的单个碱基的差异。这种差异包括单个碱基的缺失和插入,但更常见的是单个核苷酸的替换,即单核苷酸的多态性。到目前为止已经在人类基因组发现了超过1000万个SNP位点,平均每300bp中就有一个SNP!DNA遗传标记(DNAmarker)第一代DNA遗传标RFLPmarkerSSLPmarkersWTmutRFLPmarkerSSLPmarkersWTmutSNPmarkerSNPmarker酵母第三号染色体遗传图(右)和物理图(左)的比较

由于实验方法不同,不少markers之间的遗传距离并不等于它们在物理图上的距离。酵母第三号染色体遗传图(右)和物理图(左)的比较由于实验方鸟枪法序列测定技术全基因组鸟枪法测序(shotgunsequencing)技术:随机挑选带有基因组DNA的质粒进行末端序列测定,然后用计算机程序进行序列拼接。鸟枪法测序的主要缺点是,随着所测基因组总量增大,所需测序的片段大量增加;其次,高等真核生物(如人类)基因组中有大量重复序列,导致判断失误鸟枪法序列测定技术全基因组鸟枪法测序(shotgunseqDNAtargetsampleSHEAR&SIZEe.g.,10Kbp±8%std.dev.EndReads/MatePairsCLONE&ENDSEQUENCE590bp10,000bpMate-PairShotgunDNASequencingDNAtargetsampleSHEAR&SIZEe大规模DNA序列拼接

DNA序列拼接问题与组合数学中的最短超串问题相似。最短超串问题即给定一个字符串的集合,找出一最短的字符串称为超串,并将集合中的任何一元素作为其子串。PopularAssemblersTIGRAssembler(TIGR)Phrap(WashU)CeleraAssembler(Celera,TIGR)Arachne(MITBroad)Phusion(Sanger–usesPhrap)Atlas(BaylorHGSC)大规模DNA序列拼接DNA序列拼接问题与组合数学中的最短超AssemblyoftheIndividualSequencesIndividualsequencingreadsarecomparedtoeachotherandwheretheyoverlapcanbeassembledtocreatecontigsAssemblyoftheIndividualSeqAssemblyoftheIndividualSequencesKeepaddingindividualsequencingreadstobuildlargerandfewercontigsAssemblyoftheIndividualSeqAssemblyoftheIndividualSequencesEventuallyallsequencingreads

mergetoasingleconsensussequence(alargecontig)foreachchromosome.AssemblyoftheIndividualSeq鸟枪法测序技术不能鉴别高等真核生物基因组中的重复序列

鸟枪法测序技术不能鉴别高等真核生物基因组中的重复序列改进后的鸟枪法(adoptedbybothICandCelera)改进后的鸟枪法(adoptedbybothICand高通量DNA序列分析技术

人类基因组计划的成功很大程度上得益于有效减少DNA测序成本的技术更新。通过改良测序方法,不断提升其自动化程度,DNA测序的成本降低了100倍,从20世纪70-80年代$10/bp降低到本世纪初$0.1/bp!如果一个熟练的DNA序列分析人员采取早期80年代方法每天测定1000bp计算,人类基因组(约3×109bp)的全序列分析,至少也得需要100名这样的工人花上100年的时间才能完成。而2000年代的高通量测序仪可达到月测序1-6Mbp!目前???$2/1Mbp3Gbp/machine/day高通量DNA序列分析技术人类基因组计划的成功很大程度上得益DNAsequencingtechnologies

•“Classical” –Sangerdideoxysequencing•“NextGeneration”,commercialized

–Roche454Pyrosequencing –Solexa/Illuminacyclicalbaseaddition –ABISOLiDsequencingbyligation•Singlemolecule(tetheredDNApolymerase)

–Heliscope(cyclicalbaseaddition) –VisiGen(realtime,FRET-based)DNAsequencingtechnologiesIllumina/SolexaGeneticAnalyzer2000Mb/runAppliedBiosystemsABI3730XL1Mb/dayRoche/454GenomeSequencerFLX100Mb/runAppliedBiosystemsSOLiD3000Mb/runIllumina/SolexaAppliedBiosSangersequencing13maybe800bplong42Sangersequencing13maybe800bRoche/454:GenomeSequencerFLXRealTimeSequencingbySynthesisChemiluminescencedetectioninpicotiterplatesAmplification:emulsionPCRPyrosequencingupto400,000reads/runonaverage250bases/readupto100Mb/runRoche/454GenomeSequencerFLX100Mb/runRoche/454:GenomeSequencerPyrosequencing---454SequencingGenomesequencinginmicrofabricatedhigh-densitypicolitrereactorsMargulies,M.Eghold,M.etal.Nature.2005Sep15;437(7057):326-7Pyrosequencing---454Sequencin基因组学与比较基因组学演示文稿课件基因组学与比较基因组学演示文稿课件AsectionofPyrosequencingreadsAsectionofPyrosequencingreIllumina/Solexa:GeneticAnalyzerRealTimeSequencingbySynthesisClonalSingleMoleculeArrayAmplification:bridgingPCR60millionreads/runupto50bases/read2Gb/run8channels,app.5mioreads/channelFluorescentlabelsReversible3‘OHblockingIllumina/SolexaGeneticAnalyzer2000Mb/runIllumina/Solexa:GeneticAnaReversibleterminator-basedsequencing(Solexa)Reversibleterminator-basedseFragmentDNAandligateadaptorsFragmentDNAandligateadapto基因组学与比较基因组学演示文稿课件基因组学与比较基因组学演示文稿课件ComparisonWGS454SolexaCloningYesNoNoChemistrySangerpyrosequencingreversibleterminatorsCost$$$$to$$$$$$$$$$$AccuracyConsensus99.99%Singleread>99.5%;Consensus>99.99%?AssemblyBestBetterBadGapClosureandFinishingToughTougherPossible?ComparisonWGS454SolexaCloningRealTimeSequencingbyLigationEmulsionPCRandBeadsonslides85millionreads/runUpto35bases/read3Gb/rundualfluorescentlabels8individualchannels/flowcell2flowcells/runAppliedBiosystemsSOLiD3000Mb/runOligonucleotide

Ligation&Detection(SOLiD)AppliedBiosystemsOligonucleotSOLiD:Substrateattachment;dibaseprobesMakesequencinglibrarybyshearingandadapterligationAttachDNAfragmentstobeadsandamplifypoloniesinemulsionAttachbeadstoslideSOLiD:SOLiD:SequencingligationcyclesSOLiD:SequencingligationcycSOLiD:DataCollectionandImageAnalysisSOLiD:DataCollectionandImaSOLiD:DecodingthesequenceMardis2008SOLiD:Mardis2008Comparisonof“NextGeneration”SequencingTechnologiesComparisonof“NextGenerationApplicationsGeneticAnalyzerApplicationsGeneticAnalyzerSingleMolecule

SequencingTechnologies:onthehorizon

•ArrayoftetheredDNApolymerasemolecules•Boundtotemplatestrand+primer•Heliscope –Cyclicalbaseaddition(similartoSolexa)•VisiGen –Realtime,imagingFRETflashes –Hopefulprediction:1Mb/sec“NextGeneration”Sequencing

Technologies:RateLimitingFactors

•Frontend:Makingthesequencinglibrary•Backend:Bioinformaticstomakesenseof

the“sequencetsunami”---essemblySingleMoleculeSequencingTecWhatdowesequence?denovogenomesequencinggenomeresequencing(SNPidentification)metagenomesorcomplexsamplestranscriptomeprofilingsmallRNAidentification(applications)Whatdowesequence?denovogeExamplesofApplicationsof“NextGeneration”SequencingTechnologiesBestfor“re-sequencing”,i.e.,aligninggeneratedsequencetoareferencegenomeNextgenerationDNAtechnologiesmayreplacemicroarraysforsomeapplicationsShendure&Ji2008ExamplesofApplicationsof“NThe“$10,000humangenomesequencing”prize•Tothefirstteamthatcanbuildadeviceanduseittosequence:–100humangenomeswithin10daysorless,–Accuracy:atmost1errorper100,000bases,–Accuratecoverageofatleast98%ofthegenome,–Recurringcostofnomorethan$10,000(US)pergenome.•Prize:$10million•Deadline:12:01AMPST,October4,2013.•Donors:XFoundation,J.CraigVenterFoundationThe“$10,000humangenomesequHumanHapMapProjectHapMap的构建分为三个步骤:(a)在多个个体的DNA样品中鉴定单核苷酸多态性(SNPs);(b)将群体中频率大于1%的那些共同遗传的相邻SNPs组合成单体型;(c)在单体型中找出用于识别这些单体型的标签SNPs。通过对图中的三个标签SNPs进行基因分型,可以确定每个个体拥有哪一个单体型。HumanHapMapProjectHapMap的构建分SCIENCE315:1781(30MARCH2007)Metagenomesor

complexsamplesSCIENCE315:1781(30MARCH20转录图(transcriptprofiling)

基因转录图(cDNA图),或者基因的cDNA片段图,即表达序列标签图(EST,expressedsequencetag),是基因组图的重要组成部分。大规模生产EST的主要程序如下:分离特定组织在某一发展阶段或某种生理条件下的总mRNA,合成双链cDNA,克隆到plasmid中并进行两端测序。转录图(transcriptprofiling)基因转录PyrosequencingProvidesEvidenceforNovelTranscriptsandTranscriptArchitecture

PyrosequencingProvidesEvidensmallRNAidentification

(i.e.microRNA)smallRNAidentification(i.e.到2006年底已完成的基因组项目(/)

根据2007年1月的数据,全球已启动2296个基因组项目,其中607个项目已经完成,已经公开发表481个基因组序列,包括403个细菌基因组,33个古细菌基因组和45个真核生物基因组。其它基因组计划到2006年底已完成的基因组项目根据2007年1月的数据,全到2006年12月全世界主要基因组计划的进展情况

到2006年12月全世界主要基因组计划的进展情况Whydowesequencegenomes?Tocatalogallthegenespresentinoneorganism.Tocom

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论