版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2023/10/81一、利用遗传连锁图进行QTL定位一.数量性状的分析方法二、用关联分析法进行QTL定位连锁分析法,即根据减数分裂时染色体发生交换和重组的原理,通过研究遗传标记在家系中与目标性状连锁与否及连锁的程度,确定标记与目标基因的遗传距离。关联分析法以连锁不平衡为基础,鉴定某一群体内性状与遗传标记或候选基因间的关系。2023/10/81一、利用遗传连锁图进行QTL定位一.数2023/10/82以目标性状存在较大差异的两个亲本创建F2、RIL、DH等分离群体田间种植分离群体,考察目标性状,并构建分子标记连锁图利用适当的QTL分析软件对控制目标性状的基因进行全基因组QTL扫描。利用遗传连锁图进行QTL定位2023/10/82以目标性状存在较大差异的两个亲本创建F22023/10/83用遗传分析法进行QTL定位的缺点构建分离群体时,由于杂交和自交次数的限制,发生的重组次数有限,QTL作图的精度一般在10-30cM。如果控制某性状的位点在两个亲本中存在相同的等位基因,在分离群体中该位点控制的性状没有差异的,此时常规QTL分析的方法不能鉴定出该QTL。2023/10/83用遗传分析法进行QTL定位的缺点构建分离2023/10/84关联分析是一种以连锁不平衡为基础,鉴定某一群体内目标性状与遗传标记或候选基因关系的分析方法。又称连锁不平衡作图(linkagedisequilibriummapping)或关联作图(associationmapping),是传统QTL分析方法的一种替代方法。随着大量SNP标记的开发以及生物信息学的迅猛发展,用关联分析方发掘植物数量性状基因已成为植物基因组学研究的热点之一。关联分析法定位QTL2023/10/84关联分析是一种以连锁不平衡为基础,鉴定某2023/10/85AssociationTestsEvaluatewhethernucleotidepolymorphismsassociatewithphenotypeNaturalpopulationsExploitextensiverecombination1.3m1.5m1.4m1.8m2.0m2.0mTAGAACGGAACGTAAAATCGTGTAGTGGAG2023/10/85AssociationTestsEva2023/10/86一般以现有的自然群体为材料(如地方品种、育成品种、种质资源等),无需构建专门的作图群体,花费的时间少。特别适合于多年生木本植物如果树、林木等异花授粉植物。可以同时检测同一座位的多个等位基因,便于发掘优良的等位基因。定位的精度高,可达到单基因的水平。关联分析的优点2023/10/86一般以现有的自然群体为材料(如地方品种、2023/10/87连锁(linkage):当同一染色体上的某些位点由于相距很近,在减数分裂过程中这些位点之间发生重组的几率较小,而共同从亲代传递到子代的现象。连锁不平衡(LD):就是同一染色体上不同位点上等位基因的非随机组合(non-randomassociation)。单倍型:指一条染色体上紧密连锁的分子标记位点的等位基因倾向以一个单元传递给后代。1、连锁不平衡的定义二关联分析的原理2023/10/87连锁(linkage):当同一染色体上的2023/10/88人类HLA基因的遗传:人体细胞为二倍体型,两个单倍型分别来自父亲和母亲,共同组成个体的基因型(genotype)。HLA是人类白细胞抗原(HumanLeucocyteAntigen),由于一条染色体上HLA各位点的距离非常近,很少发生同源染色体之间的交换,因此后代的HLA以单倍型为单位将遗传信息传给子代。父亲母亲后代很少出现的重组类型2023/10/88人类HLA基因的遗传:人体细胞为二倍体型单倍型品种1品种2品种5品种3品种4品种6品种7品种10品种8品种92023/10/89单倍型品种1品种2品种5品种3品种4品种6品种7品种10品种2023/10/8102.如何判断位点之间存在连锁不平衡若连锁的两个基因座位上的等位基因分别为A、a和B、b,它们频率分别为
(A)、
(a)、
(B)和
(b);组成的单倍型有AB、Ab、aB和ab,这些单倍型的频率分别为
(AB)、
(Ab)、
(aB)和
(ab)。若(AB)>
(A)
(B),则表明A、B位点间存在LD。即当位于某一座位的特定等位基因与同一条染色体另一座位的某一等位基因同时出现的几率大于群体中因两个等位基因自由组合而同时出现的几率时,表明这两个座位间存在LD。2023/10/8102.如何判断位点之间存在连锁不平衡若ABAbaBab40个品种45个品种3个品种2个品种
(A)=0.48
(a)=0.52
(B)=0.47
(b)=0.53
(AB)=0.44
(A)
(B)=0.226
(AB)>
(A)
(B),位点A、B之间存在连锁不平衡2023/10/811ABAbaBab40个品种45个品种3个品种2个品种(A)ABAbaBab20个品种22个品种18个品种22个品种
(A)=0.44
(a)=0.56
(B)=0.54
(b)=0.46
(AB)=0.243
(A)
(B)=0.238
(AB)
(A)
(B),位点A、B之间不存在连锁不平衡2023/10/812ABAbaBab20个品种22个品种18个品种22个品种(2023/10/8133.连锁不平衡度量方法D(difference)表示某一单倍型的实际频率与期望频率的差值。当D=0时,两基因座位处于连锁平衡状态;当D
0时,两基因座位处于连锁不平衡状态;当D=1时,两基因座位处于完全连锁不平衡状态。通常用D来判断两个位点间是否存在连锁不平衡2023/10/8133.连锁不平衡度量方法D(diff五影响关联分析的因素及解决策略而优良玉米自交系则达100kb。人类基因组进行全基因组的LD分析大约需要70000个标记,IdentificationofMoreFavorableAllelesD1=D0(1-);交配体系是影响LD的最重要因素之一:5basicstepsrequiredforassociationstudies:不同玉米种质资源的LD衰减距离位点上只存在两个等位基因时,LD显著性可以用22列联表进行2测验,P<5%表明两位点的等位基因不是自由组合的,存在关联。如果两个等位基因频率不同的群体混合,就会产生LD。也可以分两步走:即首先利用LD衰减慢的骨干亲本进行全基因组扫描以确定候选基因区域,然后再利用地方品种和野生种质进行高分辨率的LD精细作图以发掘候选基因,并进一步确定基因内关键多态性位点。DomesticationGene亚群的混合使整个群体的LD强度增强,可能导致不连锁的基因多态性位点与性状的关联,从而得出假阳性结果。Atotalof517landraceswereselectedandcomprehensivelyphenotyped候选基因关联分析虽然获得的信息量较少,但它可以减少基因型检测的数量,更重要的是它可以避免检测覆盖全基因组的位点时所涉及到的统计问题。优良玉米自交系只需要50000个标记。定位的精度高,可达到单基因的水平。如果目标群体LD衰减很慢,即在很长的物理距离内存在LD,那么此群体适宜采用基于全基因组扫描的策略;25,经过10代后,D10=0.有些作物中,前期的研究已经建立核心种质,并获得了相应的遗传和表型资料,可直接用于关联分析。NucleotidevariationacrosstheO.2023/10/8143.1连锁不平衡度量也可以用r2
度量LD。对于只有两个等位基因的标记如SNP和AFLP,通常用D
和r2来估计两个座位之间的LD水平,二者都是以D为基础的。连锁不平衡系数D
五影响关联分析的因素及解决策略2023/10/8143.12023/10/815r2和D
取值范围:0(连锁平衡)~1(连锁不平衡)。D
和r2反映了LD的不同方面,在不同条件下表现不同。R2反映了重组史和突变史,而D仅反映重组史。D准确地估测重组差异,但样本较小时发现4种等位基因低频率组合的可能性大大减小,因此D不适宜小样本研究中的应用。r2可以提供标记是否能与QTL相关的信息,因此LD作图中通常采用r2来表示群体的LD水平。2023/10/815r2和D取值范围:0(连锁平衡2023/10/816
越大,LD衰减越快。不连锁的位点之间LD每代衰减50%。如果两位点紧密连锁,经过很多世代随机交配后,DtD0e-
nLD随自由交配世代增加而衰减群体内随机交配过程中,重组导致配子和单倍型频率趋向平衡值。在没有突变、选择和其它随机因素影响,在连续世代间连锁不平衡系数的关系:D1=D0(1-
);D2=D1(1-
)=D0(1-
)2;Dn=D0(1-)n
公式Dn=D0(1-)n
就是关联分析的基础理论
是两位点间的重组值;n表示随机交配的世代数目;D0
是起始代的连锁不平衡系数.2023/10/816越大,LD衰减越快。不连锁的位点LD随自由交配世代增加而衰减群体内随机交配过程中,重组导致配子和单倍型频率趋向平衡值。
是两位点间的重组值;n表示随机交配的世代数目;D0
是起始代的连锁不平衡系数.
越大,LD衰减越快。不连锁的位点之间LD每代衰减50%。在没有突变、选择和其它随机因素影响,在连续世代间连锁不平衡系数的关系:D1=D0(1-);D2=D1(1-)=D0(1-)2;Dn=D0(1-)n
公式Dn=D0(1-)n
就是关联分析的基础理论LD随自由交配世代增加而衰减群体内随机交配过程中,重组导致配例如,在最初时配子AB和ab的概率都为0.5,D0=1,处于完全连锁不平衡状态。如果
=0.01,经过10代后,D10=0.2261如果
=0.1,经过10代后,D10=0.0872如果
=0.25,经过10代后,D10=0.0141如果
=0.5,经过10代后,D10=0.0002当n趋向无穷时,Dn趋向0,但是Dn变化速度与
有很大关系。当很小时,Dn趋近0的速度很慢;当接近0.5时,Dn收敛趋近的速度很快。例如,在最初时配子AB和ab的概率都为0.5,D0=1,处于LD衰减与重组率的关系LD衰减与重组率的关系2023/10/8204.LD显著性的统计检验位点上只存在两个等位基因时,LD显著性可以用2
2列联表进行
2测验,P<5%表明两位点的等位基因不是自由组合的,存在关联。也可以用F测验存在多个等位基因时,LD的统计显著性(P-value)用多因子置换分析计算(multifactorialpermutationanalysis)(Weir,1996).必须注意:两个不连锁的位点间也可能存在LD,这种情况可能是由群体结构导致的。进行关联分析前,必须先进行群体结构分析。2023/10/8204.LD显著性的统计检验位点上只存在2023/10/8215连锁不平衡的表示方法描述LD在染色体上的分布有两种表示方法:LD衰减散点图:可以观测LD随遗传或物理距离的下降速率。LD配对检测的矩阵图:可以直接观测同一染色体的基因座位或基因的多态性位点之间LD的线性排列。描述LD在染色体上的衰减距离一般为D=0.5或r2=0.1时在染色体上的遗传距离。2023/10/8215连锁不平衡的表示方法2023/10/8222023/10/8222023/10/8232023/10/8232023/10/824LD是由突变产生的多态性形成的,因重组的发生而被打破。由此可见,突变和重组是影响LD的重要因素。其他生物因素和历史因素,例如物种交配体系、染色体位置、群体大小、基因或染色体片段所受的选择强度、遗传漂变等也影响LD的程度和分布。6.LD的衰减及影响LD的因素2023/10/824LD是由突变产生的多态性形成的,因重2023/10/825交配体系是影响LD的最重要因素之一:自交物种每次减数分裂时重组率很高,
但由于自交趋向纯合,
这样有效的重组率就会很低,最终导致自交物种的LD衰减距离远远大于异交物种。拟南芥、水稻和大麦是自交物种,LD衰减都很慢异花授粉植物如玉米,其LD衰减得较快。无性繁殖物种如甘蔗,它们的LD衰减更慢。2023/10/825交配体系是影响LD的最重要因素之一:2023/10/8262023/10/8262023/10/827异花授粉植物的不同群体LD衰减也存在很大差异;玉米农家种为1kb,具有广泛变异的玉米自交系大约为1.5kb,而优良玉米自交系则达100kb。不同玉米种质资源的LD衰减距离2023/10/827异花授粉植物的不同群体LD衰减也存在很ae1和sh1与直链淀粉含量关联其他生物因素和历史因素,例如物种交配体系、染色体位置、群体大小、基因或染色体片段所受的选择强度、遗传漂变等也影响LD的程度和分布。又称连锁不平衡作图(linkagedisequilibriummapping)或关联作图(associationmapping),是传统QTL分析方法的一种替代方法。IdentificationofMoreFavorableAlleles构建分离群体时,由于杂交和自交次数的限制,发生的重组次数有限,QTL作图的精度一般在10-30cM。进行关联分析前,必须先进行群体结构分析。IdentificationofMoreFavorableAlleles关联分析法以连锁不平衡为基础,鉴定某一群体内性状与遗传标记或候选基因间的关系。研究对象:包括7种常见病:躁郁症、冠状动脉粥样硬化、小肠克罗恩氏病、类风湿关节炎、I型糖尿病、II型糖尿病和高血压如果两个等位基因频率不同的群体混合,就会产生LD。r2和D取值范围:0(连锁平衡)~1(连锁不平衡)。PlantBreeding5,经过10代后,D10=0.也可以分两步走:即首先利用LD衰减慢的骨干亲本进行全基因组扫描以确定候选基因区域,然后再利用地方品种和野生种质进行高分辨率的LD精细作图以发掘候选基因,并进一步确定基因内关键多态性位点。1、连锁不平衡的定义DomesticationGene候选基因法:基于序列水平,通过统计分析在基因水平上将那些对目标性状有正向贡献的等位基因从种质资源中挖掘出来,一般涉及候选基因的功能预测。n表示随机交配的世代数目;ae1和sh2与糊化温度显著关联三关联分析的基本方法大多数作物在顺化过程中经历了至少一次‘瓶颈’。2023/10/828id1、tb1、sh1、d3等四个基因在来自全球玉米自交系群体中的LD衰减距离大约为1.5kb,同一群体中的d8和su1
两个基因的LD衰减距离较大,尤其是su1基因在10kb内几乎不衰减,这可能是在玉米的驯化过程中,近期对su1
基因进行了人工选择。玉米八氢番茄红素合成酶基因Y1
的LD衰减距离为2kb,而其假基因PSY2
在相同玉米群体中的LD衰减距离却只有250bp。不同基因的LD衰减距离也不同。ae1和sh1与直链淀粉含量关联2023/10/828id12023/10/829不同玉米基因LD衰减距离不同r22023/10/829不同玉米基因LD衰减距离不同r22023/10/830B.瓶颈效应、奠基者效应和遗传漂变增加LD瓶颈效应使群体大小极端减少,导致变异减少,LD增加.大多数作物在顺化过程中经历了至少一次‘瓶颈’。育种家的选择导致‘瓶颈效应’,如从很少的几个亲本材料中引入一个新抗病基因或农艺性状。奠基者效应是一种特例,当一个物种在一个新环境生存下来,最开始的奠基者是非常小的一个群体–仅仅是几个种子或几个家庭.遗传漂变会增加LD。2023/10/830B.瓶颈效应、奠基者效应和遗传漂变增2023/10/831TheBottomLineforDiversityTeosintesMaizeLandracesMaizeInbredLines
UnselectedGeneDomesticationGeneImprovementGenePlantBreedingDomesticationInwhichcategorydothegenesresponsibleforYOURtraitbelong?2-4%(~1200)ofmaizegenes
haveundergoneselectionSelectionScreensVerylowgeneticdiversityGenesthatcontributetoagronomictraitshavebeentargetsofselection.2023/10/831TheBottomLinefor2023/10/832C.Migrationandpopulationadmixture如果两个等位基因频率不同的群体混合,就会产生LD。群体混合和迁移也会产生LD.通常,迁移和混合产生群体结构,进行LD分析出现假关联问题。2023/10/832C.Migrationandpo2023/10/833D.Selection当种群受到平衡选择(balancingselection)的作用时,群体中会存在两个或几个频率较高的等位基因。当某个等位基因受到强烈的正选择作用(positiveselection)时,其附近与之紧密连锁的位点上的等位基因频率也随着增加,这样的现象被称为搭载效应(hitchhiking)或选择扫荡(selectivesweep)。2023/10/833D.Selection当种群受到平衡2023/10/8342023/10/8342023/10/8352023/10/835研究生专题关联分析课件-而优良玉米自交系则达100kb。有些作物中,前期的研究已经建立核心种质,并获得了相应的遗传和表型资料,可直接用于关联分析。InbredLines躁郁症检测到1个易发病主效位点其他生物因素和历史因素,例如物种交配体系、染色体位置、群体大小、基因或染色体片段所受的选择强度、遗传漂变等也影响LD的程度和分布。公式Dn=D0(1-)n就是关联分析的基础理论四关联分析的基本步骤通常,迁移和混合产生群体结构,进行LD分析出现假关联问题。而优良玉米自交系则达100kb。必须要有高通量、低成本的SNP标记检测技术:例如,在最初时配子AB和ab的概率都为0.利用遗传连锁图进行QTL定位利用遗传连锁图进行QTL定位当很小时,Dn趋近0的速度很慢;ae1和sh1与直链淀粉含量关联1,经过10代后,D10=0.当很小时,Dn趋近0的速度很慢;LD显著性的统计检验根据连锁分析的结果,选择效应值比较大的位点,利用更多的标记进行LD分析,对目标位点进行精细定位,然后根据已知基因组的信息选择适当的候选基因进行关联分析。利用适当的QTL分析软件对控制目标性状的基因进行全基因组QTL扫描。ProportionofvariousLDdecayrate
inthegenome2023/10/837Copyright©2007bytheGeneticsSocietyofAmericaOlsen,K.M.etal.Genetics2006;173:975-983NucleotidevariationacrosstheO.sativaWxgenomicregiononchromosome6而优良玉米自交系则达100kb。2023/10/837Co2023/10/838新产生的突变与其它位点之间存在LD:thenewmutationonlyoccursonasinglehaplotype.在随后的世代,重组产生新的单倍型,引起LD衰减;紧密连锁的标记之间LD衰减需要很多世代.在群体中,一个突变要经过很多交配世代后才能达到我们能检测的等位基因频率,所以我们通常观察到的多态性都是古老的变异.E.Mutation2023/10/838新产生的突变与其它位点之间存在LD:2023/10/839关联分析有两种方法:全基因组分析法:基于标记水平,通过对引起表型变异的突变位点进行全基因组扫描来实现,一般不涉及候选基因的预测。候选基因法:基于序列水平,通过统计分析在基因水平上将那些对目标性状有正向贡献的等位基因从种质资源中挖掘出来,一般涉及候选基因的功能预测。三关联分析的基本方法
2023/10/839关联分析有两种方法:三关联分析的基本两种方法如何选择?如果目标群体LD衰减很慢,即在很长的物理距离内存在LD,那么此群体适宜采用基于全基因组扫描的策略;相反,如果目标群体的LD衰减很快,即在很短的物理距离内迅速衰退,则此群体适宜采用基于候选基因的高分辨率LD作图策略。已完成全基因组测序的物种适合采用全基因组关联分析。一般可以用SNP芯片或全基因组重测序方法进行高通量SNP基因型分析;没有完成基因组测序的物种,可以采用候选基因关联分析方法。也可以分两步走:即首先利用LD衰减慢的骨干亲本进行全基因组扫描以确定候选基因区域,然后再利用地方品种和野生种质进行高分辨率的LD精细作图以发掘候选基因,并进一步确定基因内关键多态性位点。两种方法如何选择?如果目标群体LD衰减很慢,即在很长的物理距2023/10/841候选基因的选择候选基因的选择需要利用多学科如突变体分析、生化途径分析、病理学、基因表达谱和比较基因组等信息,根据这些信息列出一个‘候选基因’清单。或者在以前定位的QTL区段的基因作候选基因每个候选基因的序列必须是已知的,可用于设计引物。2023/10/841候选基因的选择候选基因的选择需要利用多目标性状:玉米籽粒成分和淀粉特性考察的性状:蛋白、油分和淀粉含量、直链淀粉含量、淀粉胶稠度、糊化温度候选基因:amyloseextender1(ae1),brittleendosperm2(bt2),shrunken1(sh1),sh2,sugary1,waxy1结果:bt2,sh1和sh2与籽粒成分如蛋白、油分和淀粉含量显著关联ae1和sh2与糊化温度显著关联ae1和sh1与直链淀粉含量关联目标性状:玉米籽粒成分和淀粉特性全基因组关联分析必须要有高通量、低成本的SNP标记检测技术:SNP芯片Next-generationsequencingdHPLCRe-sequencing(traditionalandnovelsequencingtechniques)SNaPshotSNplex全基因组关联分析必须要有高通量、低成本的SNP标记检测技术:研究生专题关联分析课件-研究对象:包括7种常见病:躁郁症、冠状动脉粥样硬化、小肠克罗恩氏病、类风湿关节炎、I型糖尿病、II型糖尿病和高血压SNP检测:AffymetrixGeneChip500KMappingArraySet群体:每种病人
2000人对照:正常人
3000人分析方法:病例-对照比较法结果(显著度P<5
10-7)躁郁症检测到1个易发病主效位点冠状动脉粥样硬化检测到1个易发病主效位点小肠克罗恩氏病检测到9个易发病主效位点类风湿关节炎检测到3个易发病主效位点I型糖尿病检测到7个易发病主效位点II型糖尿病检测到3个易发病主效位点高血压没有检测到效应特别大的位点所有这些位点都是以前的研究中报道的,证明全基因组关联分析定位复杂数量性状是可行的研究对象:包括7种常见病:躁郁症、冠状动脉粥样硬化、小肠克躁郁症冠状动脉粥样硬化1个小肠克罗恩氏病9个高血压0个类风湿关节炎3个I型糖尿病7个II型糖尿病3个躁郁症冠状动脉粥样硬化1个小肠克罗恩氏病9个高血压0个类风湿5,D0=1,处于完全连锁不平衡状态。LD随自由交配世代增加而衰减LD的衰减及影响LD的因素在没有突变、选择和其它随机因素影响,在连续世代间连锁不平衡系数的关系:群体:每种病人2000人Genesthatcontributetoagronomictraitshavebeentargetsofselection.用遗传分析法进行QTL定位的缺点也可以分两步走:即首先利用LD衰减慢的骨干亲本进行全基因组扫描以确定候选基因区域,然后再利用地方品种和野生种质进行高分辨率的LD精细作图以发掘候选基因,并进一步确定基因内关键多态性位点。I型糖尿病检测到7个易发病主效位点D0是起始代的连锁不平衡系数.gelatinizationtemperature优良玉米自交系只需要50000个标记。n表示随机交配的世代数目;构建分离群体时,由于杂交和自交次数的限制,发生的重组次数有限,QTL作图的精度一般在10-30cM。所有这些位点都是以前的研究中报道的,证明全基因组关联分析定位复杂数量性状是可行的D2=D1(1-)=D0(1-)2;5basicstepsrequiredforassociationstudies:ae1和sh2与糊化温度显著关联Choiceoftargettrait(s)在没有突变、选择和其它随机因素影响,在连续世代间连锁不平衡系数的关系:小肠克罗恩氏病检测到9个易发病主效位点2023/10/847候选基因关联分析虽然获得的信息量较少,但它可以减少基因型检测的数量,更重要的是它可以避免检测覆盖全基因组的位点时所涉及到的统计问题。可能遗漏部分QTL。全基因组关联分析信息量大,可以检测到所有的QTL。全基因组与候选基因关联分析比较5,D0=1,处于完全连锁不平衡状态。2023/10/847Genome-wideassociationstudiesof14agronomictraitsinricelandracesAtotalof517landraceswereselectedandcomprehensivelyphenotypedAllsequencesusedforSNPcallingcomprised~508-foldcoverageofthericegenome.Atotalof3,625,200nonredundantSNPswereidentified,resultinginanaverageof9.32SNPsperkbGenome-wideassociationstudie10/8/2023LDdecayrateacrossthegenomeindicajapinica10/8/2023LDdecayrateacross10/8/2023ProportionofvariousLDdecayrate
inthegenome10/8/2023Proportionofvarious10/8/2023Genomewideassociationanalysisofheadingdate10/8/2023GenomewideassociatiRegionsofthegenomeshowingassociationsignalsaroundknowngenescontrollingheadingdateRegionsofthegenomeshowingRegionsofthegenomeshowingstrongassociationsignalsnearpreviouslyidentifiedgenesgelatinizationtemperatureGrainlengthAmylosecontentRegionsofthegenomeshowing2023/10/854四关联分析的基本步骤5basicstepsrequiredforassociationstudies:germplasmchoice;estimationofpopulationstructure;traitevaluation;Genotypingofthepopulationstatisticalanalysis.2023/10/854四关联分析的基本步骤5basic2023/10/8552023/10/8552023/10/856种质资源选择是关联分析成功的关键。种质资源应包括尽可能多的表型变异,代表一个作物的育种资源谱。根据遗传和表型调查数据鉴定出一套遗传多样性丰富的种质资源,使其包括尽可能多的等位基因。有些作物中,前期的研究已经建立核心种质,并获得了相应的遗传和表型资料,可直接用于关联分析。自然存在的异花授粉树木是关联分析最好的群体。A.Choiceofgermplasm2023/10/856种质资源选择是关联分析成功的关键。种质2023/10/857B.Estimationofpopulationstructure群体结构的存在可导致出现假阳性,必须通过统计分析排除.用大量独立的分子标记(通常为50-150个,根据基因组大小确定)对选用群体群体结构进行分析,判断是否存在群体结构.如果存在群体结构,需要对群体数据进行校正。2023/10/857B.EstimationofpoGenome-wideassociationstudiesof14agronomictraitsinricelandraces根据连锁分析的结果,选择效应值比较大的位点,利用更多的标记进行LD分析,对目标位点进行精细定位,然后根据已知基因组的信息选择适当的候选基因进行关联分析。候选基因法:基于序列水平,通过统计分析在基因水平上将那些对目标性状有正向贡献的等位基因从种质资源中挖掘出来,一般涉及候选基因的功能预测。ChoiceofcandidategenesD2=D1(1-)=D0(1-)2;结果(显著度P<510-7)根据连锁分析的结果,选择效应值比较大的位点,利用更多的标记进行LD分析,对目标位点进行精细定位,然后根据已知基因组的信息选择适当的候选基因进行关联分析。五影响关联分析的因素及解决策略也可以分两步走:即首先利用LD衰减慢的骨干亲本进行全基因组扫描以确定候选基因区域,然后再利用地方品种和野生种质进行高分辨率的LD精细作图以发掘候选基因,并进一步确定基因内关键多态性位点。D0是起始代的连锁不平衡系数.DomesticationGene异花授粉植物如玉米,其LD衰减得较快。id1、tb1、sh1、d3等四个基因在来自全球玉米自交系群体中的LD衰减距离大约为1.构建分离群体时,由于杂交和自交次数的限制,发生的重组次数有限,QTL作图的精度一般在10-30cM。AssociationAnalysis假关联:位于不同染色体上的标记与性状存在关联。n表示随机交配的世代数目;当D=1时,两基因座位处于完全连锁不平衡状态。UnselectedGene5basicstepsrequiredforassociationstudies:也可以分两步走:即首先利用LD衰减慢的骨干亲本进行全基因组扫描以确定候选基因区域,然后再利用地方品种和野生种质进行高分辨率的LD精细作图以发掘候选基因,并进一步确定基因内关键多态性位点。2023/10/858C.Choiceoftargettrait(s)选择的性状必须是能准确测量、可遗传的.必须设置多年或多点重复、随机区组设计,调查10-15个单株。Genome-wideassociationstudie2023/10/859ForwardGeneticsTraitPositionallyclonedgeneReverseGeneticsTraitCandidategeneQTLCandidatePolymorpismD.Choiceofcandidategenes2023/10/859ForwardGeneticsTra2023/10/860AssociationAnalysisIdentificationofMoreFavorableAllelesEnhancedMarkerAssistedBreedingChoiceofcandidategenes2023/10/860AssociationAnalysi2023/10/861影响关联分析的因素LD是关联分析的基础和前提,决定关联分析的精度和所选用标记的数量、密度,以及试验方案有关。在全基因组扫描时,需要大量分子标记,据估计:人类基因组进行全基因组的LD分析大约需要70000个标记,拟南芥需要6000个标记,玉米农家种则需要750000个标记,优良玉米自交系只需要50000个标记。五影响关联分析的因素及解决策略2023/10/861影响关联分析的因素五影响关联分析的因位点A、B之间不存在连锁不平衡三关联分析的基本方法5basicstepsrequiredforassociationstudies:关联分析是一种以连锁不平衡为基础,鉴定某一群体内目标性状与遗传标记或候选基因关系的分析方法。选择的性状必须是能准确测量、可遗传的.玉米农家种则需要750000个标记,而优良玉米自交系则达100kb。PlantBreeding构建分离群体时,由于杂交和自交次数的限制,发生的重组次数有限,QTL作图的精度一般在10-30cM。D0是起始代的连锁不平衡系数.Copyright©2007bytheGeneticsSocietyofAmerica位点上只存在两个等位基因时,LD显著性可以用22列联表进行2测验,P<5%表明两位点的等位基因不是自由组合的,存在关联。拟南芥、水稻和大麦是自交物种,LD衰减都很慢DomesticationD0是起始代的连锁不平衡系数.位点A、B之间存在连锁不平衡(AB)(A)(B),5,D0=1,处于完全连锁不平衡状态。研究对象:包括7种常见病:躁郁症、冠状动脉粥样硬化、小肠克罗恩氏病、类风湿关节炎、I型糖尿病、II型糖尿病和高血压例如,在最初时配子AB和ab的概率都为0.人类基因组进行全基因组的LD分析大约需要70000个标记,2023/10/862群体结构指的是一个群体内存在亚群的情况。亚群的混合使整个群体的LD强度增强,可能导致不连锁的基因多态性位点与性状的关联,从而得出假阳性结果。假关联:位于不同染色体上的标记与性状存在关联。五影响关联分析的因素及解决策略位点A、B之间不存在连锁不平衡2023/10/862五影响2023/10/863解决策略选择LD程度高的群体进行全基因组关联分析,可减少使用的标记数量。连锁分析和关联分析相结合对特定位点进行研究。根据连锁分析的结果,选择效应值比较大的位点,利用更多的标记进行LD分析,对目标位点进行精细定位,然后根据已知基因组的信息选择适当的候选基因进行关联分析。用实验设计和多种统计方法消除群体结构引起的假阳性。2023/10/863解决策略选择LD程度高的群体进行全基2023/10/864六关联分析相关的软件2023/10/864六关联分析相关的软件2023/10/8652023/10/8652023/10/8662023/10/8662023/10/867一般以现有的自然群体为材料(如地方品种、育成品种、种质资源等),无需构建专门的作图群体,花费的时间少。特别适合于多年生木本植物如果树、林木等异花授粉植物。可以同时检测同一座位的多个等位基因,便于发掘优良的等位基因。定位的精度高,可达到单基因的水平。关联分析的优点2023/10/867一般以现有的自然群体为材料(如地方品种2023/10/868
越大,LD衰减越快。不连锁的位点之间LD每代衰减50%。如果两位点紧密连锁,经过很多世代随机交配后,DtD0e-
nLD随自由交配世代增加而衰减群体内随机交配过程中,重组导致配子和单倍型频率趋向平衡值。在没有突变、选择和其它随机因素影响,在连续世代间连锁不平衡系数的关系:D1=D0(1-
);D2=D1(1-
)=D0(1-
)2;Dn=D0(1-)n
公式Dn=D0(1-)n
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五版多房产离婚协议书-2025年度家庭财产分割实施流程2篇
- 二零二五年度餐饮业餐饮店装修设计与施工服务合同2篇
- 二零二五版广告牌广告位租赁与广告效果分析合同3篇
- 二零二五年度钢板租赁及节能改造服务合同2篇
- 二零二五版房屋抵押借款合同及借款收据范本3篇
- 二零二五年度软装方案创意设计合同2篇
- 二零二五年度火锅店原料采购及质量控制合同范本3篇
- 二零二五版跨境电商个人合伙退伙合同范本3篇
- 二零二五年度顶账房买卖合同备案及注销协议3篇
- 二零二五版绿色建筑项目垫资合同范本共3篇
- 《疥疮的防治及治疗》课件
- Unit4 What can you do Part B read and write (说课稿)-2024-2025学年人教PEP版英语五年级上册
- 2025年MEMS传感器行业深度分析报告
- 《线控底盘技术》2024年课程标准(含课程思政设计)
- 学校对口帮扶计划
- 仓库仓储安全管理培训课件模板
- 风力发电场运行维护手册
- 《3-6岁儿童学习与发展指南》专题培训
- 河道旅游开发合同
- 情人合同范例
- 建筑公司劳务合作协议书范本
评论
0/150
提交评论