



版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
背 材料与方 材 参考组确 实验建库及高通量................................................................................................... 信息分析流 3.1质量值分布检 3.3数据产出和质量统 SLAF开 SLAF统 SLAF分 SNP信息统 PCA分 简化组遗传进化文章赏 参考文 科它应用数学和统计学方法研究群体中频率和型频率以及影响这些频率的选择效所带来的各种型在数量上的分布称为群体的遗传结构获知了不同世代中遗传结构的演SLAF-seq[1]技术作为一种新发展的技术,通过限制性内切酶消化组DNA,选取一定长度的片段进序,降低了组的复杂度,并且不依赖组序列,因而成为SNP标记开发的首选。相对于传统的技术,SLAF-seq技术不仅节省成本和时间,而且本研究利用SLAF-seq简化组技术,选择足够多的样本,获得高密度覆盖全基SNP标记,进行群体进化的研究。材本本个XX参考组确根据项目物种的组大小以及GC含量等信息选取项目物种或近缘物种的组作酶切方案确实验建库及高根据选定的最适酶切方案,对检测合格的各样品组DNA分别进行酶切。对得到的酶切片段(SLAF)进行3′端加A处理、连接Dual-index接头、PCR扩增、纯化、IlluminaHiSeq2500,PE125(PE250)进实验建库评
1SLAF实验流通过水稻晴作为control的数据来评估实验过程是否正常,确定酶切方案枪法和逐步克隆方法进序目前已完成全部核组、叶绿体组和线粒体组测序工作,精确度达到99.99%。主要从以下几个方面进行评估:比对效率统计,即将reads与参考组进行比对酶切效率评估,即统计reads片段中残留酶切位点的比例利用Dual-index对得到的原始数据进行识别,得到各个样品的reads。过滤reads的接头后,进序质量和数据量的评估。通过Control数据评估酶切效率,以此判断实验过程的准确性和有效性。根据生物信息学分析,在群体中开发全组范围的SNP质量值分布检通常序列5’端前几个碱基的错误率相对较高,随着序列的延伸,3’端碱基错误率会不断升高,这是由高通量的技术特点决定的。碱基质量30表示碱基的错误率为0.1%。样品的reads质量值分布图见下图:碱基分布检SLAF所列为组酶切后的DN段,由于酶切位点在组上的分布是近似响,reads的前两到三个碱基都是酶切位点序列,因此在碱基分布图中会出现前端波动较大的现象。样品的碱基含量分布图见下图:数据产出和质量对各样品的数据进行统计,包括reads数量、Q30和GC含量,具体结果见表表1各样品数据统SampleBMKQ30percentageGC……………注SampleID:项目;BMKID:百迈客对项目样品的统一TotalReads:各样品的reads数Q30percentage:质量值大于或等于30的碱基所占百分比;GCpercentage:结果中G和C两种碱基所占总碱基的百分比;SLAF开readsSNP。SLAF开发流程见下图SLAF统本项目共开发XXX个SLAF每个样品的平均深度为XX,具体统计见表2统SampleBMKTotalAverage……………注SampleID:项目;BMKID:百迈客对项目样品的统一SLAFnumber:对应样品所含有的SLAF数Totaldepth:对应样品的在SLAF中的总深度,即总reads数Averagedepth:平均每个SLAF上对应样品的reads数SLAF分SLAF,其中SNP这种类型为多态性标记,统称为Marker,本次分析共得到XXX个表3各类型SLAF结果统 No 注:SNP:单核苷酸突变;INDEL:缺失;NoPolymorphism:没有多态性;Unknown:类型未知;Repeat:重复序列在开发得到的XXX个SLAF中多态性标记共有XXX个多态性比例达到XXX%SNP根XXXMarker,利用GATKSNP标记检测。SNP位点详细4:4样品SNP信息统计SampleSNPHeterHeter…注:SampleID:样品;SNPnum:样品中检测到的SNP个数;Transition:转换类型SNP个数;Transversion:颠换类型SNP个数;Ti/Tv:转换与颠换数之比;Heternum:样品中杂合SNP位点个数;Heterratio:样品中杂合SNP位点占所有SNP位点的系统发育分系统发育树(phylogenetictreeevolutionarytree进化树)是描述群体间进化顺序的分SNP检测之后,得到的SNPs可以用于计算种群之间的距离。两个i和j之LD=1∑
如果两个的型是AA和
{1,如果两个的型是AA和本实验通过MEGA5(Tamuraetal.,2011)软件[2],利用得到的SNP标记,基于neighbor-joining(SaitouNetal1987)算法[3]对XX份材料进行系统发育树分析,目的在于探索每个间的关系。群体结构分则亲缘关系稍远。群体结构分析有助于理解进化过程,并且可以通过型和表型的关联研究确定所属的亚群。在群体世系推断分析之后,可以将样本按区域或种群进行划分[4]本项目运用admixture(lexanderetal.,2009)软件[5]SNP标记,基于数学模型对群体内XXAdmixture(cross-validationerror)来判断最佳K值——K值的交叉验证误差最小(cross-validationerror,最终确定群体中最优的类群数目,如下图所示,K=7时具有最优分群数。 同K值与CV值的对应线,结果显示K=7PCA主成分分析(principalcomponentysis)是一种利用正交变换将一组可能是相关变量的观测值转换为一组称为主成分线性不相关的变量值。PCA在遗传学当中主要用于聚类分本实验运用cluster(Readetal2001)软件[6]SNP标记,对群体内XX份PCAXX份材料的主成分聚类情况,从而知道哪些样品的注:图中通过PCA分析将样品聚为三维,pca1代表第一主成分,pca2代表第二主成分,pca3代表第三主成分。一个点代表一个样品。不同颜色代表不同的亚种类型,绿色表示亚种类型为1的样品,紫色表示亚种类型为2的样品,黄色表示未给定亚种类文章:PopulationgenomicevidenceforadaptivedifferentiationinBalticSeathree-spinedsticklebacks.BMCBiology,2015.这篇文章是对的海三刺鱼进行的群体适应性分化的用材料是位于的海10个地点的三刺鱼群体,每个群体取36个,对这些群体进行简化,共获得14万SNP进行分析。和温度的适应性进行关联分析,共发现有297个包含的SNP既在群体分化区域又与环境适应性相关。通过对297个进行注释,发现15个与早期研究中三刺鱼在海洋与淡水的分化有关,还有22个与适应盐度有关。SunX,LiuD,ZhangX,etal.,SLAF-seq:AnEfficientMethodofLarge-ScaleDeNovoSNPDiscoveryandGenotyUsingHigh-ThroughputSequencing.PLosone,2013,8:e58700.KTamura,etal.,MEGA5:molecularevolutionarygeneticsysis likelihood,evolutionarydistance,and umparsimonymethods.MolBiolEvol,2011,28(10):2731-2739.NSaitouandMNei,Theneighbor-joiningmethod:anewmethodforreconstructingphylogenetictrees.MolBiolEvol,1987,4(4):406-425.Wright,S.,Thegeneticalstructureofpopulations.Ann.Eugen.1951,15,DHAlexander,etal.,Fastmodel-basedestimationofancestryinunrelatedGenomeRes.,2009,19:1655-KanazinV,TalbertH,SeeD,etal.,Discoveryandassayofsingle-nucleotidepolymorphismsinbarley(Hordeumvulgare).PlantMolecularBiology,2002,48:529-537.JuliaC.Jones,ShaohuaFan,PaoloFranchini,etal.,TheevolutionatyhistoryofXiphorusfishandtheirsexuallyselectedsword:agenome-wideapproachusingrest
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 三农村合作社合作模式优化方案
- 防撞护栏安装施工方案
- 转换层模板施工方案
- 不锈钢雨棚施工方案
- 綦江酒店铝单板施工方案
- 龙泉塑石假山制作施工方案
- 路面沥青工程施工方案
- 临床急性化脓性扁桃体炎和传染性单核细胞增多症鉴别诊断、相同点及区别
- 杭州扣盘式脚手架施工方案
- 桐梓科学开展松树育苗和病虫害防治工作的实践及成果分析
- (高鸿业)微观经济学习题解析+微观经济学题库解析
- 《尿11-脱氢血栓烷B2与其他危险因素的交互效应在急性冠脉综合征患者中的研究》
- 咨询公司项目风险控制方案
- 校园食品安全培训课件
- 开关柜更换改造施工方案
- 《眼科常用眼药及护》课件
- 污水处理厂防水防腐工程施工方案
- 幕墙作业安全技术交底
- TCOSOCC 016-2024 信息技术应用创新 软件测试要求
- 食堂晨午检制度
- 《边缘计算与人工智能应用开发技术》全套教学课件
评论
0/150
提交评论