![BCC精品培训关联分析_第1页](http://file2.renrendoc.com/fileroot_temp3/2021-11/2/2efa3a71-a764-4457-98ac-03a284f40c7a/2efa3a71-a764-4457-98ac-03a284f40c7a1.gif)
![BCC精品培训关联分析_第2页](http://file2.renrendoc.com/fileroot_temp3/2021-11/2/2efa3a71-a764-4457-98ac-03a284f40c7a/2efa3a71-a764-4457-98ac-03a284f40c7a2.gif)
![BCC精品培训关联分析_第3页](http://file2.renrendoc.com/fileroot_temp3/2021-11/2/2efa3a71-a764-4457-98ac-03a284f40c7a/2efa3a71-a764-4457-98ac-03a284f40c7a3.gif)
![BCC精品培训关联分析_第4页](http://file2.renrendoc.com/fileroot_temp3/2021-11/2/2efa3a71-a764-4457-98ac-03a284f40c7a/2efa3a71-a764-4457-98ac-03a284f40c7a4.gif)
![BCC精品培训关联分析_第5页](http://file2.renrendoc.com/fileroot_temp3/2021-11/2/2efa3a71-a764-4457-98ac-03a284f40c7a/2efa3a71-a764-4457-98ac-03a284f40c7a5.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、全基因组关联分析周家蓬博士QQ群:259804181基本概念历史、现状和趋势一般流程研究策略应用价值全基因组关联研究 Genome-wide association study (GWAS) 检测全基因组范围的遗传变异与可观测性状间的遗传关联遗传变异的检测 SNP芯片 Affymetrix: 500K chip (Randomly distributed) Illumina: 550K chip (gene-based) 高通量测序 Illumina/Solexa: DNA-seq, RNA-seq遗传变异的数量 “单倍型图谱计划 1”(Nature 2005)SNP: 1M “单倍型图谱计划
2、 2”(Nature 2007)SNP: 4M “单倍型图谱计划 3”(Nature 2010)SNP: 10M SNP和SNP基因型TTCAGTCAGATTCCAGCCCTTCAGTCAGATTCCAGCCC样本样本1样本样本2TTCAGTCAGATTCCAGCCCTTCAGTCAGAGTCCAGCCC表型 & 模型和算法 表型:质量性状和数量性状 表型校正:去除outliers,取特征值,取剩余值 模型:混合线性模型方程组 算法:SNP,单倍型,CNV,Gene-set(SNPs) Add.,Dom.,Rec.,Int. Frequentist,Bayesian 方差/秩和,均值/
3、中位数 打分值,似然比 Bonferroni,FDR,Permutation,Bootstrap编码基因型For one marker with two alleles, there can be three possible genotypes:GenotypeCodingAA2Aa1aa0病例/对照设计的数据结构individualaffectiongenderSNP 1SNP 2SNP n11F21221M22130F12241F11250M0-91sample idcase/controlgenotypes遗传假设和遗传模型Genotypic modelHypothesis: all
4、3 different genotypes have different effectsGenotypeGenotypic ValueAAAAAaAaaaaaAA vs. Aa vs. aaDominant modelHypothesis: the genetic effects of AA and Aa are the sameGenotypeGenotypic ValueAAA-AaA-aaaaAA and Aa vs. aa遗传假设和遗传模型(续)Recessive modelHypothesis: the genetic effects of Aa and aa are the sam
5、eGenotypeGenotypic ValueAAA-Aaa-aaaaAA vs. Aa and aa遗传假设和遗传模型(续)Allelic modelHypothesis: the genetic effects of allele A and allele a are differentGenotypeGenotypic ValueAA2AAaA+ aaa2aA vs. a遗传假设和遗传模型(续)卡方检验w Genotypic modelw Null hypothesis: Independence AAAaaacasesnAAnAanaacontrolsmAAmAamaajiijH.0
6、 :df = 2w Chi-squared test statistic:w O is the observed cell countsw E is the expected cell counts, under null hypothesis of independence 统计量cells all22E)(O ENE)alcolumn tot totalrow(R code Statistics hist(Statistics, prob=T) curve( dchisq(x, df=5), col=blue, add=TRUE ) curve( dchisq(x, df=2), col=
7、red, add=TRUE ) P-1-pchisq(10,df=2);P1 0.006737947 统计量统计量Histogram of StatisticsStatisticsDensity051015200.000.050.100.15P 值值GWAS的历史 2005年,Science杂志报道了第一篇GWAS研究:年龄相关性黄斑变性 之后陆续出现了有关冠心病、肥胖、2型糖尿病、甘油三酯、精神分裂症以及相关表型的报道GWAS的现状GWAS的趋势探求因果关系 逻辑推理:归纳法(从特殊到一般)、演绎法(从一般到特殊) “穆勒五法”:求同法、求异法、求同求异法、共变法、排除法 全基因组关联研究主
8、要基于共变法思想 科学技术史之父萨顿认为科学是人类唯一具有累积性和继承性的活动一般流程A. 使用SNP分型芯片获得高通量的基因型B. 对基因型进行质量评估和控制C. 若为质量性状,需进行群体分层检测;如为数量性状,则对表型进行协变量校正D. 采用若干遗传模型进行全基因组关联分析E. 增加额外的数据进行结果验证AHMU案例A. Illumina Human 610Quad BeadChipB. Call rate 90%, MAF 1%, HWE P 0.8)对填充基因型进行筛选过滤4. 进行关联分析常用软件 BEAGLE、IMPUTE、MACH和PLINK等通路分析 定义 将SNPs按照生物学
9、通路分组,比较各通路在病例/对照或连续性状数量上的差异 成功案例 克隆病、I型糖尿病、类风湿性关节炎、精神分裂症、乳腺癌等通路分析 分析步骤1. 选择生物通路(KEGG)2. 选择Tag SNPs (HapMap)3. 多因素分析4. 显著SNPs结果综合常用软件 GSEA、IPA等互作分析 定义 研究基因-基因、基因-环境间交互作用 成功案例 老年黄斑变性、帕金森病、直肠癌、膀胱癌,哮喘等互作分析 分析步骤1. 选择显著及近似显著SNPs2. 选择风险环境因素3. 构建互作模型4. 多因素分析常用软件 PLINK、Random Jungle、BEAM等其他策略 两阶段法 精细定位/目标测序
10、表型/性状联合 单倍型分析遗传变异的检测 SNP芯片 Affymetrix: 500K chip (Randomly distributed) Illumina: 550K chip (gene-based) 高通量测序 Illumina/Solexa: DNA-seq, RNA-seq高通量测序 Next-generation sequencing (NGS) 平行测序SNP分型:coverage & variant frequency参考基因组序列参考基因组序列个体正向序列个体正向序列个体反向序列个体反向序列遗传变异的种类 单核苷酸多态性 Single nucleotide pol
11、ymorphism SNP占总变异的90% 插入缺失 Insertion-deletion InDel1-50bp DNA片段 结构变异 Structural variation SV50bp DNA片段遗传变异的数量 “千人基因组计划”(Nature 2012) SNP: 38M InDel: 1.4M SV: 14K 效应大小 vs. 变异频率家系病例或极端性状个体 Nat Rev Genet. 2010 Jun;11(6):415-25. 外显子突变是孟德尔疾病主要病因;多向性效应影响复杂疾病 价格相对低廉 目前主要用于检测孟德尔疾病 新的策略或方法:Lasso,折叠法,聚合法外显子组测
12、序Lasso 岭回归: |beta|2t Lasso回归: |beta|t 贝叶斯: 全概率&损失函数 机器学习: SVM低覆盖度测序+缺失基因型填充Pasaniuc et. al., 2012策略评估 Pasaniuc等证实覆盖度低至0.1-0.5X依然可以通过后续的填充方法获得高密度芯片的效果策略评估(续) Howie等发明了一种pre-phasing的填充方法,该方法通过对GWAS样本个体进行连锁相构建,进而利用参考库的单倍型进行缺失基因型填充NGS-GWAS 水稻农艺性状14种 运用重测序技术对517个中国水稻地方品系进行进化及GWAS分析1X重测序KNN基因型填充算法MLM遗
13、传模型 Nat Genet. 2010 Oct; 42: 961967. 高密度芯片低覆盖度测序基本特点芯片基于正常人群中的高频SNP标记设计,没有与疾病相关的突变信息可以同时检测到人群中的高频SNP和未被发现的低频突变最高分辨率根据不同的芯片型号,一般在30-100bp精确到单个碱基覆盖范围只能局限于芯片内容,无法获得全部基因组信息仅受到能够定位到基因组的reads数据量影响,可获得全基因组的信息技术原理杂交原理,实验环境和样本对实验重复有很大影响合成测序,重复性好动态量程弱信号被舍弃,强信号会饱和 没有局限数据产出选择 不可以可以背景噪音高低数据延展性随着人类基因组的进一步完善,测序数据可
14、以进一步深挖高密度芯片 vs. 低覆盖度测序测序成本GWAS: Array-based vs. NGS-based基本流程 高通量测序基因分型: CLC Genomics Workbench & Server BWA/Bowtie + SAMtools/GATK + IGV 全基因组关联分析: PLINK,TASSEL,QTDT/FBAT BEAGLE/IMPUTE + SNPTEST 可视化和注释: IGV/gPlink + ANNOVAR/Annotation.plGWAS模块植物育种植物育种动物育种动物育种人类疾病人类疾病TASSELQTDTFBATPBATPLINKSNPTES
15、TMENDELBEAMIMPUTE BEAGLE METAL HAPLOVIEW FASTSNPLinux C/C+ R Perl Python MySQL应用 药物治疗 抗抑郁药、精神疾病药物、丙型肝炎治疗,肝损害等副作用,为个体化医疗奠定理论基础 意义 中国每年因药物不良反应住院治疗的病人已逾250万人,其中约20万人因此死亡,个体化医疗势在必行丙型肝炎治疗 丙肝 全球1.7亿人感染的病毒性疾病,无根治办法,治疗效果因人而异 IL28B基因 TT基因型携带者痊愈率约1/4;CC基因型携带者痊愈率达4/5 09年GWAS最具价值成果 正在美国申请专利应用 动植物育种 在牛猪鸡、玉米小麦等方面,欧美农业部
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度学生保险居间业务合同
- 教育培训行业经验分享指南
- 汽车汽车租赁合同
- 三农村电商物流作业指导书
- 转租房屋租赁合同
- 矿业与安全技术作业指导书
- 房地产中介销售服务合同
- 电子电路设计与制造作业指导书
- 组织行为学作业指导书
- 双语艺术节之迎新文艺晚会活动方案
- 2025年高考英语一轮复习讲义(新高考)第2部分语法第23讲状语从句(练习)(学生版+解析)
- NB/T 11459-2023煤矿井下直流电法勘探规程
- 十七个岗位安全操作规程手册
- 爆花(2023年陕西中考语文试卷记叙文阅读题及答案)
- 自主签到培训课件-早安!幼儿园
- 小学项目化学习案例
- 2024-2030年中国大宗商品行业市场深度调研及发展趋势与投资前景研究报告
- 强化提升1解三角形中的三线问题(解析)
- 异地就医备案的个人承诺书
- 2024-2030年中国ODM服务器行业市场发展分析及前景趋势与投资研究报告
- 室内装饰拆除专项施工方案
评论
0/150
提交评论