计算表观遗传学中的多因素分析方法_第1页
计算表观遗传学中的多因素分析方法_第2页
计算表观遗传学中的多因素分析方法_第3页
计算表观遗传学中的多因素分析方法_第4页
计算表观遗传学中的多因素分析方法_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、医用 多因素分析 哈尔滨医科大学生物信息科学与技术学院 统计遗传学教研室 7(10):e1000356. Epigenetic epidemiology of common complex disease: prospects for prediction, prevention, and treatment.Relton CL, Davey Smith G. 表观遗传相关的数据资源表观遗传相关的数据资源 常用表观遗传数据库常用表观遗传数据库 MethDB http:/www.methdb.de MethyCancer http:/ PubMeth TCGA Data Portal http:

2、//dataportal Human histone modificationdatabase http:/ ChromatinDB /ChromatinDB/ SysPTM http:/ GEO /geo HEP/ DiseaseMethhttp:/ Epigenomics /epigenomics/ 计算表

3、观遗传学 第二节 支持向量机预测支持向量机预测DNADNA甲基化甲基化 DNADNA甲基化发生甲基化发生 支持向量机预测支持向量机预测DNADNA甲基化甲基化 支持向量机实现是通过某种事先选择的非线性 映射(核函数)将输入向量映射到一个高维特 征空间,在这个空间中构造最优分类超平面。 使用SVM进行数据集分类工作的过程首先是通 过预先选定的一些非线性映射将输入空间映射 到高维特征空间(如下图) 基于酶切获得训练数据 甲基化 区域 VS 非甲基化区域 CpG岛 VS 非CpG岛 模型应用及评估 第三节第三节 实验测定多样本实验测定多样本DNADNA甲基化甲基化 DNADNA甲基化图谱绘制甲基化图

4、谱绘制 Epigenomics 表观基因组学数据库 Epigenomics 表观基因组学数据库 /epigenomics Epigenomics简介 NIH Roadmap Epigenomics Epigenomics是NIH Roadmap Epigenomics的重要组成部分,有 利于不同表观基因组研究机构之间的信息共享,促进了当前各 方面的表观遗传研究。 Epigenomics是当前较为全面的表观基因组数据库。该数据库提 供了DNA甲基化、组蛋白修饰等各种全基因组尺度的表观基因 组数据的存储、下载、可视化等功能。 Epigenomic

5、s的使用 Epigenomics访问方式 Epigenomics数据搜索 Epigenomics数据可视化 Epigenomics数据下载 Epigenomics数据比较分析 Epigenomics访问方式 1、通过NCBI首页 2、通过地址直接访问/epigenomics Epigenomics数据搜索 Browse Experiments(搜索实验) Browse Samples(搜索样本) Advanced Search(高级搜索) Browse Experiments(搜索实验 ) 当前数据库所有实验数 实验关键词(如Cancer等)

6、 物种 生物学来源特征类型 符合条件的实验数目 符合条 件的实 验列表 实验 ID 特征 类型 分析 类型 物种细胞 类型 组织 类型 细胞 系 细胞 群 分化 阶段 Browse Samples(搜索样本) 当前数据库所有实验数 实验关键词(如Cancer等) 物种 生物学来源特征类型 符合条件的实验数目 符合条 件的样 本列表 样本 ID 物种细胞 类型 组织 类型 细胞 系 细胞 群 分化 阶段 Advanced Search(高级搜索) Epigenomics数据可视化 视图工具 Epigenomics数据下载 Epigenomics数据比较分析 输入要比较的数据ID 也可参考例子 E

7、pigenomics的帮助文档 DNADNA甲基化数据的检测技术甲基化数据的检测技术 引自Peter W. Laird(2010) 全基因组的甲基化检测全基因组的甲基化检测 第四节第四节 基于信息熵的甲基化数据分析基于信息熵的甲基化数据分析 组织间的差异甲基化组织间的差异甲基化 癌症差异甲基化癌症差异甲基化 非肿瘤疾病的甲基化差异非肿瘤疾病的甲基化差异 引自Manel Esteller(2011) 表观遗传标记表观遗传标记 DNADNA甲基化的改变甲基化的改变 DNA甲基化 差异甲基化区域 常用的方法常用的方法 两样本两样本 (T(T检验检验 、Z Z值、卡方检验值、卡方检验) ) 多样本统计

8、方法多样本统计方法 (ANOVA (ANOVA 、Kruskall-Wallis)Kruskall-Wallis) 多样本非统计方法多样本非统计方法 (Fans(Fans,Rakyans)Rakyans) 新方法新方法-香农信息熵香农信息熵 香农信息熵是一种度量差异和不确定性的定量化指标。香农信息熵是一种度量差异和不确定性的定量化指标。 开发定量筛选差异甲基化区域的方法开发定量筛选差异甲基化区域的方法(QDMR)(QDMR)。 差异甲基化特征筛选方法差异甲基化特征筛选方法 方法 优化信息熵定量甲基化差异 方法 QDMR软件 QDMR的安装与使用 QDMR的两种安装/调用方式 QDMR的使用说明

9、 QDMR的两种安装/调用方式 本地版QDMR 在线版QDMR http:/ QDMR的使用说明 导入甲基化数据 定量甲基化差异 筛选差异甲基化区域 定量差异甲基化区域的特异性 导出分析结果 使用流程使用流程 导入甲基化数据 目前QDMR只接 受txt文件 浏览本地甲基 化数据文件 例子甲基化数据 数据中最大的 甲基化值 物种信息 区域列信息 样本开始的列 甲基化数据预览 定量甲基化差异 熵表示甲基化差异的大小, 熵越小表示各样本间的甲 基化差异越大 通过点击上面的某一行, 来查看相应区域在各样本 中的甲基化值 识别差异甲基化区域 根据生物学研究的要求选 择合适的筛选差异甲基化 区域的阈值 软

10、件自动筛选差异甲 基化区域和非差异甲 基化区域 差异甲基化区域 非差异甲基化区域 差异甲基化区域的样本特异性 利用绝对特异性CS表示差 异甲基化区域在各样本中 的甲基化特异性, 大于0表示特异高甲基化, 小于0表示特异低甲基化, 等于0表示无特异性 结果统计及差异甲基化区域分布 QDMR筛选 结果统计 差异甲基化区域在 相应物种各染色体 上的分布图 可以右击设 置保存该图 导出结果及后继分析 QDMR的帮助文档 简洁的软件用户指南 详尽的在线使用手册 http:/ QDMR的应用举例 应用QDMR筛选并分析人类16个组织间的差异甲基化 区域; DNA甲基化数据: MeDIP测定的人类16个组织

11、中全基因组的DNA甲基化 数据; Data 利用QDMR筛选组织差异甲基化区域 安装使用QDMR 本地版QDMR 在线版QDMR http:/ 结果1:定量的组织间甲基化差异 应用QDMR定量人类组织 间甲基化差异; 熵越小的区域拥有更大的 甲基化差异 结果1:定量的组织间甲基化差异 各基因组区域呈现不同的组织间甲基化差异; CpG岛拥有较小的甲基化差异; 低CpG密度启动子呈现较大的甲基化差异。 结果1:定量的组织间甲基化差异 CpG密度呈双峰分布; 甲基化差异依赖于CpG密度。 结果2:人类组织间差异甲基化 区域 应用QDMR共筛选人类16个组织间的差异甲基化区域 10651个;非差异甲基

12、化区域; 且这些差异甲基化区域显著富集组织分化相关的功能 结果3:差异甲基化区域的组织特异 性 各组织中均有特异甲基化的T-DMR;且分布不均匀; 特异低甲基化T-DMR和特异高甲基化T-DMR在各组织间 的分布也不尽相同。 结果3:差异甲基化区域的组织特异 性 CD4+T细胞特异低甲基化T-DMR与激活型组蛋白修饰相关; CD4+T细胞特异高甲基化T-DMR与抑制性组蛋白修饰相关。 第五节第五节 甲基化数据实例分析甲基化数据实例分析 实例分析实例分析 前列腺癌前列腺癌DNADNA甲基化数据的分析甲基化数据的分析 原始数据格式原始数据格式 MMethylated, UUnmethylated,

13、 值:01 提供给用户的数据提供给用户的数据 Hierarchical clustering of prostate tissues by DNA methylation 181 prostate tissues and 26,333 CpGs, by sample and by CpG. (Red branches) Tumor samples; (Blue branches) benign adjacent samples; high DNA methylation (red pixels); low DNA methylation (green pixels). Differentially methylated CpGs of prostate tumors. 5912 CpG sites hypermethylated in tumors compared to benign a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论