生物医学数据挖掘 第三章 基因表达数据的获得与分析 2_第1页
生物医学数据挖掘 第三章 基因表达数据的获得与分析 2_第2页
生物医学数据挖掘 第三章 基因表达数据的获得与分析 2_第3页
生物医学数据挖掘 第三章 基因表达数据的获得与分析 2_第4页
生物医学数据挖掘 第三章 基因表达数据的获得与分析 2_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基因表达数据的获得与分析基因芯片数据的基础分析思路预处理差异表达基因筛选聚类与分类功能注释和富集分析差异表达基因筛选表达谱分析的主要目的之一就是挑出差异表达的基因。在两个或多个条件下比较识别有显著表达差异的基因,从中识别出与条件相关的特异性基因例如,识别可用于肿瘤分型的特异基因等。何谓显著表达差异?它通常是指一个基因在两个条件中表达水平的检测值在排除实验、检测等因素外,达到一定的差异,具有统计学意义,同时也具有生物学意义。 筛选差异表达基因的方法倍数法假设检验法 - t检验 -方差分析法 (ANOVA) -SAM (Significance Analysis of Microarrays) -

2、信息熵倍数法(fold change)最早应用于基因芯片数据分析的方法,也是常用方法一般0.5-2.0范围内的基因不存在明显的表达差异, 该范围之外则认为基因的表达出现明显改变.优点是计算简单直观,缺点是倍数阈值的选取是任意的, 而且没有考虑到差异表达的统计显著性,忽视了变化小的基因实验样本中的表达值对照样本中的表达值t检验 (t -test)判断基因在两种不同条件下的表达差异是否具有显著性方差分析( ANOVA)其目的是推断两组或多组资料的总体均数是否相同, 检验两类或多类样本均数的差异是否有统计学意义它将基因在样本之间的总变异分解为组间变异和组内变异两部分。通过方差分析的假设检验判断组间变

3、异是否存在,如果存在则表明基因在不同条件下的表达有差异。SAM是通过FDR值矫正多重假设检验中的假阳性率SAM 分析步骤计算统计量,是t统计量的修正扰动实验条件,计算扰动后的基因表达的相对差异统计量计算扰动后的平均相对差异统计量估计FDR(false discovery rate)SAM (significance analysis of microarrays)确定差异表达基因阈值:以最小 的正值和最大的负值作为统计阈 值,运用该阈值,统计在值中超 过该阈值的假阳性基因个数,估 计假阳性发现率FDR值。通过调整FDR值的大小得到差异 表达基因。SAM (significance analys

4、is of microarrays)信息熵运用信息熵进行差异基因挑选时,不需要用到样本的类别信息,所以运用信息熵找到的差异基因是指在所有条件下表达波动比较大的基因。 细胞周期相关的特征基因发育/衰老过程中的特征基因组织特异表达基因对表达数据进行离散化原理:对每个基因i表达值进行离散化操作,即对其进行分类,然后统计样本在每类中出现的频率,作为概率两等级离散化表达均值表达中值Y(): 1 0: 高于中值 不高于中值P(Y): 29/75 46/7575个样本其他等级三等级离散化不表达、表达、高表达N级别离散化基于表达的最大值和最小值,将该区间划分为M份对每个基因gt,熵为gi表示第i个基因, gij 表示第i个基因在第j个样本中的表达等级, Kt表示第t个等级中样本的数目,N总样本数P(gij )tA histogram based technique组织的转录组多样性The diversity of the transcriptome of each tissue can be quantified by an adaptation of Shannons entropy formulaHj will vary from zero when only one gene is transcribe

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论