基因芯片技术利用基因芯片进行差异表达基因分析解析_第1页
基因芯片技术利用基因芯片进行差异表达基因分析解析_第2页
基因芯片技术利用基因芯片进行差异表达基因分析解析_第3页
基因芯片技术利用基因芯片进行差异表达基因分析解析_第4页
基因芯片技术利用基因芯片进行差异表达基因分析解析_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1基因芯片技术利用基因芯片进行差异表基因芯片技术利用基因芯片进行差异表达基因分析解析达基因分析解析第1页/共70页第第8章章 利用基因芯片进行差异表达基因分析利用基因芯片进行差异表达基因分析第1页/共70页第2页/共70页第2页/共70页第3页/共70页Aerobic 需氧Anaerobic不需氧第3页/共70页第4页/共70页第4页/共70页第5页/共70页第5页/共70页第6页/共70页第6页/共70页第7页/共70页第7页/共70页第8页/共70页第8页/共70页第9页/共70页第9页/共70页第10页/共70页第10页/共70页第11页/共70页第11页/共70页第12页/共70

2、页第12页/共70页第13页/共70页Affymetrix,illumina芯片由于有探针重复,可以利用统计方法芯片由于有探针重复,可以利用统计方法计算出一个统计性的计算出一个统计性的P值或者值或者score值,筛选差异表达基因。值,筛选差异表达基因。第13页/共70页第14页/共70页第14页/共70页第15页/共70页232.7232.7198.2198.2137.7137.784.384.3218.6218.6181.5181.5216.7216.78787第15页/共70页第16页/共70页第16页/共70页第17页/共70页第17页/共70页第18页/共70页第18页/共70页第19

3、页/共70页在单通道在单通道Oligo芯片中,尤其芯片中,尤其是是affymetrix芯芯片数据分析中片数据分析中用得较多用得较多第19页/共70页第20页/共70页第20页/共70页第21页/共70页双通道双通道cDNA芯片数据分析用得较多芯片数据分析用得较多第21页/共70页第22页/共70页第22页/共70页第23页/共70页第23页/共70页第24页/共70页第24页/共70页第25页/共70页第25页/共70页第26页/共70页第26页/共70页第27页/共70页聚类:聚类:发现一些未知的细胞状态、疾病的亚型以及一些能识别这些样本状态的基因,或者说发现一类功能相似的基因或者一类有共同

4、调控机制的基因。归类(分类)归类(分类):基于已有知识,并有改进现有知识的潜力,通过训练分类器来辨识与已知细胞状态或疾病亚型相类似的样本,或者是与已知的共调控基因表达相似的基因。 第27页/共70页第28页/共70页第28页/共70页第29页/共70页第29页/共70页第30页/共70页第30页/共70页第31页/共70页得到类似于进化分析的系统树图,具有相似表达谱的基因彼此得到类似于进化分析的系统树图,具有相似表达谱的基因彼此临近,他们可能具有相似的功能。临近,他们可能具有相似的功能。其重要思想是:先将其重要思想是:先将n个样本看成个样本看成n类,计算类间的距离,再将类,计算类间的距离,再将

5、相似性最高的两类合并成为一个新类,得到相似性最高的两类合并成为一个新类,得到n-1类,再重新计算类,再重新计算关系矩阵,不断重复这个过程直至所有的基因融合成为一个关系矩阵,不断重复这个过程直至所有的基因融合成为一个第31页/共70页第32页/共70页基因表达数据矩阵基因表达数据矩阵 (Affymetrix GeneChip (Affymetrix GeneChip oligonucleotide arrays)oligonucleotide arrays)Gene expression table X:log sam/ref intensitiesX0:gene is overexpresse

6、dX0:gene is underexpressed 第32页/共70页第33页/共70页基因表达数据矩阵基因表达数据矩阵 (glass slides)Gene expression table X:log red/green intensitiesX0:gene is overexpressedX0:gene is underexpressed 第33页/共70页第34页/共70页第34页/共70页第35页/共70页对任意一个基因来说,样本值是特征值,数据的维数是对任意一个基因来说,样本值是特征值,数据的维数是M对任意一个样本来说,基因值是特征值,数据的维数是对任意一个样本来说,基因值是特征

7、值,数据的维数是N数据矩阵数据矩阵, ,基因数远大于样品数。基因数远大于样品数。聚类时,考查基因间的相似性,从数学上讲就是看对应的聚类时,考查基因间的相似性,从数学上讲就是看对应的M M维维数据之间的相似性。数据之间的相似性。第35页/共70页第36页/共70页第36页/共70页第37页/共70页第37页/共70页第38页/共70页第38页/共70页第39页/共70页第39页/共70页第40页/共70页在特定条件下把所有的重复值合并成一个数值可能更为方便,在特定条件下把所有的重复值合并成一个数值可能更为方便,而这一个值是给定基因而这一个值是给定基因/条件的代表。条件的代表。通常的合并:计算这些

8、重复值的集中趋势指标,如均数、中位通常的合并:计算这些重复值的集中趋势指标,如均数、中位数或众数。但是,使用一个集中趋势指标代替一组数值意味着数或众数。但是,使用一个集中趋势指标代替一组数值意味着信息的丢失,因此数据的合并应谨慎。信息的丢失,因此数据的合并应谨慎。 去除奇异值:可以通过计算原始数据的均数和标准差,去除位去除奇异值:可以通过计算原始数据的均数和标准差,去除位于给定区间外的数据(如均数加减于给定区间外的数据(如均数加减3个标准差外的数据)。剩个标准差外的数据)。剩余的数据重新计算均数和标准差,并消除给定区间外的数据。余的数据重新计算均数和标准差,并消除给定区间外的数据。第40页/共

9、70页第41页/共70页第41页/共70页第42页/共70页第42页/共70页第43页/共70页第43页/共70页第44页/共70页第44页/共70页第45页/共70页K最近邻法(最近邻法(K-nearest neighborhood method):):假定某个基因在某个指标上含有缺失值,计算含缺失值假定某个基因在某个指标上含有缺失值,计算含缺失值的基因与在该指标上无缺失的基因间的相似性指标。的基因与在该指标上无缺失的基因间的相似性指标。与该基因相似性最大的与该基因相似性最大的K个基因称为该基因的个基因称为该基因的K个最近个最近邻,这邻,这K个基因在该指标上的数据就是估计该基因缺失个基因在该

10、指标上的数据就是估计该基因缺失数据的基础,估计值可以是这数据的基础,估计值可以是这K个基因在该指标上的均个基因在该指标上的均数,也可以是这数,也可以是这K个基因的加权均数。个基因的加权均数。在加权均数中,权重为上面计算的基因间的相似性。在加权均数中,权重为上面计算的基因间的相似性。K值的确定具有一定的经验性,但不宜太大和太小。值的确定具有一定的经验性,但不宜太大和太小。 第45页/共70页第46页/共70页第46页/共70页第47页/共70页第47页/共70页第48页/共70页针对特别目的针对特别目的的基因筛选,的基因筛选,如筛选不同类如筛选不同类之间差异表达之间差异表达基因,常用假基因,常用

11、假设检验的方法设检验的方法,比如,比如t检验、检验、F检验等。检验等。第48页/共70页第49页/共70页新算法新算法新角度新角度合并多种方法合并多种方法第49页/共70页第50页/共70页 不改变整体数据矩阵的数据结构,去除数据的冗不改变整体数据矩阵的数据结构,去除数据的冗余性,常用主成分分析法。余性,常用主成分分析法。第50页/共70页第51页/共70页降维:指将样降维:指将样本从输入空间本从输入空间通过线性或非通过线性或非线性映射到一线性映射到一个低维空间。个低维空间。降维:将高维数据转换为易于处理的低维数据,减少了无用信降维:将高维数据转换为易于处理的低维数据,减少了无用信息和冗余信息

12、,减少了后续的计算量。当降至三维以下时,可息和冗余信息,减少了后续的计算量。当降至三维以下时,可以使用可视化技术,从而发挥人在低维空间感知上的优点,发以使用可视化技术,从而发挥人在低维空间感知上的优点,发现数据集的空间分布、聚类性质等结构特征现数据集的空间分布、聚类性质等结构特征。第51页/共70页第52页/共70页第52页/共70页第53页/共70页第53页/共70页第54页/共70页第54页/共70页第55页/共70页第55页/共70页第56页/共70页第56页/共70页第57页/共70页第57页/共70页第58页/共70页第58页/共70页第59页/共70页第59页/共70页第60页/共70页第60页/共70页第61页/共70页第61页/共70页第62页/共70页第62页/共70页第63页/共70页Affymetrix,illumina芯片由于有探针重复,可以利用统计方法芯片

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论