关联技术挖掘基因相互作用关系的研究_第1页
关联技术挖掘基因相互作用关系的研究_第2页
关联技术挖掘基因相互作用关系的研究_第3页
关联技术挖掘基因相互作用关系的研究_第4页
关联技术挖掘基因相互作用关系的研究_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、分类号UDC 注1密级学位论文关联技术挖掘基因相互作用关系的研究(题名和副题名)金富平(作者姓名)指导教师姓名饶妮妮电子科技大学教授成博导都(职务、职称、学位、单位名称及地址)申请专业学位级别硕士专业名称生物医学工程论文提交日期2010.04论文答辩日期2010.05学位授予单位和日期答辩委员会主席评阅人电子科技大学2010 年注 1:注明国际十进分类法 UDC的类号。月日独 创 性 声 明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构

2、的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。签名:日期:年月日关于论文使用授权的说明本学位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)签名:导师签名:日期:年月日摘 要摘要一次微阵列实验可同时观测成千上万基因的表达值,得到含有丰富生物信息的高维DNA微阵列基因表达数据。通过分析这些

3、高通量数据中基因表达数据的关联性,有助于研究未知基因的功能分类,推测基因间的相互作用关系,寻找共表达的基因类,预测基因的调控模式,根据基因间共调控或共表达关系构建基因相互作用关系网络。论文以基因芯片表达谱数据为数据源,采用统计学中的相关性理论,研究相关基因的相互作用关系,主要开展了以下工作:1. 对照转录因子对基因的调控关系表,筛选出受转录因子调控的大肠杆菌操纵子,对筛选出的操纵子基因表达数据分别作皮尔逊相关性度量和斯皮尔曼秩相关性度量。研究结果表明,86.33%的操纵子内基因的皮尔逊相关系数在0.5 - 1之间分布,在p 0.01的水平上呈显著性相关;84.53%的操纵子内基因的斯皮尔曼秩相

4、关系数分布在0.5 - 1之间,在p 0.01的水平上呈显著性相关。这些结果在高通量数据统计方面为操纵子预测提供了基因组信息,对操纵子的预测具有重要意义。2. 以非负矩阵因子分解算法分离的差异表达基因为研究对象,分别对在胃癌组织中有显著性上调的基因和有显著性下调的基因做相关性度量,计算基因间的关联矩阵,设立相应的阈值,将相关系数大于阈值的基因提取出来,初步构建模糊胃癌基因相互作用关系网络,并结合相关文献,对于网络中度较大的节点基因的功能及其作用机理做了详细解释说明,用网络方法直观观测胃癌发生基因的路径(pathway),为从基因水平上预防和治疗胃癌提供参考依据。关键词:基因表达,操纵子,相关性

5、度量,基因相互作用关系网络,胃癌IABSTRACTABSTRACTA microarray experiment can mensure tens of thousands of expression data of genesequence and achieve high-dimensional DNA microarray gene expressing datasetswhich are rich in bioinformatics. By analyzing the conjunction between gene expressiondata in these high-throu

6、ghput data, it will help find unknown gene functionclassification, speculate the interaction between genes, looking for co-expression ofgene type and predict gene regulation patterns. According to genetic inter - regulation orco-expression of gene regulatory to build relationship network.DNA microar

7、ray expression dataset are reseached in this paper. using the relevantstatistical theory to study the regulation of relations among the related genes. The mainwork is done as follows:1. Compare the relationship between the transcription factors and genes; it filtersout of operon gene expression data

8、 which uses to measure Pearson correlation andSpearman rank correlation. 86.33 % of operonic gene pairs Pearson correlationcoefficient distributes in the 0.5-1, on the level of the p0.01 which presentingsignificantly related. 84.53% of operonic gene pairs Spearman rank correlationcoefficient distrib

9、utes in the 0.5-1, on the level of the p 0;反之,若存在一个随机变量的较大值(或较小值)总与另一个随机变量的较小值(或较大值)同时出现的趋势,则认为这两个随机变量是负相关的,12,Y ,Y Yn ) ;X 的样本均值为:X = X i ;Y 的样本均值为:Y = Yi ; ( X i iY - Y ) ( X- X ) (Yi - Y )第二章 相关技术理论这种情况下相关系数 r 0。相关系数能定性的反应变量间的相关性。独立性是随机变量在相关性概念中的特例52,对于两个随机变量,不相关并不表示这两个随机变量独立,也不表示这两个随机变量之间没有任何关系,也许这两个变量间存在着非常密切的关系,例如 X N (0,1) ,而 Y = X 2 ,Y 与 X 存在函数关系,但这两个变量间的线性相关系数是0,所以它们是不相关的。另一方面,即便 | r |接近1, X 与 Y 可能并不是线性关系。例如 X U(8,10)(表示 X 服从8-10之间的均匀分布), Y = X 2 ,显然, X 与 Y 之间不是线性关系,但是它们之间的Pearson相关系数 r =0.999。在随机变量的线性变换下,线性相关系数的值 r 是恒定的,但如果不是线性变换,在随机

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论