基因微阵列分群_第1页
基因微阵列分群_第2页
基因微阵列分群_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、名稱基因微陣列分群 (clustering) 系統系統簡介生物資訊是最近非常熱門的一個研究方向。所謂的生物資訊,其最終目標,便是要完全了解人類所有基因的秘密。而由於在生物資訊之中,微陣列 (microarray) 是用來了解基因表現的重要工具。藉由針對微陣列設計分群 (clustering) 系統,可以幫助醫學界更準確地判斷哪些基因有可能會導致相同的疾病。Microarray,如圖一所示,可視為一個二維陣列,其中一個維度是基因,數量可逹數十萬;另一個維度是某種condition,數量通常只會到達幾百。陣列中所紀錄的值,即某個基因在某個condition下,所表現的程度 (以數字來表示)。而所謂

2、的clustering,是從一組毫亂無章的資料中,分出哪些資料是有類似的特徵,這些相似的資料便能組成一cluster。而在microarray中,有一種稱為pCluster的分群,其如圖二所示,目的在於找出microarray中,哪些基因在哪些condition下,會有一致性的表現變化。從圖形上來看,這些有一致性的基因,它們所呈現出來的折線變化,會很接近是平行的狀態。在本專題中,我們將針對目前已有的分群方法,實作出一套能對microarray做分群的系統,並將從知名生物資料庫如GenBank,EMBL,及NCBI等下載真實microarray來操作。圖一:A DNA microarray(a)

3、 (b)圖二:pCluster:(a) 原始資料;(b) 兩組pCluster。功能需求專題所需要的功能,就是設計一套功能完善的系統。此系統基本上是要能提供使用者一個圖形化使用者介面,藉由此介面,使用者先選擇一組microarray,系統會對此組microarray找出所有的pCluster,並可用圖型化的方式將找出來的pCluster呈現給使用者。所使用的演算法,是pClustering 1 這個演算法。學生基本要求1. 吃苦耐勞。2. 願意看原文書和英文論文。3. 具有高度的求知慾望。4. 對JAVA程式語言有基礎的認識;或是對學習此程式語言有極大的興趣,且願意投注大量的時間在短時間內學習

4、此語言 (本專題不得使用其它語言,且必須自行學習java)。5. 會勇於表達自己的想法,但也能夠接納學長們的建議。6. 本專題份量很重,請同學慎重考慮。進度表各校研究所甄試的時間慣例從每年的十二月左右開始,為了配合學生,本專題完成時間預定在十一月底,好讓學生在口試時,可以將專題的成果,提供給老師們做參考。表格 1 專題規劃時程表檢查點 (check points)時間間格 (週)內容102月18日03月30日 (06)研讀論文、編寫專題報告203月 31日06月22日 (12)實作分類方法、編寫報告306月23日09月28日 (14)完成使用者視覺化介面、專題報告49月29日12月14日 (11)專題報告完工、練習期末上台報告參考書目1 H. Wang, W. Wang, J. Yang, and P. Yu, “Clustering by Pattern Similarity in Large Data Sets,” Proc. of the 2002 AC

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论