基因芯片分析的理论与方法课件_第1页
基因芯片分析的理论与方法课件_第2页
基因芯片分析的理论与方法课件_第3页
基因芯片分析的理论与方法课件_第4页
基因芯片分析的理论与方法课件_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基因芯片分析的理论与方法基因芯片概论基因芯片分析的概念基因芯片分析的优点快速高通量(104-106)自动化使用的试剂少低本钱基因芯片分析的应用范围AcademicresearchofgeneticdiseasesCancerPrenatalgenetics〔产前遗传学研究〕GeneralgeneticdiseasesInfectiousdiseasesDrugdiscoveryAnimalfarming/veterinaryIndustrial(fermentation)Environmental开展的方向:从多角度研究揭示生命现象Stages:developmental,transformation,timeftertreatment,etc.Treatments(stimuli,drugs,nutrients,etc.)Physiologicalstates(stressed,fasting,etc.)Tissuedistribution(position,3D)基因芯片的开展是推动系统生物学开展的动力利用基因芯片研究生命现象的测略Factorsinvolved=>ComponentsOrderofevents=>PathwaysInteractions=>Circuit

KEGGGO基因芯片的分类根据用途分类

geneexpressionpatternBiologicalSampleFunctional

Information基因芯片的分类Oligonucleotidearray–Synthesizedonachip〔Affymetrix〕–Spotonasolidmatrix〔Compugen〕cDNAarray〔Incyte〕根据探针类型分类

expressiongenomicanalysiscDNA-Chip GenomicChip<2,000n>50,000n基因芯片分析试验方法基因芯片分析的主要步骤cDNA基因芯片分析的主要步骤cDNA芯片分析的主要步骤SpotbyArrayspottercDNA芯片分析的主要步骤HybridizingbyAutomatichybridizationprocessorcDNA芯片分析的主要步骤LaserscannerOligonucleotidearray〔GeneChip〕LLLLLLLLcDNAAAAA总RNA的制备反转录体外转录生物素标记的cRNA片段化处理带标记的cRNA片断35-200bases0.5-2ug/ul起始用量5-10ug(IVT)操作流程〔以真核生物为例〕LLLLL标记的cRNA片断杂交混合液的制备EukaryoticHyb.ControlControlOligoB2杂交(16hour)数据分析扫描洗脱染色Oligonucleotidearray的特点1个平方厘米的面积至少可排列四十多万个探针合成区〔“点〞〕基因2基因1cDNA基因2cDNA用于cDNA芯片的探针Oligoprobe基因1多个检测结果可以参考Oligonucleotidearray的优越性cDNA芯片Affy芯片优势芯片分析数据的标准化Quantitationdata-qualityassessments背景处理:图像上各点的吸光度值包含了样品和背景信号,在提取数据前必须将背景扣除杂交点质量:由于点样或膜变形等原因目前较多的软件对杂交点的识别定位仍需要人为的调整数据的标准化:其目的是防止基因芯片实验中因系统差异造成芯片间数据比较的困难。最常用的是“看家基因〞法,它预先选择一组表达水平不变的看家基因,计算出这组基因平均ratio值为1时的标准化系数,然后将其应用于全部的数据以到达标准化的目的ScatterplotsforaCy5-liver/Cy3-livercontrolhubridizationACy5-ovariantumor/Cy3-normalovaryhubridizationThevalueofCy3andCy5hydridizationsignalsfromeachclonewereplotteddirectlyontotheplot〔卵巢癌〕DataAnalysis-RevealtheDifference基因芯片数据分析和信息挖掘方法一.聚类分析聚类分析聚类分析是模式识别中一种非常有吸引力的方法,特别适用于模式分类数不知道的情况。从机器学习的角度来看,有两种根本的聚类分析:有教师聚类无教师聚类基因表达数据聚类分析一般包括以下几个步骤:〔1〕确定基因表达的数据〔2〕计算相似性矩阵,各个矩阵元素代表两个基因的表达是否相似〔3〕选择算法进行聚类分析〔4〕显示分析结果。对数据进行聚类分析之前,必须将包含在基因表达矩阵中的数据进行相似程度分析,并且对分析结果进行量化。通常情况下,相似往往被赋于一个较大的量化的值,而不相似那么由一个较小的量化的值来表示。在实际计算中,往往以距离代替相似的概念,相似性度量被转化为两个基因表达模式之间的距离。距离越小,表达模式越相近,反之,那么表达模式差异大。两个表达模式之间的关系(a)相似(b)变化趋势一致(c)两个基因的调控结果不一样或甚至相反聚类分析的目的可诱导基因是共表达的许多构成性表达的基因不受调节根据表达相似形排列基因功能相似的基因被聚为不同的类可以揭示细胞的生理状态可以帮助研究未知基因的功能聚类结果显示:

Cluster,Clusterviewer二.基因调控网络分析2.1基本理论定义一个基因网络(pathway)由一组生物分子〔如基因、蛋白质〕以及它们之间的相互作用构成,这些生物分子共同完成一些特定的细胞功能任务在实际分析过程中,往往以图这种数据结构表示基因网络,图中的节点代表基因或者蛋白质,而节点之间的连线代表基因、蛋白质之间的相互作用。基因网络描述了特定细胞或组织中的功能路径,如代谢、基因调控,信号传导等。原理基因表达实际上是细胞、组织、器官受遗传和环境影响的结果。一个基因的转录和表达由细胞的生化状态所决定,在一个基因的转录过程中,一组转录因子作用于该基因的启动子区域,控制该基因转录,而这些转录因子本身又是其它基因的产物。当一个基因通过转录、翻译形成功能基因产物后,它将改变细胞的生化状态,从而直接或间接地影响其它基因的表达,甚至影响自身的表达。多个基因的表达不断变化,使得细胞的生化状态不断地变化。一个基因的表达受其它基因的影响,而这个基因又会影响其它基因的表达,这种相互影响、相互制约关系构成了复杂的基因表达调控网络。基因表达数据之中隐含基因之间的相互作用关系,因而可以通过分析基因表达数据,构建基因调控网络应用BetterunderstandthephysiologyoftheorganismPredicttheeffectofadrug–PredicttheweaknessesorsideeffectsofadrugPredictgoodorbaddrugcombinationsUnderstanddiseaseprocessesGenefunctionassignmentMakea“perfect〞simulationofcellularfunctiontouseasanexperimentalmodelManytools“feed〞intothisunderstandingincludingmicroarrays2.2pathway数据库介绍Pathway数据库GOKEGGGENMAPPBIACARTAGeneNet细胞因子网络数据库自由基信号数据库关于GOGO(geneontology)是基因本体论联合会(GeneOntologyConsortium)所建立的数据库,旨在建立一个适用于各种物种的,对基因和蛋白功能进行限定和描述的,并随着研究的不断深入而更新的语言词汇标准。GO是多种生物学本体论语言中的一种,提供了三层结构的系统定义方式,用于描述基因产物的功能。GO可以被用来在小鼠基因组中查询和信号转导相关的基因产物GO开展了具有三级结构的标准语言〔ontologies〕。根据基因产物的相关分子功能,生物学途径,细胞学组件而给予定义,无物种相关性。关于KEGGKEGG(KyotoEncyclopediaofGenesandGenomes)〔京都大学基因和基因组百科全书数据库〕KEGG是系统分析基因功能的数据库,将基因组的信息与基因功能联系起来,旨在揭示生命现象的遗传与化学蓝图数据库KEGGPATHWAYDatabaseKEGGGENESDatabaseKEGGLIGANDDatabase用途搜寻pathway,产生可能的反响路径搜寻类似的基因序列搜寻类似的基因组序列搜寻类似的复合物结构,类似的多糖结构及类似的反响类别通路信息基因组信息化学信息KEGG中的通路分为五大类:

1.新陈代谢通路

2.遗传信息处理通路

3.环境信息处理通路

4.细胞内通路

5.人类病症相关通路PATHWAY提供所选定通路的参考资料、涉及的反响和在其他生物中的通路情况。由GIF等平板文件类型图示,方框显示为涉及的酶EC名称,圆滑框为反响类型,以实线和箭头连接反响物和方向,虚线指向预测的反响类型。关于GenMapp关于BioCartaBioCarta:“Carta〞中文意思是〞地图〞,BioCarta〞即用图形来描述生物相关知识,形成生物学家所熟悉的生化调控通路(biochemicalpathways)。BioCarta公司为客户免费提供通路绘制软件,让他们根据自己的研究领域发表通路,建成数据库,通路中的蛋白都是按照HUGO的标准建立的.BioCarta已收集各物种共大約120,000基因及136個调控通路,数据库载不断增加,其信号传导通路(signaltransductionpathways)是当前最全的.GeneNet真核生物生理过程的调控网络(GeneNet)GeneNet展示了协调方式下基因的整体功能,良好的调控功能和对外界刺激的反响。该基因网具有以下根本功能:(a)描述执行特定生物功能时所涉及到的整体基因交互作用(b)描述基因的蛋白质编码(c)描述基因对外界刺激的传感途径(d)通过一组反响自动地稳定网络参数或者使网络转换到新的功能状态(e)利用外部信号、激素和代谢产物作为生理学参数激发基因网纠正其作用该基因网描述了四类实体:(a)细胞(组织,器官)(b)蛋白质(c)基因(d)物质该基因网还描述了实体间两种关系:(a)反响〔reaction〕,即通过交互作用产生新的实体或过程(b)调控〔regulatory〕事件,特定反响对实体的作用。2.3功能富集分析功能富集分析定义功能富集分析(FunctionalEnrichmentAnalysis)

又称功能聚类分析,借助于各种生物学信息数据库〔如GO,KEGG,GENMAPP,BIACARTA,TRANSFAC,OMIM〕和分析工具〔如MAPPFinder,ArrayXPath〕进行统

计分析,挖掘同差异表达或共表达这组感兴趣基因具有显著差异的功能类别。功能富集分析的统计原理是用超几何分布型来检验一组基因〔共表达或差异表达〕中某个功能类的显著性,并结合多重假设检验判断思想选择同这组基因显著相关功能类别

MAPPFinderMAPPFinderisatoolthatcreatesaglobalgene-expressionprofileacrossallareasofbiologybyintegratingtheannotationsoftheGeneOntology(GO)ProjectwiththefreesoftwarepackageGenMAPP://GenMAPP.org.可以整合GO定义,产生整体的基因表达谱.输出可以搜索的浏览器,帮助用户快速识别代表性的差异表达基因在GO的定义。工作方式Z值得计算GOminerGominer:最初Version在算法上虽亚于GenMAPP,在再建立可视关系上(tree-likestructure和‘directedacyclicgraph)有其独特之处.今年对OriginalVersion进行较大改进,不仅可以富集significantGOcategories,还可以同时对多套芯片实验数据批量分析,控制假发现率FDR,还整合转录因子结合位点信息.综合而言,尤其适合TIME-COURSE功能富集分析需要建立当地Mysql数据库,建立JDB数据源PathwayExplorerPathwayExplorer:providescomprehensiveandeasilyaccessiblerepresentationsofexpressionprofilesontomajorregulatory,metabolicandcellularpathways.TheintegratedpathwayresourcesincludeKEGG,BioCartaandGenMAPP.LocusLinkwasagainusedasrootidentifier.TheLocusLinksarelinkedwiththeuser-definedgeneidentifiergroups(UniGene,GeneOntology,GenBankand/orRefSeq),whichareusedthentoalignthemappedgeneIDs.ArrayXPathaweb-basedserviceformappingandvisualizingmicroarraygene-expressiondataforintegratedbiologicalpathwayresourcesWhenoneinputsgene-expressionclusters,ArrayXPathproducesalistofthebestmatchingpathwaysforeachclusterappliedFisher'sexacttestandthefalsediscoveryrate(FDR)toevaluatethestatisticalsignificanceoftheassociationbetweenaclusterandapathwaywhilec

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论