衡阳-稿-系统生物学在中医证候本质研究中应用_第1页
衡阳-稿-系统生物学在中医证候本质研究中应用_第2页
衡阳-稿-系统生物学在中医证候本质研究中应用_第3页
衡阳-稿-系统生物学在中医证候本质研究中应用_第4页
衡阳-稿-系统生物学在中医证候本质研究中应用_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于系统生物学的中医证候

本质研究从一篇博文谈起如何成为顶级的生物信息学家?看你的研究。所以Shirley将生物信息学研究(注意,不是生物信息学者本人)的水平划分成五个层次。0级(Level0):为建模、而建模(modelingformodeling’ssake)。简称:渣级。

有人问曰:现在数据这么多,能建模的东西一大把,那我们该干点啥呢?

Shirley就问:你想解决啥问题?

答:建模的问题。原文解释,这个回答是OK的,如果科学家仅仅将自己当成数学家、统计学家、计算机科学家、物理学家,或者像我这样用嘴巴研究水稻的吃货,因为在这些学者各自的领域里,确实有许多好的理论建模问题。但如果这些学者是认真对待生物信息学的研究,这个回答不OK。许多0级生物信息学家们从来不读或者不发表生物学期刊上的论文,也不参加生物学的会议,因此这个级别属于“未入门级”。根据人以类聚,物以群分的原则,0级生物信息学家们通常只阅读自己或者其他0级生物信息学家的论文,并且,并且引用也是自引或者被同级别的学者引用。因此这类研究就是浪费资源。1级(Level1):给数据、能分析。简称:菜鸟级。

这类研究一般是分析自己或者合作者实验室里未发表的数据,并试图获得新的生物学发现。

评价1级科研的功底和水平要看数据有多复杂,是否需要生信人员写一些程序和算法(而不是只用他人的工具),生信分析在整个研究中的有重要性(最重要的假设发现是不是由生物信息分析出来的,文章中生信图表的个数),实验与计算的结合程度(实验与计算环环相扣,而不是高通量实验数据获得完跟个生信分析就拉倒),以及研究中生物学的发现是不是真的有意思,等等。

原文解释:1级虽然是“入门级”,但非常非常重要,所有生信专业研究生的必经之路,非生信领域的学者或学生,能达到1级中已可算是高手,进阶到1级上那就是凤毛麟角了。2级(Level2):想新招、玩数据。简称:肉鸟级。具有2级水准的生信研究有:1)设计方法解决生物医学相关大数据分析中普适、定量的问题。比如咱生信课本里经典的用于双序列比对的Smith-Waterman算法等等;2)设计算法来分析新的高通量技术所获得的数据,例如华大基因设计的用于二代测序短读段(read)映射到基因组上的SOAP系列工具,这就是典型的2级工作;3)从各种公共数据中通过整合建立数据库或数据资源。

这个太多了,生信领域各种专业、精心注释的数据库,都属于2级的研究。

2级比1级高的地方,在于1级只能帮助一个实验室或者固定的、极有限的合作者,而2级的工作则可以帮助数百甚至数千的生物学家。2级的工作不必须发表在顶级的期刊上,时间会证明一切,比如分子进化领域的经典软件MEGA,每年几千的引用跟玩儿一样。评价2级的生信研究工作不能数影响因子,但做的好却比较容易被领域认可(例如,华大基因发表NCS对咱搞生信的来说未必认可,但人家的SOAP系列做的肯定是专业水准的)。3级(Level3):玩数据、作发现。简称:顶级。

3级的生信研究一般是整合公共的高通量数据,利用相当精致的方法来做出生物学发现。因此这样的工作一般是从数据开始,实验验证结束。这就需要生物信息学家具有非常扎实的生物学知识,并且能够自己提出有意思的生物学问题。生物信息学家可以领导一个生物学的项目,并且实验学的合作者能够相信预测的正确性以及意义,并乐意开展实验验证。这个级别的研究一般都需要实验验证,不然顶级的期刊不收。

对这类工作的评价,主要是看生物学的问题是否有意思,数据整合和分析是否有足够的技巧和合理性,并且也可以根据杂志发表期刊的档次(影响因子)来判断。例如我在《环形RNA分子:论开挂在生命科学研究中的重要性》提到的工作,这是典型的3级研究。从2级进阶到3级很困难。4级(Level4):玩科学、讲政治。简称:神级。在这个级别,生物信息学家要在巨型项目产生的海量数据的整合和模拟中发挥关键作用。这些工作一般都发表在顶级的期刊,并且引用极好,在研究过程中要注意协调方方面面。尽管有时生信对于这些论文的发表是重要的,但往往数据本身可能比方法更重要。

例如期刊判断论文要依据其数据量的大小以及潜在的引用,而不是生信。此外,这类工作更多的是反映第一作者老板们的领导力以及在领域里的地位,而不是第一作者的技术能力和创造力。所以4级论文的第一作者们往往并不会得到足够的认可。因此,这些工作中的一作在独立研究之后,往往是必须建立科学的声誉,并且与之前4级工作无关。学者参加一些4级的生信研究无可厚非,因为这些项目的成员一般在各自领域都是顶级学者。但如果学者只开展或者只发表4级的工作,那就表明该学者在政治方面的关注已经超过科学了。典型的X级生信研究工作如艾瑞克•兰德(EricLander)领衔的人类基因组草图的公布《Initialsequencingandanalysisofthehumangenome》。艾瑞克是第一作者也是共同通讯作者,因为这篇论文主要是他写的,所以数据也自然主要是他分析的。这篇论文影响深远,最重要的就是基本确定了基因组学这类超级项目的研究范式以及论文的书写格式,例如这类论文一般不带后续的实验验证,所以也是有争议。这也就是为什么国内老是讲华大在灌水的原因,第一,华大显然是在灌水;第二,这个灌水模式是老外发明的;第三,那你很容易就能明白,其实老外灌的更狠;第四,你老外自己定的游戏规则,你还玩不过华大,那你得懂“愿赌服输”这个道理。系统生物学

SystemsBiology定义(Definition)系统生物学从系统水平来理解生物学系统,利用一系列的原理与方法学来研究分子行为与系统特性与功能的关系,通过计算生物学来定量阐明和预测生物的功能、表型和行为。

Systemsbiologyisadisciplinetostudythespatial-temporalinteractionsofcomponentsindifferentlevelsofbiologicalsystems,seekingtofindthelawsintheorganizationprinciples,dynamicbehaviorsandemergentpropertiesofsuchbiologicalsystems.WhatisSystemsBiology?Systemsbiologyisanemergentfieldthataimsatsystem-levelunderstandingofbiologicalsystems.HiroakiKitano(北野宏明)Ph.DProjectDirector.SonyComputerScienceLaboratoriesScience,295,

1662-1664(2002).Tounderstandbiologyatthesystemlevel,wemustexaminethestructureanddynamicsofcellularandorganismalfunction,ratherthanthecharacteristicsofisolatedpartsofacellororganism.WhatisSystemsBiology?LeroyHood(MDPhD)isrecognizedasoneoftheworld’sleadingscientistsinmolecularbiotechnologyandgenomics.In2000,Hoodco-founded,andiscurrentlyPresidentof,theInstituteforSystemsBiologyinSeattlewhichpioneerssystemsapproachestobiologyandmedicine.Systemsbiologyisascientificdisciplinethatendeavorstoquantifyallofthemolecularelementsofabiologicalsystemtoassesstheirinteractionsandtointegratethatinformationintographicalnetworkmodelsthatserveaspredictivehypothesestoexplainemergentbehaviors.Science,360,640-643(2004).1948年,控制论之父NorbertWiener提出生物系统和控制系统可以用同样的科学方法进行研究20世纪60年代生物化学系统理论(BST)

20世纪70年代谢控制理论(MCT)21世纪的系统生物学稳态或拟稳态理论、模型的数据不充分分子生物学、基因组测序以及高通量测量技术的进展,使生物信息系统(BIS)的建立成为可能人类基因组计划和各种组学技术把生物学带入系统科学的时代近几十年来发展最为迅速的生物科学21世纪的生物学分子水平,系统生物学的基础整合性的大科学分子生物学系统生物学

系统生物学与分子生物学

分子生物学与系统生物学还原主义将生物学还原到分子水平

整体主义从系统层次上理解生物系统研究对象是生物系统的组成部分(个别基因、个别蛋白质)研究对象是组成部分的相互作用或部分之间关系——本质上就是信息

侧重从实验中获取数据实验数据的挖掘(datamining)实验的深层次成果往往被忽视

获得深层次成果,理论创新

分子生物学与系统生物学背景学科生理学分子生物学生物信息学组学系统生物学方法系统生物学与相关学科的关系生命活动三要素:物质、能量、信息系统生物学分子生物学生理学生物信息学传统分子生物学各种“组学”系统生物学少多多对多(Interactions)组织原理动态行为涌现属性研究范式的转变

是生物学是数据整合是建模仿真是系统科学系统生物学是什么教材作者:EddaKlippFourAspectsUnderstandingofsystemstructureUnderstandingbehaviorsofthesystemUnderstandinghowtocontrolthesystemUnderstandinghowtodesignthesystem--byHiroakiKitano2002冠心病心血瘀阻证患者尿液代谢组学的通路分析通用名HMDBIDKEGGID相关酶个数转运蛋白个数参与通路个数GlycerolHMDB00131C0011620116AcrylamideHMDB04296C01659228D-GlucoseHMDB00122C0003174166AcetoneHMDB01659C002071011HippuricacidHMDB00714C01586214D-XylitolHMDB02917C003797110PathwayNameTotalCmpdHitsRawpImpactDetailsGalactosemetabolism4120.00406730.00276KEGG

SMPSynthesisanddegradationofketonebodies610.0148790.0KEGG

SMPGlycolysisorGluconeogenesis3110.0749040.0KEGG

SMP

Pentosephosphatepathway3210.077240.0KEGG

SMPGlycerolipidmetabolism3210.077240.18847KEGG

SMPPropanoatemetabolism3510.0842190.01469KEGG

SMPPhenylalaninemetabolism4510.107170.0315KEGG

SMPStarchandsucrosemetabolism5010.118460.01703KEGG

SMPPentoseandglucuronateinterconversions5310.125180.03187KEGG

Aminosugarandnucleotidesugarmetabolism8810.200450.0KEGG

SMP

通过MetPA得到的独特的通路分析结果通过MetPA得到的通路分析概要图半乳糖代谢通路示意图酮体的合成和讲解示意图冠心病心血瘀阻证患者血浆代谢组学的通路分析通用名HMDBIDKEGGID相关酶个数转运蛋白个数参与通路个数ArachidonicacidHMDB01043C00219113239StearicacidHMDB00827C0153071111L-LacticacidHMDB00190C001865

30UreaHMDB00294C0008610232CitricacidHMDB00094C00158241432-HydroxybutyricacidHMDB00008C059846

4OleicacidHMDB00207C0071211

13D-GlucoseHMDB00122C0003129

66Alanine-C014011

4代谢组产物基本注释表PathwayNameTotalCmpdHitsRawpImpactDetailsGlycolysisorGluconeogenesis3120.00546420.0KEGG

SMP

Propanoatemetabolism3520.00693760.0KEGG

SMPFattyacidbiosynthesis4920.0133430.0KEGG

SMPCyanoaminoacidmetabolism1610.0583540.0KEGGCitratecycle(TCAcycle)2010.0724610.06327KEGG

SMPPentosephosphatepathway3210.113660.0KEGG

SMPPyruvatemetabolism3210.113660.13756KEGG

SMPGalactosemetabolism4110.143480.00276KEGG

SMPGlyoxylateanddicarboxylatemetabolism5010.172410.00326KEGGStarchandsucrosemetabolism5010.172410.01703KEGG

SMPPyrimidinemetabolism6010.203540.0KEGG

SMPArachidonicacidmetabolism6210.209630.21669KEGG

SMPArginineandprolinemetabolism7710.254060.03036KEGG

SMPAminosugarandnucleotidesugarmetabolism8810.285220.0KEGG

SMP

Purinemetabolism9210.296250.00794KEGG

SMP通过MetPA得到的通路分析概要图脂肪酸生物合成通路糖酵解和糖异生丙酸代谢冠心病血瘀证遗传相关的差异蛋白基因的生物信息学研究差异蛋白基因富集分析蛋白主要参与43种生物学过程Category富集分析Term名称Count(蛋白基因数量)%#P-ValueP值☆GOTERM_BP_FATinflammatoryresponse571.44.7E-6GOTERM_BP_FATresponsetowounding571.43.3E-5GOTERM_BP_FATdefenseresponse571.45.9E-5GOTERM_BP_FATpositiveregulationofresponsetoexternalstimulus342.93.3E-4GOTERM_BP_FATpositiveregulationoflocomotion342.97.6E-4GOTERM_BP_FATregulationofresponsetoexternalstimulus342.92.0E-3GOTERM_BP_FATtaxis342.92.0E-3GOTERM_BP_FATchemotaxis342.92.0E-3仅列出富集分析结果中P<0.05分子功能类别的前10位差异蛋白基因生细胞组分(CellularComponent,CC)分析Category富集分类Term名称Count(蛋白基因数量)%#P-ValueP值☆GOTERM_CC_FATextracellularregionpart685.71.3E-5GOTERM_CC_FATextracellularspace571.41.1E-4GOTERM_CC_FATextracellularregion685.75.0E-4差异蛋白基因分子功能(MolecularFunction,MF)分析Category富集分析Term名称Count(蛋白基因数量)%#P-ValueP值☆GOTERM_MF_FATcytokineactivity342.93.2E-3GOTERM_MF_FATchemokineactivity228.62.1E-2GOTERM_MF_FATchemokinereceptorbinding228.62.2E-2GOTERM_MF_FATmetalloendopeptidaseactivity228.64.7E-2GOTERM_MF_FATgrowthfactoractivity228.67.2E-2GOTERM_MF_FATmetallopeptidaseactivity228.68.2E-2通过DAVID富集分析系统对本实验获得的62种差异表达蛋白进行MF分析,差异蛋白参与了6类分子途径分别是:细胞因子的活性趋化活性趋化因子受体结合基质金属蛋白酶活性生长因子的活性肽酶的活性差异蛋白DAVID聚类分析差异蛋白DAVID聚类分析的热图第一聚类和炎症防御反应有关,第二个聚类主要与对外界刺激(包括炎症反应)的调节,主要是免疫的正向调节有关;第三个聚类主要与迁移、转移的调节有关;第四个聚类主要与细胞因子趋化、细胞增殖有关;第五个聚类主要与G蛋白偶联受体蛋白的信号转导通路有关。Category数据库Term名称Count蛋白基因情况%#P-ValueP值☆KEGG_PATHWAYNOD-likereceptorsignalingpathwayCXCL1、IL6、IL842.91.4E-3KEGG_PATHWAYCytokine-cytokinereceptorinteractionCXCL1、IL6、IL842.92.4E-2KEGG_PATHWAYPathwaysincancerIL6、IL8、MMP942.93.6E-2KEGG_PATHWAYBladdercancerIL8、MMP928.64.1E-2BIOCARTACellsandMoleculesinvolvedinlocalacuteinflammatoryresponseIL6、IL8、C342.93.5E-4BIOCARTARegulationofhematopoiesisbycytokines

IL6、IL828.63.1E-2BIOCARTAIL17SignalingPathwayIL6

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论