胚胎干细胞核心转录因子靶基因集蛋白互作网络特征分析_第1页
胚胎干细胞核心转录因子靶基因集蛋白互作网络特征分析_第2页
胚胎干细胞核心转录因子靶基因集蛋白互作网络特征分析_第3页
胚胎干细胞核心转录因子靶基因集蛋白互作网络特征分析_第4页
胚胎干细胞核心转录因子靶基因集蛋白互作网络特征分析_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、中国组织工程研究与临床康复 第15卷 第1期 20110101出版Journal of Clinical Rehabilitative Tissue Engineering Research January 1, 2011 Vol.15, No.1 P .O. Box 1200, Shenyang 110004 781Department of Pharmacology, 2Department of Biochemistry,Guangdong Medical College, Dongguan 523808, Guangdong Province, ChinaZuo Chang-qing,

2、 Doctor, Lecturer, Department of Pharmacology,Guangdong Medical College, Dongguan 523808, Guangdong Province, China chqz77Supported by: the Doctor Priming Foundation ofGuangdong Medical College, No. XB1002*Received: 2010-07-12 Accepted: 2010-09-29广东医学院,1药理学教研室, 2生物化学教研室,广东省东莞市 523808左长清,男,1977年生,湖南省

3、湘乡市人,汉族,2009年南方医科大学毕业,博士,讲师,主要从事干细胞生物特性和分化调控,生物信息学研究。 chqz77163. com中图分类号:R394.2 文献标识码:B文章编号:1673-8225 (201101-00078-04收稿日期:2010-07-12 修回日期:2010-09-29 (20100712012/M·Q胚胎干细胞核心转录因子靶基因集蛋白互作网络特征分析*左长清1,汪宗桂2,吴 铁1,崔 燎1Analysis of protein interaction networks related to core transcription factors targ

4、et genes in embryonic stem cellsZuo Chang-qing1, Wang Zong-gui2, Wu Tie1, Cui Liao1AbstractBACKGROUND: It is sufficient to reprogram somatic cells, through transduction of some core transcription factors, into pluripotent stem cells (iPS that exhibit the essential characteristics of embryonic stem (

5、ES cells. At present, the complex mechanism is not yet fully understood.OBJECTIVE: To study the protein interaction networks related to core transcription factors target genes in embryonic stem cells and to obtain regulatory mechanism controlled “stemness”.METHODS: Non-redundant protein interaction

6、data (NRPD were obtained after removal of redundant data in BioGRID database. Protein interaction pairs, formed by the target genes, were extracted by perl program and the largest continuous proteininteraction networks were obtained through searching NRPD using breadth-first search algorithm. At the

7、 same time, 1 000 random networks were analyzed and compared. At last, network visualization was analyzed through the Cytoscape software and network characteristics were explained using complex scale-free network model of Barabasi-Albert.RESULTS AND CONCLUSION: More protein interaction pairs and lar

8、ger continuous protein network, statistically significantdifference compared with random genes, were formed by core transcription factor target genes. The continuous protein network is scale-free characteristics of complex networks. This study has suggested that target genes may regulate synergistic

9、ally “stemness” characteristics of embryonic stem cells through close interaction and forming a network module.Zuo CQ, Wang ZG, Wu T, Cui L. Analysis of protein interaction networks related to core transcription factors target genes in embryonic stem cells.Zhongguo Zuzhi Gongcheng Yanjiu yu Linchuan

10、g Kangfu. 2011;15(1: 78-81. 摘要背景:外源性核心转录因子导入终末分化细胞能产生具有与胚胎干细胞特性相似的诱导多潜能干细胞,其复杂机制目前尚未完全阐明。目的:分析核心转录因子靶基因集蛋白互作网络特征,获得其影响“干性”特征的调控机制。方法:去除BioGRID 数据库中的冗余数据,获得非冗余蛋白互作数据库。perl 程序搜索靶基因集组成的蛋白互作对,广度优先算法搜索非冗余蛋白互作数据库,获得靶基因集组成的最大连续蛋白互作网络,同时进行1 000次随机抽样网络分析。通过Cytoscape 软件对网络进行可视化分析。复杂无标度网络Barabasi-Albert 模型分析网络

11、特征。 结果与结论:核心转录因子靶基因集形成更多的蛋白互作对,最大连续蛋白网络与随机蛋白网络相比具有明显的统计学差异,且核心转录因子靶基因集形成更大的互作网络。网络具有复杂网络无标度特性。该研究通过蛋白互作网络分析证明:靶基因集通过紧密相互作用,形成网络模块方式协调调控胚胎干细胞分子特性。 关键词:胚胎干细胞;蛋白相互作用;生物信息学;核心转录因子;网络 doi:10.3969/j.issn.1673-8225.2011. 01.017左长清,汪宗桂,吴铁,崔燎. 胚胎干细胞核心转录因子靶基因集蛋白互作网络特征分析J.中国组织工程研究与临床康复,2011,15(1:78-81. http:/w

12、 0 引言近年来,通过基因转染外源转录因子的表达,终末分化的体细胞可以重编程产生具有与胚胎干细胞特性相似的多潜能干细胞1-2。这一突破性成果加深了人们对于多能性和重编程的认识,将干细胞研究推向了一个全新的领域。目前,众多的研究正在解析“干性”的形成和维持,它涉及到细胞内多个层次、多种因子参与的复杂的调控网络3,但其具体的机制目前尚为完全阐明。本文通过对胚胎干细胞核心转录因子OCT4,NANOG ,SOX2,MYC 靶基因集进行蛋白互作网络生物信息学分析探讨,揭示靶基因集蛋白互作网络特征,为从系统角度了解核心转录因子调控机制提供了一定的理论依据。1 材料和方法设计:蛋白互

13、作网络的生物信息学分析。 时间及地点:实验于2010-01/05在广东医学院完成。材料:人类蛋白质互作数据:蛋白质互作数据包括物理互作和遗传互作,这两种数据都适合进行 79功能分析,本文中人类蛋白质互作数据资源来源于BioGRID 数据库4。对数据进行如下处理:删除相互作用蛋白中含有非人类蛋白的互作。不考虑作用方向,实验系统只保留非冗余的蛋白互作。处理后的BioGRID 数据包括8 443个人类蛋白及30 465 条互作信息。此为非冗余蛋白互作库(Non-Redundant Interactions database,NRID 。核心转录因子靶基因集:诱导干细胞的核心转录因子有OCT4,SOX

14、2,NANOG ,LIN28,c-Myc 和KLF4。由于目前全基因组LIN28和KLF4靶基因集尚未有文献报道,本文重点分析其他4个核心转录因子靶基因集。Boyer 等5采用CHIP 结合DNA 芯片技术对SOX2,OCT4,NANOG 三个重要的胚胎干细胞转录因子调控靶基因进行了全基因组探查,列出了分别受3个转录因子调控的所有靶基因;Fernandez 等6采用生物信息学结合CHIP 等技术对MYC 调控的靶基因进行了全基因组探察,同样列出可能受MYC 调控的靶基因集。Ben-Porath 等7对上述两个研究的4个转录因子靶基因进行了收集整理,并通过工具统一转换成gene symbol格式

15、,本文采用已被Ittai Ben-Porath 整理转换的gene symbol。共得到NANOG 调控靶基因988个,OCT4调控靶基因290个,SOX2调控靶基因734个,MYC 调控靶基因230个。方法:靶基因集蛋白互作对和最大连续网络分析:每个靶基因集蛋白互作对和最大连续网络分析采用perl 程序完成:此程序先将靶基因集作图到NRID 中,寻找蛋白互作对(只考虑相互作用的两个蛋白均为靶基因 ,然后通过广度优先搜索算法(breadth-first search algorithm搜索由靶基因集形成的最大连续网络互作对。最后应用Cytoscape 软件对最大连续网络互作对进行可视化分析8。

16、随机抽样比较:为了评估靶基因集形成的蛋白互作对和最大连续网络是否与随机产生的网络具有显著性差异,对比抽样1 000次随机输入蛋白产生的随机网络,采用开源的统计分析程序包R(/进行网络大小比较,通过Wilcoxon 符号秩检验(Wilcoxon signed rank test进行分析,P < 0.05为差异有显著性意义。网络度及其度分布以及网络特征分析:在网络研究中,节点的度(用k 表示 是指该节点拥有相邻节点的数目。度分布(用P(k表示 是指在网络中度为 k 的顶点的概率。根据Barabasi-Albert 模型(简称为BA 模型 9,无标

17、度网络度分布的幂律法则分布公式为P(kK-。通过对P(k k-进行log 对数转换,再根据线性回归方程计算得出相应的度指数值。主要观察指标:核心转录因子NANOG ,OCT4,SOX2,MYC 靶基因集形成的蛋白互作对以及最大蛋白互作网络与随机蛋白间的差别;获得互作网络的特征。2 结果 2.1 靶基因集蛋白互作对分析 利用perl 程序,当作图靶基因集到人类NRID 时,有部分基因在此数据库中目前尚未有蛋白互作数据,说明目前的人类蛋白互作数据库还不太完善。在已有相互作用的基因所形成的蛋白互作对与1 000次随机抽样基因所形成的蛋白互作对数目比较,通过Wilcoxon 符号秩检验方法进行统计分析

18、,结果表明:随机抽样所形成的蛋白互作对数量显著少于核心转录因子靶基因集形成的蛋白互用对数量(P <2.2×10-16,见表1。2.2 靶基因集最大连续互作网络分析 通过广度优先搜索算法寻找靶基因集间互作对所形成的最大连续互作子网,与1 000次随机抽样结果比较,Wilcoxon 符号秩统计分析表明,随机抽样所形成的连续子网大小明显少于靶基因集所形成的子网大小(P < 2.2×10-16 ,见表2。2.3 最大连续互作网络特征分析 根据Barabasi- Albert 模型(简称为BA 模型 9,当网络的 < 3时,为典型的无标度网络。为了探查以上核心转录因

19、子靶基因集形成的最大连续互作网络特征,分别对网络节点的度和度分布进行了计算(由于OCT4网络节点数过少,以下未进行计算 ,结果表明NANOG 、SOX2、MYC 靶基因集所形成的最大连续互作网络度指数值分别为1.792 6,1.638 6,1.419 1。符合无标度网络的定义,见表3。左长清,等. 胚胎干细胞核心转录因子靶基因集蛋白互作网络特征分析 ISSN 1673-8225 CN 21-1539/R CODEN: ZLKHAH www. CRTER .org左长清,等. 胚胎干细胞核心转录因子靶基因集蛋白互作网络特征分析 P .O. Box 1200, Shenyang 110004 80

20、www.CRTER.org图1,图2分别为NANOG 网络特征线性回归分析结果和网络可视化结果。由于无标度网络中心节点对网络维持具有非常重要作用,分别寻找了靶基因集形成最大连续互作网络前5个最高连接节点,结果见表4。3 讨论随着后基因组时代的到来,高通量研究技术取得了巨大的发展,因此生命科学研究形式也开始发生转变,生物学研究的热点也逐渐由过去单独的还原论方法对细胞内个别基因或蛋白质功能的局部性研究,开始转移到以细胞内全部的基因、mRNA 、蛋白质及代谢产物为研究对象的各种“组学”研究,即整体性研究。越来越多的事实也说明,一个基因的单独表达往往不能主宰一个生物学事件的发生,一个事件的发生是有一组

21、基因的同时表达,是一组蛋白的协同作用。因此实际上更真实表现生物学功能的,应当是一组相关基因、一组相互作用蛋白,这些相互作用着的蛋白就必然构成一个网络。所以能够真实说明生物学功能的应该是一组相互作用的分子形成的网络10。在人类胚胎干细胞的研究中,网络知识也得到广泛的应用,通过对转录调控网络的研究,发现了一些在人类胚胎干细胞特性调节的许多重要的转录因子5,11-12;最近,在胚胎干细胞蛋白相互作用网络研究中,Wang 等13采用NANOG 为诱饵的亲和纯化加上质谱研究产生包含37个蛋白的小鼠胚胎干细胞蛋白相互作用网络。此项研究在干细胞蛋白相互作用网络研究中取得了较好的开端。通过外源基因导入产生出诱

22、导多潜能干细胞,进一步证明了核心转录因子在“干性”维持和调控中的重要性,但是目前相关机制的认识尚未完全明了。作者通过对OCT4,NANOG ,SOX2,MYC 核心转录因子靶基因进行网络作图分析,研究证明靶基因集中基因可以通过直接或间接的相互作用紧密连接,与随机抽样具有明显的差异。说明核心转录因子通过调控下游靶基因相互作用网络或模块最终来决定干细胞的特性。近年来,科学家们发现大量的真实网络既不是规则网络,也不是随机网络。科学家们将这些具有完全不同于规则网络和随机网络的统计特征的真实网络称为复杂网络。大量的研究已经表明,生物网络,包括代谢网络、基因调控网络以及蛋白相互作用网络等,虽然目前在数据上

23、存在有不完善以及假阳性较高等不足,但基本上都表现出相同的网络拓扑特征:网络节点的度分布近似于无标度特征9。即在特定的蛋白质相互作用子网络中,占据网络的中心节点(即中心蛋白 在网络中仅占极少数,但是中心节点(即中心蛋白 在维持全局网络结构完整性方面比非中心节点更为重要;也就是说,这些极少数的蛋白对细胞,乃至机体特定状态的维持非常重要。根据以上原则指导,已有报道通过构建长寿相关蛋白相互作用网络并进一步解析网络特性,有利于分析可能存在的长寿相关通路,预测潜在的长寿相关基因,以及提供重要的促进长寿干预靶点14-15。同时,复杂网络Figure 2 The max protein interaction

24、 network of nanog targeted genes list. The top 5 highly connectednodes labeled and shown as large circle图2 nanog靶基因集最大连续互作网络,前5个最高连接节点已经标记,并采用大圆形显示 81中心节点重要性理论在肿瘤重要基因的鉴别中也得到广泛应用16-18。作者通过分析胚胎干细胞基因表达谱芯片,构建胚胎干细胞富集蛋白相互作用网络,已经预测部分对胚胎干细胞特性维持具有重要作用的未知蛋白19;本项研究通过计算分析,发现核心转录因子靶基因集相互作用网络也和其他生物网络相似,满足无标度网络特征。

25、鉴于无标度网络中心节点重要性理论,以上最高连接的网络节点如UBC ,TBP ,JUN ,PCNA ,HDAC2, SMAD3,HIF1A ,HSPA8等可能对干性具有重要调控作用。且多个节点是不同靶基因网的中心,进一步说明多个核心转录因子间存在互相影响,互相调控作用。目前已有部分研究证明上述节点如SMAD3,HIF1A 对干性具有调节作用20-21。总之,本文通过对靶基因集蛋白互作网络进行分析探讨,从系统角度对胚胎干细胞的理解起到重要的提示作用。随着蛋白相互作用数据库和蛋白质组学技术的不断完善和改进,通过基于网络理论的生物信息学分析,可能从一个新的角度认识和研究胚胎干细胞。4 参考文献 1Ta

26、kahashi K, Yamanaka S. Induction of pluripotent stem cells from mouse embryonic and adult fibroblast cultures by defined factors. Cell. 2006;126(4:663-676.2 Yu J, Vodyanik MA, Smuga-Otto K,et al. Induced pluripotent stemcell lines derived from human somatic cells. Science. 2007; 318(5858:1917-1920.3

27、 Liu N, Lu M, Tian X,et al. Molecular mechanisms involved inself-renewal and pluripotency of embryonic stem cells. J Cell Physiol. 2007;211(2:279-286.4 Jorgensen P, Breitkreutz BJ, Breitkreutz K,et al. Harvesting thegenome's bounty: integrative genomics. Cold Spring Harb Symp Quant Biol. 2003;68

28、:431-443.5 Boyer LA, Lee TI, Cole MF,et al. Core transcriptional regulatorycircuitry in human embryonic stem cells. Cell. 2005;122(6: 947-956.6 Fernandez PC, Frank SR, Wang L, et al.Genomic targets of thehuman c-Myc protein.Genes Dev. 2003;17(9:1115-1129.7 Ben-Porath I, Thomson MW, Carey VJ,et al. A

29、n embryonic stemcell-like gene expression signature in poorly differentiated aggressive human tumors. Nat Genet. 2008;40(5:499-507. 8 Shannon P, Markiel A, Ozier O,et al. Cytoscape: a softwareenvironment for integrated models of biomolecular interaction networks. Genome Res. 2003;13(11:2498-2504.9 B

30、arabási AL, Oltvai ZN. Network biology: understanding the cell'sfunctional organization. Nat Rev Genet. 2004;5(2:101-113. 10 Chen RS. Shengwu Wuli Xuebao. 2007;23(4:290-295.陈润生. 与生物信息学相关的两个前沿方向非编码基因和复杂生物网络J.生物物理学报, 2007,23(4:290-295. 11 Kim J, Chu J, Shen X,et al. An extended transcriptiona

31、l networkfor pluripotency of embryonic stem cells. Cell. 2008;132(6:1049- 1061.12 Chavez L, Bais AS, Vingron M,et al. In silico identification of acore regulatory network of OCT4 in human embryonic stem cells using an integrated approach. BMC Genomics. 2009;10:314. 13 Wang J, Rao S, Chu J,et al. A p

32、rotein interaction network forpluripotency of embryonic stem cells. Nature. 2006;444(7117: 364-368.14 Budovsky A, Abramovich A, Cohen R,et al. Longevity network:construction and implications. Mech Ageing Dev. 2007;128(1: 117-124.15Wolfson M, Budovsky A, Tacutu R, et al.The signaling hubs at thecrossroad of longevity and age-related disease networks. Int J Biochem Cell Biol. 2009;41(3:516-520.16 Chang W, Ma L, Lin L,et al. Identifi

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论