原鸡基因CD8a生物信息学初步分析论文_第1页
原鸡基因CD8a生物信息学初步分析论文_第2页
原鸡基因CD8a生物信息学初步分析论文_第3页
原鸡基因CD8a生物信息学初步分析论文_第4页
原鸡基因CD8a生物信息学初步分析论文_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、原鸡基因原鸡基因 cd8acd8a 生物信息学初步分析生物信息学初步分析 内容摘要 本文的实验对象是原鸡的 cd8a。本实验运用生物信息学方法,对本条核酸 序列进行核酸一级结构和其表达产物的一级结构、二级结构以及三级结构进行 初步分析。通过分析我们得出,该条序列长度为 648bp,有多种酶的限制性酶 切位点,与其他鸡形目的 cd8a 相似性很高,本条序列共编码 216 个氨基酸。氨 基酸疏水性不高,有 12 个磷酸化位点,没有信号肽,有一个跨膜区,蛋白质二 级结构主要是 螺旋,占 22.69%;延伸链,占 15.74%;无规卷曲,占 61.57%,并且分布不连续。通过对其系统发生树的建立,三种

2、方法构建的系统 树,所表现的 cd8a 和其他物种同源序列之间的关系基本一致。 【关键词】:原鸡 生物信息学 cd8a 目录 一、综述 .4 二、分析研究材料与方法 .5 (一)研究材料.5 (二)研究方法及工具.5 (三)分析方法和具体步骤.6 三、预测结果与分析 .8 (一)核酸序列一级结构分析.8 1核酸序列基本分析.8 2.核酸序列的酶切图谱分析.9 3.碱基同源性初步分析.11 (二)氨基酸序列的初步分析.12 1.氨基酸序列的组成.12 2磷酸位点的预测.14 3氨基酸的疏水性和亲水性分析.14 4氨基酸的跨膜区分布.15 5信号肽区域的预测.16 (三)氨基酸高能结构的分析.17

3、 1氨基酸的二级结构分析.17 2蛋白质序列的结构功能域分析.18 3蛋白质的亚细胞定位.19 4氨基酸序列三级结构的分析.20 5系统进化树的构建及其进化分析.20 四、结果讨论 .21 (一)核酸序列的基本分析.21 (二)氨基酸序列的基本分析.21 (三)蛋白质高级结构分析及功能预测.22 (四)结论.22 五、参考文献 .22 原鸡基因 cd8a 生物信息学初步分析 bioinformatical analysis of a gallus gallus cd8a gene 一、一、综综述述 生物信息学是一门新兴的前沿的科学,它随着计算机的技术的发展,逐步 应用于农林学、生物学、医学等研

4、究中1,通过各种软、数据库、服务器对生 物分子的分析及功能预测,在科技领域显示了它越来越重要的作用。 本文就是利用生物信息学方法,对原鸡的 cd8a 进行初步分析。原鸡不仅适 应于热带、亚热带地区饲养繁衍,而且对高寒地区也具有良好的适应能力,全 年各个季节全国各地均可饲养。而且其抗病能力强,病害少,育雏成活率高, 达到 98%左右,属于中国二级保护动物。 cd8分子是 t 淋巴细胞表面的 i 型跨膜蛋白2,也是 t 淋巴细胞表面重要的 标志性分子3, 4。鸡的 cd8分子主要表达在细胞毒性 t 淋巴细胞5、抑制性 t 细胞和树突状细胞的表面。6cd8分子是二聚体,并有 cd8aa 同型二聚体和

5、 cd8a 异型二聚体两种表达形式。cd8主要识别 mhc类分子递呈的内源性抗原; 鸡 cd8分子是鸡免疫系统的重要组成部分,与哺乳动物的 cd8分子在生物进化和 功能上有明显的相似性12,13。cd8a 参与胸腺分化以及 t 细胞活化的信号传导,7 而 cd8 主要协助 cd8a 发挥生物学功能。 通过对不同物种的 cd8a 核酸序列的分析,人们发现 cd8a 是一个功能类似 而且较为保守的跨膜蛋白,约由230个氨基酸组成,包含一个规范的信号肽,一 个 ig 高变区,ig 高变区暴露于同源的免疫球蛋白的 cdr1、2、3的钩环区;紧 接着 ig 高变区的是富含脯氨酸的铰链区,之后是由二十个氨

6、基酸构成的跨膜区。 本文首先对核酸序列进行基本分析,通过对酶切位点的分析,我们可以 对本条核酸序列酶切及体外扩增,用于分子实验。对氨基酸序列的分析,我 们可以找到其磷酸化的位置,有无信号肽,以及亚细胞定位和其二级结构等, 在此基础上,来分析预测结构和功能的关系。对cd8a 基因的生物信息学分 析,通过比较相同基因和不同基因的等位基因,有助于研究不同基因间的进化 关系,以及进一步研究 cd8a 与免疫系统防御的关系,所以在原鸡养殖和优良 育种方面具有很好的应用前景8。 二、分析研究材料与方法二、分析研究材料与方法 (一)研究材料 研究对象是原鸡的 cd8a 作为研究材料,长度为 648bp,在

7、genbank 的登录 号为 nm_205235.1。 (二)研究方法及工具 本论文采用生物信息学方法,用计算机对草鱼的原鸡的 cd8a(648bp)的 结构、功能及进化地位进行了研究,主要用到的生物信息学数据库、分析软件 以及网络服务器如下 数据库: ncbi(national center for biotechnology information,美国 国家生物技术信息中心) 软件: bioedit(用于核酸序列编辑与分析) discover studio visualizer(用于蛋白质结构的分析) mega(用于分子进化遗传分析) 网络服务器(主要用于蛋白质结构的预测): blast

8、 程序(用于同源序列的比对) scratch protein predictor(蛋白质结构预测) swiss-model; cbs 服务器的 netphos2.0 server expos 服务器的 prostate cbs 服务器的 tmhmm server v. 2.0 cbs 服务器的 signalp3.0 server pbil lyon-gerland 信息库 smart cbs 服务器的 cphmodels wolf psort cdart: conserved domain architecture retrieval tool (三)分析方法和具体步骤 首先,登录 ncbi,

9、将待分析核酸序列存为 fasta 格式,命名为 48。将氨基 酸序列存为 fasta 格式,命名为 cd8a。 1.对本条核酸序列一级结构的分析 (1)核酸序列的基本分析采用 bioedit 软件,打开 bioedit,选择文件, 将保存好的 fasta 格式的核酸序列打开。选中本条序列后点击 sequencenucleic acidnucleotide composition,就会显示核酸序列的分 子量、碱基数量等结果,保存这个结果。 (2)核酸序列的酶切图谱分析 用 chromaspro 软件进行限制性酶切位点的分析,在 chromaspro 软件中打 开该序列的 fasta 格式,再点

10、analysis restriction enzyme,选择 all enzyme 即可显示出分析结果,保存结果。 (3)同源序列的搜索与对比 首先打开 ncbi 首页,再打开 blast,在 basic blast 中选 nucleotide blast。页面打开后,在对话框中浏览文件,选择保存好的 fasta 格式的核酸序 列,在 database 中选 others(nr etc),默认其它参数。最后点 blast,显示分 析结果,保存。 2氨基酸序列的初步分析 (1)氨基酸序列的组成 打开 bioedit 软件,打开本条氨基酸编码的氨基酸序列,选中序列,点 sequenceprotei

11、namino acid composition,显示结果,保存。 (2)氨基酸序列的磷酸化位点分析 运用丹麦科技大学(dtu)的 cbs 服务器上的 netphos2.0 server 程序。 网址:http:/www.cbs.dtu.dk/services/netphos/ 打开网址,浏览文件,选中 fasta 格式的氨基酸序列,之后,在参数中选 择:tyrosine(酪氨酸)、threonine(苯丙氨酸)、serine(丝氨酸)这三种 氨基酸为了看是这三种氨基酸否被磷酸化,点击 submit 提交,最后结果以图像 形式输出。 (3)氨基酸序列疏水性和亲水性分析 采用 expasy 服务器

12、上的 protscale 程序进行氨基酸的疏水性分析 网址:/cgi-bin/protscale.pl 打开网址,之后将氨基酸序列复制粘贴到对话框,在参数选择中,有不同 的 window size 和 amino acid scale,选择不同的参数会得到不同的结果,在 这里,我们选择:hphob. / roseman,点击 sumbit 提交,出现结果并保存。 (4)氨基酸序列的跨膜区分析 运用丹麦科技大学(dtu)的 cbs 服务器上的 tmhmm server v. 2.0 程序。 网址:http:/www.cbs.dtu.dk/services/

13、tmhmm/ 打开网址,浏览文件,将氨基酸序列的 fasta 格式选入对话框中,输出形 式选 extensive,with graphic,最后点击 submit(提交),稍后会出现分析 结果,保存结果。 (5)氨基酸序列的信号肽预测 使用 signalp3.0 server 程序。 网址:http:/www.cbs.dtu.dk/services/signalp/ 首先打开网址,浏览文件,将氨基酸序列 fasta 格式选入对话框中,选择 参数: organism group:选 eukaryotes(真核细胞); method(神经网络算法):本实验为了比较选 both; graphics:

14、选择 gif (inline); output format:选择 standard(标准)输出方式; truncation:由于无法预测信号肽长度一般选择(0)阻断,本次实验为 了比较还选择(30)为阻断常数。点 submit 按钮,出现结果并保存。 3.氨基酸高能结构的分析 (1)氨基酸序列的二级结构分析及预测 运用 pbil lyon-gerland 数据库对氨基酸的序列进行二级结构预测。 网址:http:/npsa-pbil.ibcp.fr/cgi- bin/npsa_automat.pl?page=/npsa/npsa_hnn.html 首先,打开网址,把氨基酸序列粘贴在对话框中。点

15、击 submit(提交), 显示结果并保存。 (2)氨基酸序列的结构功能域分析 用简单模块构架搜索工具 smart 对氨基酸序列序列进行结构功能域分析。 网址:http:/smart.embl-heidelberg.de/, 打开网址,在首页上点 throuth this page,进入新页面。在 sequence 中 粘贴氨基酸序列,最后点 sequence smart 即可得到结果,保存结果。 (3)蛋白质的亚细胞定位 运用 wolf psort 程序对氨基酸序列进行亚细胞定位。 网址:http:/wolfpsort.seq.cbrc.jp/ 首先,打开网址,在“select an org

16、anism type” 中选择“animal”。 之后,“please select input method”选择“from file”;浏览文件,选入 fasta 格式的氨基酸序列,最后,提交,将结果保存。 (4)氨基酸序列三级结构分析 运用丹麦科技大学(dtu)的 cbs 服务器上的 cphmodel3.0 程序对氨基酸序列 进行三级结构的分析。 网址:http:/www.cbs.dtu.dk/services/cphmodels/ 首先打开网址,将氨基酸序列放入对话框,点 submit,将新页面中的 email 地址填好,几分钟之后将结果打开,点 query.pdb 下载 pdb 格式

17、的文件。 打开 accelrys discovery studio visualizer3.1 软件,在 open 里打开刚 才下载的文件,即可出现蛋白质的 3d 结构,保存结果。 (5)系统发生树的构建及进化地位分析 运用 mega4 软件对的核酸序列和氨基酸序列进行同源性分析,并绘制出系 统发生树。通过 ncbi 数据库,bioedit 和 mega 软件进行系统发生树的构建, 来进行进化地位分析。 首先在 ncbi 中通过 protein blast 找到与该 est 氨基酸序列相似的序列, 并下载它们的氨基酸序列,连同本文预测序列一起放入一个记事本中保存,在 bioedit 中打开,用

18、 fasta 格式保存。 用 mega 软件构建系统进化树。打开 megaalignmentalignment explorer/clustal选 create a new alignment,点 ok在弹出的对话框中点 no(表示放入的序列是蛋白质的)又出现了一个对话框,打开之前保存的 fasta 格式的氨基酸序列全选,再点 w( align selected block by clustalw)点 ok然后再点 dataexport alignmentmega format,保存 在之前小 mega 中打开上步保存的 megphylogenyconstruct phylogeny 最后再选

19、 nj 或 mp 即可得到进化树,保存结果。 三、三、预测结预测结果与分析果与分析 登陆 ncbi,登陆号为 nm_205235.1,将核酸序列和氨基酸序列保存为 fasta 格式,用来下文分析。 (一)核酸序列一级结构分析 1核酸序列基本分析 运用 bioedit 软件分析核酸序列的分子质量、碱基组成和碱基分布。 结果如下: 图 1 核酸序列 4 种碱基百分比直方图 通过分析,统计数据得 表一: 碱基组成分析表 atcg 数量 170193162123 百分比 26.2329.7825.0018.98 本序列全长 648bp,单链分子量 198449.00daltons,双链分子量 3944

20、83.00daltons。 2.核酸序列的酶切图谱分析 结果如图,包含了多种酶的限制性酶切位点。 图 2 核酸序列酶切位点预测图 3碱基同源性初步分析 在 ncbi 中,将本条序列 blast,得到以下结果 图 3 核酸序列碱基同源性对比图(1) 图 4 核酸序列碱基同源性对比图(2) 本文序列预测额和原鸡 cd8a 分子基因相似度高达 100%,我们跟踪其 中一条序列,得到以下结果 图 5 核酸序列碱基同源性对比图(3) 这是原鸡 cd8a 分子基因和本条核酸序列的对照,在原鸡的第 62 个碱基到 第 709 个之间,这俩条序列相同。 (二)氨基酸序列的初步分析 1氨基酸序列的组成 用 bi

21、oedit 软件对氨基酸组成分析结果如下: 图 6 氨基酸百分比直方图 表 2 氨基酸组成分析表 amino acidnumbermolamino acidnumbermol ala a156.94met m41.85 cys c94.17asn n136.02 asp d52.31pro p156.94 glu e94.17gln q146.48 phe f125.56arg r167.41 gly g125.56ser s177.87 his h41.85thr t167.41 ile i125.56val v115.09 lys k115.09trp w20.93 leu l156.94

22、tyr y41.85 2磷酸位点的预测 结果显示,有 9 个丝氨酸(ser),2 个苏氨酸(thr),1 个酪氨酸(tyr) 可能被磷酸化,可能性分析如下: 图 7 序列中可能的磷酸化位点(1) 图 8 序列中可能的磷酸化位点(2) 3氨基酸的疏水性和亲水性分析 得到以下结果 图 9 氨基酸的亲/疏水性分布图 氨基酸序列的亲疏水性决定了蛋白质的结构,从输出结果来看,氨基酸序 列集中在-1 附近,所以疏水性不强,属于亲水性氨基酸。 4氨基酸的跨膜区分布 运用丹麦科技大学(dtu)的 cbs 服务器上的 tmhmm server v.2.0 程序对 该序列进行蛋白质序列的跨膜区分析。 得到结果如下

23、图 图 9 氨基酸序列跨膜区分析图 从分析结果来看,本条氨基酸序列中有一个跨膜区。 5信号肽区域的预测 图 10 氨基酸序列信号肽分析 通过分析,本条序列没有信号肽。 (三)氨基酸高能结构的分析 1氨基酸的二级结构分析 图 11 氨基酸的二级结构分析图 表 3 二级结构预测结果 a 螺旋(hh) 49 22.69 310 螺旋(gg) 0 0.00 pi 螺旋(ii) 0 0.00 片层(bb) 0 0.00 延伸链(ee) 34 15.74 转角(tt) 0 0.00 弯曲域(ss) 0 0.00 无规卷曲(cc) 133 61.57 任意形式 0 0.00 其它形式 0 0.00 图 12

24、 氨基酸二级结构预测 图 13 二级结构分析直观结果 通过表格和上图我们可以看出这条氨基酸序列的二级结构主要是 a 螺旋, 占 22.69%;延伸链,占 15.74%;无规卷曲,占 61.57,并且分布不连续。 2蛋白质序列的结构功能域分析 有输出结果,我们得出,本条序列的功能域是由第 23 个氨基酸到第 133 个氨基酸编码的 ig 结构域。e 值是 1.63e-03。 3蛋白质的亚细胞定位 运用 wolf psort 程序对氨基酸序列进行亚细胞定位。结果如下: 图 15 亚细胞定位分析结果图(1) 图 16 亚细胞定位分析结果图(2) 图 17 亚细胞定位分析结果图(3) 通过分析结果,我

25、们得出亚细胞定位分析蛋白质位于细胞膜上。 4氨基酸序列三级结构的分析 结果及分析 图 18 三级结构模型 以上是蛋白质三级结构的模型图,有 螺旋和很多的无规卷曲,其余为延 伸链。 5系统进化树的构建及其进化分析 图 19 绝对保守区(局部) 图 19 n-j 法构建的刺痛发生树 图 20 m-p 法构建的系统发生树 通过以上的分析结果显示,两种方法构建的系统树,本文所研究的序列和其他 物种同源序列之间的关系基本一致。预测蛋白与火鸡最接近,所以预测它们在 结构和功能方面处于同一进化地位。 (四)(四)结结果果讨论讨论 (一)核酸序列的基本分析 通过对本条序列以上几方面的分析,我们可以得出:该条序

26、列是一条全 长 648bp 的 mdna,含有多种酶的酶切性位点,通过得出的酶切位点的信息,我 们可以对本条核酸序列酶切及体外扩增,用于分子实验。通过碱基的同源 性分析,与其他鸡形目 cd8a 序列比较相似,相对保守。 (二)氨基酸序列的基本分析 通过氨基酸序列的分析,我们发现此序列编码的蛋白质有较强的保守性。 有 9 个丝氨酸(ser),2 个苏氨酸(thr),1 个酪氨酸(tyr)可能被磷酸化, 氨基酸序列的亲疏水性决定了蛋白质的结构,从输出结果来看,氨基酸大部分 序列的值小于 0,疏水性不强,属于亲水性氨基酸。本条氨基酸序列有一个跨 膜区,没有信号肽区域,怀疑此序列结构和功能域不完全,需

27、要再进行进一步 分析。 (三)蛋白质高级结构分析及功能预测 蛋白质二级结构主要是 螺旋,占 22.69%;延伸链,占 15.74%;无规 卷曲,占 61.57%,并且分布不连续。本条序列的功能域是由第 23 个氨基酸到 第 133 个氨基酸编码的 ig 结构域。e 值是 1.63e-03.经过亚细胞定位分析,蛋 白质位于线粒体。通过 m-p 法构建的系统发生树可以预测蛋白与火鸡最接近, 所以预测它们在结构和功能方面处于同一进化地位。 (四)结论 cd8 分子是 t 淋巴细胞表面的 i 型跨膜蛋白11,14,也是 t 淋巴细胞表面重 要的标志性分子9。cd8 分子是二聚体,并有 cd8aa 同型

28、二聚体和 cd8a 异型 二聚体两种表达形式15。其中,cd8a 是一个功能类似而且较为保守的跨膜蛋白, 约由 230 个氨基酸组成,包含一个规范的信号肽,一个 ig 高变区,ig 高变区 暴露于同源的免疫球蛋白的 cdr1、2、3 的钩环区;紧接着 ig 高变区的是富含 脯氨酸的铰链区,之后是由二十个氨基酸构成的跨膜区。本文预测的蛋白质含 216 个氨基酸,从结果来看,没有信号肽,无法实行穿膜功能,但是有跨膜区, 至于其是怎样完成穿膜,需要我们进一步分析。通过以上分析结果,推测该蛋 白质可能是与其他同源基因编码的 a 链和 链结合共同完成免疫功能。现今普 遍认为,cd8 分子是参与 tcr

29、信号传导的辅受体。作为辅受体, cd8 在信号 传导中起重要作用,通过 p56lck和 cd3 链间的酪氨酸磷酸化途径激活 tcr10。最近的数据表明, cd8 具有一系列重要免疫学功能的跨膜分子。 五、参考文献五、参考文献 1.bernard, v. and m. michaut, explain bioinformatics to your grandmother! plos comput biol. 9(10):e1003305. 2.wu, t.l., et al., cd8 t cell recognition of epitopes within the capsid of ade

30、no-associated virus 8-based gene transfer vectors depends on vectors genome. mol ther. 3.zou, q., et al., cd8 treg cells suppress cd8 t cell-responses by il-10-dependent mechanism during h5n1 influenza virus infection. eur j immunol. 4.snauwaert, s., et al., in vitro generation of mature, naive anti

31、gen-specific cd8 t cells with a single t-cell receptor by agonist selection. leukemia. 5.trifari, s., et al., microrna-directed program of cytotoxic cd8+ t-cell differentiation. proc natl acad sci u s a. 110(46):18608-13. 6.brown, a.s., et al., cd8 subunit expression by plasmacytoid dendritic cells is variable, and does not define stable subsets. mucosal immunol. 7.cho, j.h., et al., unique features of naive cd8+ t cell activation by

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论