蛋白质结构与功能的生物信息学研究_第1页
蛋白质结构与功能的生物信息学研究_第2页
蛋白质结构与功能的生物信息学研究_第3页
蛋白质结构与功能的生物信息学研究_第4页
蛋白质结构与功能的生物信息学研究_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 实验名称:蛋白质结构与功能的生物信息学研究实验目的:1.掌握运用BLAST工具对指定蛋白质的氨基酸序列同源性搜索的方法。2.掌握用不同的工具分析蛋白质的氨基酸序列的基本性质3掌握蛋白质的氨基酸序列进行三维结构的分析4.熟悉对蛋白质的氨基酸序列所代表蛋白的修饰情况、所参与的代谢途径、相互作用的蛋白,以及与疾病的相关性的分析。实验方法和流程:一、 同源性搜索同源性从分子水平讲则是指两个核酸分子的核苷酸序列或两个蛋白质分子的氨基酸序列间的相似程度。BLAST工具能对生物不同蛋白质的氨基酸序列或不同的基因的DNA序列极性比对,并从相应数据库中找到相同或相似序列。对指定的蛋白质的氨基酸序列进行同源性搜

2、索步骤如下: 登录网址/blast/输入序列后,运行blast工具序列比对的图形结果显示序列比对的图形结果:用相似性区段(Hit)覆盖输入序列的范围判断两个序列的相似性。如果图形中包含低得分的颜色(主要是红色)区段,表明两序列的并非完全匹配。匹配序列列表及得分可选择不同的比对工具各序列得分备注: Clustal是一款用来对()的软件。可以用来发现特征序列,进行蛋白分类,证明序列间的同源性,帮助预测新序列二级结构与三级结构,确定PCR引物,以及在分子进化分析方面均有很大帮助。Clustal包括Clustalx和Clustalw(前者是图形化界面版本后者是命

3、令界面),是生物信息学常用的多序列比对工具。该序列的比对结果有100条,按得分降序排列,其中最大得分2373,最小得分分为1195.详细的比对序列的排列情况第一个序列的匹配率为100%第一个匹配序列Score表示打分矩阵计算出来的值,由搜索算法决定的,值越大说明匹配程度越大。Expect是输入序列被随机搜索出来的概率,该值越小越好。Identities是相似程度,即匹配率,100%表示序列全部匹配。Method:代表不同的打分矩阵方法,选择不同的打分矩阵会得到不同的打分结果。显示结果按越后面匹配率越低。二、 分析蛋白质的氨基酸序列的基本性质ProParam是计算氨基酸理化参数常用的工具,提供计

4、算蛋白质的分子量、理论等电点、氨基酸组成、原子组成、消光系数(extinction coefficient)、半衰期、不稳定系数、脂肪系数和总平均疏水性(GRAVY)等。登录网址:/protparam并输入序列号蛋白质的氨基酸组成、相对分子质量、等电点和原子组成。结果1:该蛋白质序列的氨基酸数为1255个,相对分子质量为137910.5,等电点为5.58,由C、H、N、O、 S五种原子组成,共有19180个原子。消光系数、半衰期、不稳定系数、脂肪系数和总平均疏水性(GRAVY)结果2:消光系数反映了蛋白在特定波长下吸收可见光或不可见光的能力,可用来测蛋白

5、浓度。由上图知,该序列在280nm的波长下,假设所有成对的半胱氨酸残基形成胱氨酸,则该序列的消光系数1.003;假设所有的半胱氨酸残基都减少了,改序列的消光系数为0.976。半衰期为30小时(哺乳动物的网织红细胞,体外);> 20小时(酵母、体内),> 10小时(大肠杆菌、体内)。该蛋白不稳定系数为56.13,提示该蛋白质不稳定。脂肪系数是计算球状蛋白脂肪族氨基酸侧链所占相对体积,反映了蛋白质的热稳定性,为82.35. 蛋白质的疏水性预测可以根据GRAVY值来预测。GRAVY值的范围在2 与-2之间,正值表明此蛋白为疏水性蛋白,负值表明为亲水蛋白。该蛋白的GRAVY值为-0.247

6、,因此预测该蛋白为亲水蛋白。利用ProtScale工具对蛋白质进行亲疏水性分析登录网址/protscale并输入序列号GFAP亲疏水性分布图,横坐标为序列位置,纵坐标为氨基酸的标度值。Hphob.kyte&Doolittle 标度(default)定义疏水性氨基酸较高的打分值(>0值表示疏水性,<0值表示亲水性。从图可看出,标度值<0的区域比>0的较为密集,因此,结合上面的GRAVY值为-0.247,预测该蛋白为亲水蛋白。利用TMPred工具对该蛋白进行跨膜区结构预测登录网址/

7、software/TMPRED_form.html最优拓扑结构:2种模型都预测有4个蛋白质跨膜区。用TMHMM预测是否存在跨膜区 登录网址http:/www.cbs.dtu.dk/services/TMHMM-2.0/结果提示有2个蛋白质跨膜区。其跨膜区比TMpred预测的结果少了2个。少了序列前面2个位置的跨膜区。三、 蛋白质三维结构分析登录网址/,输入相应的序列号建模部分结果有A、B、C、D四条晶体结构的单链阵线。四、蛋白质序列的修饰情况、所参与的代谢途径、相互作用的蛋白,以及与疾病的相关性分析登录在里面找到工具。输入序列号结果:所输入

8、序列的代码。所输入序列的代码相互作用的蛋白网络图序列基本信息由结果可知,该蛋白质序列相互作用的蛋白有10个。所输入序列的代码为ERBB2。根据基本信息可知,ERBB2是表皮生长因子受体( EGFR)家族成员之一是白血病病毒致癌基因同族体2。蛋白酪氨酸激酶(ERBB2基因表达产物)是几个细胞表面受体复合物的一部分,但这需要一个coreceptor配体结合。Neuregulin受体复杂的重要组成部分,尽管neuregulin不单独与之交互。GP30是一个潜在的配体受体。调节产物和周边稳定微管(MTs)。总结:该蛋白质序列的比对结果有100条,按得分降序排列,其中最大得分2373,最小得分分为1195. 该蛋白质序列的氨基酸数为1255个,相对分子质量为137910.5,等电点为5.58,由C、H、N、O、 S五种原子组成,共有19180个原子。该序列在280nm的波长下,假设所有成对的半胱氨酸残基形成胱氨酸,则该序列的消光系数1.003;假设所有的半胱氨酸残基都减少了,改序列的消光系数为0.976。半衰期为30小时(哺乳动物的网织红细胞,体外);> 20小时(酵母、体内),> 10小时(大肠杆菌、体内)。该蛋白不稳定系数为56.13,结果提示该蛋白质不稳定。脂肪系数为82.35.该蛋白的GRAVY值为-0.247,通过亲疏水性分析得出该蛋白为亲水蛋白。三级结构分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论