




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、In ternet 上生物学数据库和软件资源的利用 代宁 (南京师范大学生命科学学院 江苏南京 210097摘要 着重介绍了 In ternet 上一些常用的生物学数据库和生物学软件 , 并就其站点 、 获取方式 、 功能和使用技巧作了简要的阐述 。关键词 In ternet 生物学数据库软件利用近年来 , 随着计算机和网络化技术的迅猛发展 , 大量 的生物信息资源可以通过 In ternet 检索获取 , 特别是大量 的生物学数据库和软件资源与 In ternet 连接 , 为生命科学 研究带来了机遇与挑战 。应用它们 , 可以极大推动我们的 研究工作 。 因此 , In ternet 上生
2、物学数据库和软件资源的 利用应当成为我国生命科学工作者的必备素质 。 现就 Iin ternet 上一些常用的生物学数据库和生物学软件资源 利用作一综述 。1生物学数据库资源的利用生物学数据库资源是 In ternet 上的重要信息资源 , 是 获取生物信息的重要途径之一 。科学的各个领域 , :数据库 , 如 、 DDBJ数 据 库 , ISS 2R 、 RL 3D 和 T rE M BL 等 ; , 如 PDB 、 NDB 和 CCSD 等 。 。 鉴于生物学数据库覆盖面广 , 分布分散且格式不统 一 , 一些计算中心将多个数据库整合在一起提供综合服 务 。目前 , 国际上 4个大的生物信
3、息中心数据库即美国国 立 卫 生 研 究 院 国 家 生 物 技 术 研 究 中 心 (T he N ati onalCen ter fo r B i o techno logy Info rm ati onm , N CB I 数据库 、 基因组序列数据库 (Genom e Sequence D ataBase , GSDB 、 欧 洲 分 子 生 物 学 实 验 室 (Eu ropean M o lecu lar B i o logy L abo rato ry , E M BL 数据库和日本国家遗传研究 所 DNA 数据库 (DNA D atabank of Japan , DDBJ 就
4、是源 自数百种生物 c DNA 和基因组 DNA 序列建立起来的大 型综合服务性数据库 。 例如 :N CB I 开发的 En trez 系列就 综合了大量数据库的信息和 M EDL I N E 的文献信息 , 其 特点是对于每一个序列给出了类似的序列或相关的结 构 、 功能和文献信息 。 欧洲生物信息学研究所 (Eu ropean B i o info rm atics In stitu te , EB I 的 SR S (Sequence R etrival System 是一功能强大的生物学数据库检索系统 , 它包含 了核酸序列库 、 蛋白质序列库 、 三维结构库和基因组等 30多 个
5、数 据 库 及 FA STA 、 CLU STALW 、 PRO S IT ESEA RCH 等强有力的搜索工具 , 用户可以将这 些数据库通过超链接整合在一起 , 通过这些超链接能方 便地在不同数据库间进行跳跃浏览 。高度计算机和网络化使得在 In ternet 上更新 、 检索和 收集生物学数据库变得十分快捷方便 。 1997年 PDB 推出 了自动数据投送系统 A u toD ep , 使向 PDB 投送数据库操 作大大简化 。 而 EB I 则通过为一些机构建立帐户的方式 提高数据库收集的效率 。 Java 是一种不依赖于平台的高 效网络语言 , PR I N T S 数据库在 199
6、6Java 引入 , , PDB 等已经实 现了 L ( 模型的传 送 , 。网址E http : www . embl 2heidelberg . deGenBank http : www . ncbi . nl m . nih . gov W eb GenbankDDBJ http : www . ddbj . nig . ac . j pS W ISS 2PROT http: www. expasy . ch sprot 2top. ht m lP I R http : www 2nbrf . georgetown . edu pirGDB http : gdbwww . gdb . o
7、rgPDB http: www. i p c . pku . edu . cn npdbTDB http : www . tigr . org tdbRNABase . org http : www . rnabase . orgGOLD http : igweb . integratedgenom ics . com GOLDGSDB http : seqsi m . ncgr . org default . ht mSCOP http : www . i p c . pku . edu . cn scopEB I http : www . ebi . ac . ukNCB I http :
8、 www . ncbi . nl m . nih . govNCGR http : www . ncgr . orgSI B http : www . isb 2sib . chExPASy http : www . expasy . chSRS http : srs . ebi . ac . ukW eiz mann Institute http : bi o informatics . W eiz mann . ac . ilPedro sBi o MolecularResearch toolshttp : www . public . iastate . edu pedro resear
9、ch _tools . ht m lM edlinehttp : www 2. ncbi . nl m . nih . gov medline query _form .ht m lBi o M edNet http : www . Bi o M edNet . com当今 , 基于 U n ix 平台的生物学数据库服务系统包括 了数据库检索系统 SR S 、 数据库下载服务 FT P 、 以及数据 库搜索系统 BLA ST 。 这 3个系统相互联系 , 是生物学数据 库应用的主要组成部分 。 对于最常用并且数据量最大的 核酸序列数据库 E M BL 和蛋白质三级结构数据库 PDB , 7 2
10、2002年第 37卷第 7期生物学通报可以做到每日更新 ; 蛋白质序列数据库 S W ISSPRO T 和 TR E M BL 每周更新 。所有更新后的数据随时公布在 FT P 服 务 器 上 , 同 时 对 新 数 据 建 立 SR S 索 引 , 然 后 通 过 E M BL 2FA STA 2BLA ST 一系列格式转换 , 保证用户能通 过 BLA ST 搜索到最新的数据 。2生物学工具软件资源的利用In ternet 上有大量的涉及生物学 , 尤其分子生物学研 究领域的工具软件 , 其中一些诸如 GCG 、 PC GEN E 等软 件已完善为功能强大的商品化软件 , 但价值昂贵 、
11、操作复 杂 、 需要经过专业培训才能掌握 , 而且每隔一段时间要升 级 , 这些缺点限制了它们的应用 。大多数软件往往是由个 人或一个小集体开发的 , 其目的往往是为自己的工作方 便 。作者们不计较个人利益 , 将自己精心开发的软件放在 In ternet 上 , 供全世界同行免费下载使用 , 避免了上述缺 点 。 例 如 :N etw o rk En trez 、 R as M o l 、 I m age 和 SequPub 等 。In ternet 上的免费工具软件有在线与离线两种形式 。 对于在线工具软件 , 只要通过浏览器 , 输入一定的信息 , 便可得到相应的结果 。而离线工具软件
12、, 只要下载了这个 软件 , 便可在本地电脑上使用说 , 应用好 In ternet极大推动研究工作进程2. 1 In当今 In EB I 主 I UB i o A rch ive 。 EB I 建有分子 生物学数据库 (E M BL D atabank , 汇集了大量分子生物 学软件 , 包括非常有用的 B i ocat 软件目录 。 I UB i o 同样也 汇集了大量分子生物学软件 , 并且提供对最新 GenBank 、 S W ISS 2PRO T 和 P I R 数 据 库 的 关 键 词 查 询 。 著 名 的 B i onet 也位于此站点 。文件传输协议 (FT P 是专为网上
13、文件传输设计的一 种 In ternet 服务 , 通常软件在贮存和传输中是以一种特殊 的的编码形式存在的 , 目前常用的 Fetch 和 N etscape 可 以自动解码 。 必须注意的是 , 软件经常会升级 , 站点服务 器上的不一定是最新版本 。 有关最新版本的信息通常可 直接与作者联系获得 。在互联网上找到了 1个免费工具软件时 , 首先应注 意此工具软件的操作平台 。根据 1998年 I UB i o 和其他生 物网络服务器的统计 , 全世界有 30%50%的生物学家 使 用 苹 果 机 (M acin to sh , 40%50%的 使 用 PC 机 与 W indow s 操作
14、系统 , 另外还有一些使用 VM S 和 UN I X 系 统 。 这就需要能适用于多平台的软件去为他们的研究服 务 。 Java (h ttp : java . sun . com p roducts 软件就可以在 多种操作系统上运行 , 是一种不依赖于平台的高效网络 语言 。2. 2一些常用的免费分子生物学工具软件 2. 2. 1 N etw o rk En trez N etw o rk En trez 是 N CB I 用来 在网络上查找生物资料的一套在线软件系统 , 可以在多 种操作系统上运行 , 只要能上网 , 就可以在网上搜索找到 生物医学期刊引文 、 蛋白质和核酸序列 、 三维
15、结构数据和 分类学信息等相应的综合资料 。 具体包括 :1 GenBank , E M BL , DDBJ 三 大 数 据 库 中 的 DNA 序 列 :2 S W ISS 2 PRO T , P I R , PR F , PDB 数据库中的蛋白序列以及从核酸 翻译的蛋白序列 ; 3 基因组以及染色体作图数据 ; 4 由 PDB 衍生的三维蛋白结构 , N CB I 的 M o lecu lar M odeling D atabase (MM DB ; 5 文献引用数据库中的引用数据 。 它 可 由 ftp : ncb i . n l m . n ih . gov en trez m s w
16、in w in 32 en trezz . exe 获得 。2. 2. 2 I m age I m age 是由 W ayne Ro sband 开发的用于 图形分析的 M acin to sh 软件 , 它可以测定面积 、 平均密度 、 重心等 , 测量结果可以打印输出 ,者 拷贝到剪切板上 。 由 ftp : zi ppy . gov pub n ih 2 i m age h rsb . . ih . ih m age 均可得 到 I h ttp :. . 上可以得 1S I 的版本 。. id P r 一种绘制质粒图软件 , 可以 DNA 。 用户定义限制位点 、 基因段与多克 隆位点
17、, 还可插入或删除 DNA 片段 , 支持剪贴板与打印 、 存盘功能 。 下载站点 :h ttp : www . uku . fi k iviraum p las m id p las m id . h tm l 。2. 2. 4 A nT heP ro t A nT heP ro t 功能非常强大 , 是蛋白 质研究人员必备的工具软件 。应用此软件包 , 使用个人电 脑 , 便能进行各种蛋白质序列分析与特性预测 , 包括 :进 行蛋白质序列二级结构预测 ; 在蛋白质序列中查找符合 PRO S IT ES 数据库的特征序列 ; 绘制出蛋白质序列的所 有理化特性曲线 ; 在 In ternet
18、或本地蛋白质序列数据库中 查找类似序列 ; 计算蛋白质序列分子量 , 比容与各蛋白质 残基百分组成 ; 计算蛋白质序列滴定曲线与等电点 ; 选定 1个 片 段 后 , 绘 制 H elical W heel 图 ; 进 行 点 阵 图 (Do t P lo t 分析 ; 计算信号肽潜在的断裂位点等许多功能 。 网址 为 :h ttp : www . ibcp . fr 。2. 2. 5 R as M o l R as M o l 广泛应用于蛋白质 、 核酸以及 一些小分子的构象研究中 , 它可在所有常用的计算机系 统上运行 。 R as M o l 能够运用多种不同的显示模式与颜色 显示生物大
19、分子 , 还可以在三维下旋转 、 展示生物分子 , 效果极佳 ; 对教学 、 展示与论文教材撰写 , 也有很大帮助 。 下 载 站 点 为 :h ttp : www . um ass . edu m icrob i o ras mo l 。2. 2. 6 Om iga Om iga 主要的功能包括 :1 编辑 、 浏览蛋 白质或核酸序列 , 分析序列组成等 ; 2 用 C lu stal . W 方法 进行同源序列比较 , 发现同源区 ; 3 核酸序列与其互补链 之间的转化 , 序列的拷贝 、 删除 、 粘贴 、 置换以及转化为82 生物学通报 2002年第 37卷第 7期RNA 链 , 以不
20、同的读码框 、 遗传密码标准翻译成蛋白质 序列 ; 4 查找核酸限制性酶切位点 、 基元 (M o tif 及开放阅 读框 (OR F , 设计并评估 PCR 、 测序引物 ; 5 查找蛋白质 解蛋白位点 (P ro teo lytic Sites 、 基元 、 二级结构等 。 可以在 h ttp : www . starr 2. m yetang . com 获得 。2. 2. 7 DNA C lub DNA C lub 是 1个简单的对 DNA 进 行与 PCR 有关的操作的软件 , 操作界面友好方便 。 功能包 括它 :1 输入 DNA 序列 :2 查找 OR F 序列 ; 3 把 DN
21、A 翻 译成蛋白序列 ; 4 查找酶切位点 ; 5 查找 PCR 引物序列 ; 6 设计 PCR 引物 。 下载站点为 :h ttp : 210. 72. 11. 60 b i o logysoft DNA C lub . zi p 。2. 2. 8 SequPub SequPub 是 1种用于生物分子序列编 辑和分析的软件 , 适用于各种常用的计算机系统 , 可用于 多序列对比分析 、 单序列编辑 、 不同序列文件模式的读 写 、 DNA 与蛋白质序列间的相互转换 、 相似性分析以及 精美的序列输出 。 它还可以外挂其他分析软件 , 例如 C lu stal W 等 , 可自己定义外观应用软
22、件 。 输出打印的文件 类型有 P I C 、 G IF 和 po stscri p t 。 该软件由 Java 语言编制而 成 , 需要 Java 运行环境 , 在 h ttp : www . javasoft . com p roducts jdk 1. 1 jre dow n load 2jre 2w indow s . tm l Java 运 行 环 境 。 SeqPup 的 站 点 i o . . indiana . edu I UB i o 2+D i ojava seqpup tm l 。2. 2. 9 ST L ocal A lynnet Search Too l 。在一个庞大
23、的数据 库中查找某一个序列的同源性序列 , 没有 BLA ST 的帮助 可以 说 无 法 想 象 。 目 前 在 In ternet 上 有 许 多 在 线 的 BLA ST 查找程序 , 专门用于查找各大数据库中与用户提 交的序列同源的序列 。 分成 5个不同的程序 , 分别为 : BLA ST P (提交蛋白质序列 , 在蛋白质序列数据库中查序 列 、 BLA STN (提交核酸序列 , 在核酸序列数据库中查找 同源序列 、 BLA STX (提交核酸序列 , 在蛋白质序列数据 库中查找同源序列 、 TBLA STN (提交蛋白质序列 , 在核 酸序列数据库中查找同源序列 、 TBLA S
24、TX (提交核酸序 列 , 在核酸序列数据库中查找同源序列 。 通常用户可以 通过在线方式或 Em ail 方式提交查询序列 , 得到查询结 果 。 如果需要在本地使用的话 , 可以下载 BLA ST 程序与 相应数据库 , 便能在本地使用了 。 网址 :h ttp : www . ncb i . n l m . n ih . gov BLA ST 。 下载网址 :ftp : ncb i . n l m . n ih . gov b last execu tab les 。 注意有应用于不同操作平台 的好几个版本 , 最新版本号为 2. 0。21世纪是生命科学的时代 , 也是信息时代 。 随着
25、人类 基因组计划的实施 , 有关核酸 、 蛋白质的序列和结构数据 呈指数增长 。面对巨大而复杂的数据 , 运用计算机管理数 据 、 控制误差 、 加速分析过程势在必行 。 生物研究者们借 助于 In ternet 这一高速信息通道 , 充分利用生物学数据库 和软件资源 , 一定能更快 、 更好地做出与众不同的 、 富有 创新的研究成果 。参考文献 1李勇 , 倪福太 , 贺福初 . 英特网上生物信息资源的利用 . 生物 化学与生物物理进展 , 1999, 26(3 :295 296. 2 Benson D A , Bogusk i M S, L i pm an D J , et al . GenBank. N ucleic A cid R es . 1997, 25(1 :1 6. 3 Stoesser G , Sterk P , T uliM A , et al . T he E M BL N ucleo tide Sequence D atabase . N ucleic A cid R es . 1997, 25(1 :7 13. 4 T ateno Y , Go j obo ri T . DNA D ata Bank of Japan in the age of info rm ati on bi o logy . N ucleic A
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学校音乐班管理制度
- 学生接送点管理制度
- 安全确认制管理制度
- 安服部安全管理制度
- 安置点日常管理制度
- 宗教活动所管理制度
- 实训室各种管理制度
- 实验室采购管理制度
- 客房服务间管理制度
- 室内潜水馆管理制度
- 呼伦贝尔职业技术学院辅导员考试试题2024
- MOOC 电路-常熟理工学院 中国大学慕课答案
- 养老院健康档案模板
- 2024年云南红河州开发投资控股集团有限公司招聘笔试参考题库含答案解析
- 社区组织心理健康知识讲座
- 化工企业安全管理评估手册 依据化工过程安全管理导则AQ3034-2022
- 设备预防性维护保养计划及实施记录表
- 2024年春江苏开放大学机械CADCAM第一次线下过程性考核操作作业答案
- 无损检测PTⅡ级渗透检测理论考试题库
- 档案管理软件简介介绍
- 2024年山东威海文旅发展集团有限公司招聘笔试参考题库含答案解析
评论
0/150
提交评论