植物分类学的信息化工具_第1页
植物分类学的信息化工具_第2页
植物分类学的信息化工具_第3页
植物分类学的信息化工具_第4页
植物分类学的信息化工具_第5页
已阅读5页,还剩137页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

植物分类学的信息化工具提

纲1、分类学信息化的缘起2、生物多样性信息学的概念与学科架构

3、重要信息平台介绍4、分类学数据管理工具5、e-Science

软件工具研发6、人工智能及未来技术趋势1.

分类学信息化的缘起中科院昆明植物所

iFlora

战略

2012年分类学信息化的起步与发展

2004年20182001年GBIF全球生物多样性信息网络中科院标本馆网络工程项目

2000年(美国国家级的标本信息平台)

2011年BoL

(Barcode

od

Life)生命条码生物名录ToL

(Tree

of

Life)

1994年首届全国生物多样性信息学会议

2009年2008年全球生命大百科2007年2007年科学研究的范式革命•在科学研究上,从经典分类学、细胞生物学、分子生物学、

组学研究,数据

的深度与广度不断强化,数据的体量也越来越大。科研已经走向了数据密集

型的第四范式,数据平台与信息技术成为最基础的条件。分类学面临的挑战与历史机遇

A、分类学的危机从信息的角度看,经典分类学的信息提供能力与数据质量

存在严重不足。对整个科学大厦的服务与支撑能力日渐微

弱。研究范式落后其他学科。B、信息化时代的机遇但分类学价值并没有改变,大量的问题仍需分类学来解决,

分类学依然是最为基础的学科。信息化带来了信息采集与

加工能力的大幅度提升,使得数据整合变得容易,依赖于

大数据,人们绘制地球生物的时空图谱的希望变为可能。

这为分类学提供了新的机会。实例:Kew

的新科学战略战略一:研究与记录全球植物与菌物

的多样性,以及它们对人类的用途战略二:基于邱园无与伦比的全球收

藏资源,管理、提供丰富的科学

数据

凭证战略三:传播植物与真菌的科学知识,

实现对科学、教育、保护政策和

管理

等方面影响力的最大化Kew

的研究焦点:

植物及菌物的多样性研究与记录馆藏收集社会传播1、世界植物在线门户2、世界植物现状报告3、热带重点植物分布区4、生命之树5、世界种子银行6、有用植物与菌物门户网7、典藏数字化8、下一代植物及菌物科学家培训计划

9、植物园科普生物多样性

信息学与空间分析组√√√√√√√√重点项目的团队合作(注

:√表示参与)植物及菌物

的比较生物采集与馆藏

组鉴定与命名

组保育生物学

组自然资本与

植物健康组学组世界植物在线门户世界植物现状报告热带重点植物分布区植物与菌物的生命之树

世界种子银行有用植物与菌物门户网

典藏数字化下一代植物及菌物科学家

培训计划植物园科普√

√√

√√

√√

√√

√√

√√

√√

√信息化对分类学意义◆◆◆必由之路:

数据密集型科学时代的必然选择,所以不要拒绝

工具,不要拒绝App,不要拒绝在线合作希望之路

信息化本身提供了很多的机会。例如常规的工作

变换了信息化手段就是创新。网络社会也带来了科普的重大利好。变革之路

我们的研究方法将产生根本性的改变。大数据变

得可能,因此对数据处理将成为极为重要的基础能力。2.生物多样性信息学

的概念与学科架构Biodiversity

Informatics•

生物多样性信息学

Biodiversity

Informatics上世纪70年代启蒙,92年被提出,2000以后被学界接受。

2000年

Science

组织专栏,连发5篇文章介绍2009年6月2009年8月第一次国际盛会(69个国家,500名代表)

中国首届生物多样性信息学研讨会(

2013年9月13,第三届BI会议在辰山植物园召开)生物多样性信息学的主要问题WFO

世界植物志在线项目启动/主要研究方向中科院植物所,生物多样性委员会

NSII

国家标本平台CVH

中国数字植物标本馆CFH

中国自然标本馆PPBC

中国植物图像库CNPC

中国高等植物信息系统COL-ChinaEOL-ChinaBHL-ChinaABCD

亚洲生物多样性保护和数据库网络中科院昆明植物所

iFlora

战略

“智能植物志”(iFlora)是指将现代植物学、DNA测序技术与信息技术相结合,通过系列关键技术的集成和攻关,构建便捷、准确识别植物和掌握相关数字化信息的新一代“智能植物志”(或智能装置)生物多样性软件工具开发中国动物信息网中国生物物种名录(动物部分)

生物标本地理信息管理系统

动物信息集成系统物种潜在分布地预测系统动物行为记录软件期刊文献全文共享管理系统

动物疫病网蝴蝶图像在线鉴定系统昆虫目级阶元标本图像自动鉴定系统微生物领域云中科院微生物研究所以中科院应用微生物研究网络、全国科学院联盟应用微

生物分会

世界微生物数据中心

等基础,建立一个整

合的微生物领域云:⚫

促进数据积累、挖掘和共享⚫

解决数据和计算为核心的重要科学问题

开发服务于微生物学家的个性化信息服务探索出一条利用云技术,全面切入并促进从资源到产业

的科研创新价值链的新模式。Biodiversity

Informatics

学科构架理解证据数据文化3.

重要信息平台介绍Biodiversity

Informatics

学科构架理解证据数据文化/dwca-validator//dwca-assistant/

/nameparser/

/白宫

Office

of

Science

and

Technology

Policy

要求

2013

年起所有公开预算⽀支持/科技部要求科学数据必须共享/自然科学基金支持的论文必须开放共享有关生物多样性的综合性门户网络平台:EOL

实作了物种数据的管理平台,让数据可被

志愿的管理者审

阅。所有人的贡献皆公开显示

在个人的档案⻚页面。///Home.aspx物种名录、志书GBIF

Web

API

/developer/summary//access/390

Million

Specimens4.1

Million

Type

Specimens11

TAFs

(Taxonomic

Access

Facilities)欧盟国家分类学集成网站/main/species/NCBIEBI重要的生物信息学中心National

Center

for

Biotechnology

Information

(US)

European

Bioinformatics

Institute

(EU)www.ebi.ac.ukDDBJ

DNA

Data

Bank

of

Japan

(JP)

www.ddbj.nig.ac.jpExPASy

Expert

of

Protein

Analysis

System

(Switzerland

)www.expasy.chPDB

Protein

Data

Bank

(US)/pdb/CBIPKU

北京大学生物信息中心

(CN)/chinese/BioSino

中国生物信息中心

(CN

)生物信息学数据库EMBL、GenBank和DDBJ是国际上三大主要核酸序列数据库EMBL

http://www.edi.ac.uk/ebi_docs/embi_db/edi/topembl.htmlDDBJ

http://www.ddbj.nig.ac.jp/GenBank

/Web/Genbank/其他重要的序列库DbEST

http://www//dbEST/GSDB

/gsdb/SGD

/Saccharomyces/

UniGene

/UniGene/TDB

/tdb/tdb.htmlAceDB

http://www.sanger.ac.uk/Software/Acedb/Webace

http://webace.sanger.ac.uk/国内:华大基因

/index生物信息学常用软件生物信息数据的检索工具——Entrez文献的检索与管理软件——Reference

manager

序列同源搜索分析工具——Blast核酸、蛋白质序列比对分析软件——DS

gene\DNASIS

生物大分子空间三维结构显示与分析软件——Rasmol

生物图像对比分析软件——Scion

Image

(NIH

image)

生物科学数据处理软件——Origin2012年7月12日,华大基因和生物医学中心

(BioMed

Central)宣布其共同创办的生物

学期刊《GigaScience》首刊正式发行DELTA

System/lep/hints.htm/tree//pages/1156278/overview/apiALA.au/Virtual

Biodiversity

Researchand

Access

Network

forTaxonomySupporting

biodiversityresearchcommunities!http://www.biovel.eu/web-services/ModEco:物种分布分析与建模/ModEco/MaxEnt:基于最大熵理论的物种生境分布预测

/~schapire/maxent/DesktopGARP:物种分布预测模型

/desktopgarp/OpenModeller:

跨平台的生态位模型工具

/

核心网络GBIF

全球最大的标本数据库,免费下载

TPL

/

植物名称审核最权威的名录

IPNI

/

全球植物名称索引(名称文献最全)

EOL

生命大百科(集成信息最全面)BHL

/

生物多样性历史文献库

COL

/

生物名录(最全面)NSIICVHCFHPPBC

国家标本平台(中国标本最全面)

中国数字植物标本馆(中国植物标本)

中国自然标本馆(野外考察数据管理)

中国植物图像库(审核过的植物图像库)ColChina

/

物种2000中国节点4.

分类学数据管理技能分类学数据管理技能1、野外调查与图库管理(CFH)

2、标本数据查询(NSII)3、常用数据格式与软件介绍

4、名称批量校对5、植物志编译6、植物名录与植物志编辑系统

7、社区共享与数据论文3、常用数据格式与软件介绍

⚫平面文件

(flat-file)重点是要知道:

数据怎样进行导入导出–

txt,csv–

纯文本,数据结构依靠特殊标记由软件解析⚫关系数据库

(relational

DB)–

基于实体联系模型

(E-R模型)–

表中的记录(record/tuple)键唯一确定–

表之间通过外键建立联系–

有通用的标准:SQL–

Excel、

Access、

Sqlite

、MySQL、SQL

Server、Oracle

⚫数据交换文件格式–

XML、JSON、YAML4.

名录自动校对:/App/NameChecker/植物名称批量校对/BioBook/ParseNames.aspx

植物学名校对工具•

Taxonomic

Name

Resolution

Service

(分类学名称解析系统,

TNRS)依据的数据源为Tropicos,

Global

Compositae

Checklist(/compositaeweb/

),

USDA

Plants(/java/)和NCBI

Taxonomy(/Taxonomy/)。登录网站http:///TNRSapp.html/使用•

Plantminer

(植物名称校对者)依据的数据源为Tropicos,

World

Checklist

of

Selected

Plant

Families

(WCSP)

(/wcsp/)和The

Plant

List

(

Carvalho

et

al.,

2010)。打开

/,使用Email接受结果•

Taxonstand

(学名标准化软件包)Taxonstand是一个R软件包,

它依据The

Plant

List的数据进行名录比对,

校正错误

名称,

给出名称所在的科、相应的接受名和命名人。➢

install.packages

("Taxonstand")/article/2015/1005-0094-23-2-252.html5、植物志编译系统///目前支持的特性:•••••••••••自动识别

Excel

电子表格识别常见的列表头,自动关联到植物志属性字段植物名称自动识别,支持中名、学名根据Excel表格生成植物志网页批量生成学名索引、中文名称笔画索引、中文拼音索引网页批量处理照片(声称缩略图、缩放图)自动识别照片名称中的物种信息,并按科、属、种的拉丁名生成目录,分

类整理照片物种照片与物种网页自动关联网页模版可以替换、定制生成可切换分类系统的物种树修改Excel表格、照片后,一键发布重新生成即可更新6.

植物名录与植物志编辑系统•

实例:•

PVH

校园网网站系列•

名录管理功能:Excel

名录表格上传,批量导入后台

的MySQL数据库,前端Web页面实现名录的逐条编

辑功能•

植物志编辑系统:采用Wiki机制,保留历史版本,支

持地图功能,自动超链接,Markdown格式支持。GBIF的典型大数据特征:•4亿条记录,450个数据提供者,1万多个数据集•100多万个物种名称•特点和关键数据的缺乏:濒危种、入侵种•只有58%以上的物种有1条以上的地标化记录(0.1度网格)

•22%以下的物种有10条以上的地标化记录(0.1度网格)•6%的物种有100条以上的记录7.

社区共享与数据论文发表数据论文是数据共享的有效途径如何发表数据论文?•

GBIF官网:

ttp:///publishingdata/datapapers•

林永昌鼓励发表「资料论文」是促进生物多样性数

据公开分享的有效策略

(PDF)C、参与公民科学,以众包开展大规模研究5.

e-Science

软件工具研发1.

网络信息资源搜集2.

虚拟工作组(群组)3.

数字标本馆4.

野外考察图像处理5.

自然笔记App6.

活植物管理系统7.

园丁笔记App8.

自然保护区生物资源管理系统

9.

植物志网站编译系统10.

植物志电子书编译打包系统www.iBe-Science软件工具研发•国内唯一支持无限二级域名•可以创建生物多样性网站的平台

•具备Wiki

方式植物志编辑•具备名录管理•具备图库管理•具备完整的用户社区管理•(用户可以创建群组)•(群内自建角色系统)•(跨域的单点登录系统)•(具备网站二次开发与扩展能力)专业软件工具库人工搜集网址Spider爬行采集生物多样性信息

导航网站知识分析与抽取人工知识校对用户收藏网址生物多样性

搜索引擎人工整理基础库多终端访问

(Web+桌面+移动)互联网生物多样性

信息源数据库基础库

(物种、地理)生物多样性

本体知识库生物多样性

网络资源库索引库专题标本库专题图像库数字化文献库电子志书名录专题应用面向用户的个性化生物多样性e-Science工作平台植物志编撰系统与案例课题、研究专题门户网站创建系统

野外考察技术体系活植物管理系统注册会员

>680物种信息

>

500万条

地理地标信息

>

700万

集成

CPNI

2.0

TPL

COL

COL-China2013

API集成

GBIF

EOL

BHL

IPNI

CFH搜索搜索

中国植物志,CNKI集成搜索系统上线(软件著作权)1.

信息资源搜集保藏1、图像截屏、图像快速上传、保存

2、文章摘录3、群组讨论4、自建栏目,组织信息5、QQ群组对接2.

虚拟工作组(群组)3.

数字标本馆标本馆:

26家标本记录:

5,382,935

标本照片:

2,867,661

张标本管理模块功能体系•

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论