版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
植物分类学的信息化工具提
纲1、分类学信息化的缘起2、生物多样性信息学的概念与学科架构
3、重要信息平台介绍4、分类学数据管理工具5、e-Science
软件工具研发6、人工智能及未来技术趋势1.
分类学信息化的缘起中科院昆明植物所
iFlora
战略
2012年分类学信息化的起步与发展
2004年20182001年GBIF全球生物多样性信息网络中科院标本馆网络工程项目
2000年(美国国家级的标本信息平台)
2011年BoL
(Barcode
od
Life)生命条码生物名录ToL
(Tree
of
Life)
1994年首届全国生物多样性信息学会议
2009年2008年全球生命大百科2007年2007年科学研究的范式革命•在科学研究上,从经典分类学、细胞生物学、分子生物学、
组学研究,数据
的深度与广度不断强化,数据的体量也越来越大。科研已经走向了数据密集
型的第四范式,数据平台与信息技术成为最基础的条件。分类学面临的挑战与历史机遇
A、分类学的危机从信息的角度看,经典分类学的信息提供能力与数据质量
存在严重不足。对整个科学大厦的服务与支撑能力日渐微
弱。研究范式落后其他学科。B、信息化时代的机遇但分类学价值并没有改变,大量的问题仍需分类学来解决,
分类学依然是最为基础的学科。信息化带来了信息采集与
加工能力的大幅度提升,使得数据整合变得容易,依赖于
大数据,人们绘制地球生物的时空图谱的希望变为可能。
这为分类学提供了新的机会。实例:Kew
的新科学战略战略一:研究与记录全球植物与菌物
的多样性,以及它们对人类的用途战略二:基于邱园无与伦比的全球收
藏资源,管理、提供丰富的科学
数据
凭证战略三:传播植物与真菌的科学知识,
实现对科学、教育、保护政策和
管理
等方面影响力的最大化Kew
的研究焦点:
植物及菌物的多样性研究与记录馆藏收集社会传播1、世界植物在线门户2、世界植物现状报告3、热带重点植物分布区4、生命之树5、世界种子银行6、有用植物与菌物门户网7、典藏数字化8、下一代植物及菌物科学家培训计划
9、植物园科普生物多样性
信息学与空间分析组√√√√√√√√重点项目的团队合作(注
:√表示参与)植物及菌物
的比较生物采集与馆藏
组鉴定与命名
组保育生物学
组自然资本与
植物健康组学组世界植物在线门户世界植物现状报告热带重点植物分布区植物与菌物的生命之树
世界种子银行有用植物与菌物门户网
典藏数字化下一代植物及菌物科学家
培训计划植物园科普√
√
√
√
√
√
√
√
√√
√
√
√√
√
√√
√
√√
√
√
√√
√
√√
√
√
√
√√
√
√
√
√信息化对分类学意义◆◆◆必由之路:
数据密集型科学时代的必然选择,所以不要拒绝
工具,不要拒绝App,不要拒绝在线合作希望之路
:
信息化本身提供了很多的机会。例如常规的工作
变换了信息化手段就是创新。网络社会也带来了科普的重大利好。变革之路
:
我们的研究方法将产生根本性的改变。大数据变
得可能,因此对数据处理将成为极为重要的基础能力。2.生物多样性信息学
的概念与学科架构Biodiversity
Informatics•
生物多样性信息学
Biodiversity
Informatics上世纪70年代启蒙,92年被提出,2000以后被学界接受。
2000年
Science
组织专栏,连发5篇文章介绍2009年6月2009年8月第一次国际盛会(69个国家,500名代表)
中国首届生物多样性信息学研讨会(
2013年9月13,第三届BI会议在辰山植物园召开)生物多样性信息学的主要问题WFO
世界植物志在线项目启动/主要研究方向中科院植物所,生物多样性委员会
NSII
国家标本平台CVH
中国数字植物标本馆CFH
中国自然标本馆PPBC
中国植物图像库CNPC
中国高等植物信息系统COL-ChinaEOL-ChinaBHL-ChinaABCD
亚洲生物多样性保护和数据库网络中科院昆明植物所
—
iFlora
战略
“智能植物志”(iFlora)是指将现代植物学、DNA测序技术与信息技术相结合,通过系列关键技术的集成和攻关,构建便捷、准确识别植物和掌握相关数字化信息的新一代“智能植物志”(或智能装置)生物多样性软件工具开发中国动物信息网中国生物物种名录(动物部分)
生物标本地理信息管理系统
动物信息集成系统物种潜在分布地预测系统动物行为记录软件期刊文献全文共享管理系统
动物疫病网蝴蝶图像在线鉴定系统昆虫目级阶元标本图像自动鉴定系统微生物领域云中科院微生物研究所以中科院应用微生物研究网络、全国科学院联盟应用微
生物分会
和
世界微生物数据中心
等基础,建立一个整
合的微生物领域云:⚫
促进数据积累、挖掘和共享⚫
解决数据和计算为核心的重要科学问题
⚫
开发服务于微生物学家的个性化信息服务探索出一条利用云技术,全面切入并促进从资源到产业
的科研创新价值链的新模式。Biodiversity
Informatics
学科构架理解证据数据文化3.
重要信息平台介绍Biodiversity
Informatics
学科构架理解证据数据文化/dwca-validator//dwca-assistant/
/nameparser/
/白宫
Office
of
Science
and
Technology
Policy
要求
自
2013
年起所有公开预算⽀支持/科技部要求科学数据必须共享/自然科学基金支持的论文必须开放共享有关生物多样性的综合性门户网络平台:EOL
实作了物种数据的管理平台,让数据可被
志愿的管理者审
阅。所有人的贡献皆公开显示
在个人的档案⻚页面。///Home.aspx物种名录、志书GBIF
Web
API
/developer/summary//access/390
Million
Specimens4.1
Million
Type
Specimens11
TAFs
(Taxonomic
Access
Facilities)欧盟国家分类学集成网站/main/species/NCBIEBI重要的生物信息学中心National
Center
for
Biotechnology
Information
(US)
European
Bioinformatics
Institute
(EU)www.ebi.ac.ukDDBJ
DNA
Data
Bank
of
Japan
(JP)
www.ddbj.nig.ac.jpExPASy
Expert
of
Protein
Analysis
System
(Switzerland
)www.expasy.chPDB
Protein
Data
Bank
(US)/pdb/CBIPKU
北京大学生物信息中心
(CN)/chinese/BioSino
中国生物信息中心
(CN
)生物信息学数据库EMBL、GenBank和DDBJ是国际上三大主要核酸序列数据库EMBL
http://www.edi.ac.uk/ebi_docs/embi_db/edi/topembl.htmlDDBJ
http://www.ddbj.nig.ac.jp/GenBank
/Web/Genbank/其他重要的序列库DbEST
http://www//dbEST/GSDB
/gsdb/SGD
/Saccharomyces/
UniGene
/UniGene/TDB
/tdb/tdb.htmlAceDB
http://www.sanger.ac.uk/Software/Acedb/Webace
http://webace.sanger.ac.uk/国内:华大基因
/index生物信息学常用软件生物信息数据的检索工具——Entrez文献的检索与管理软件——Reference
manager
序列同源搜索分析工具——Blast核酸、蛋白质序列比对分析软件——DS
gene\DNASIS
生物大分子空间三维结构显示与分析软件——Rasmol
生物图像对比分析软件——Scion
Image
(NIH
image)
生物科学数据处理软件——Origin2012年7月12日,华大基因和生物医学中心
(BioMed
Central)宣布其共同创办的生物
学期刊《GigaScience》首刊正式发行DELTA
System/lep/hints.htm/tree//pages/1156278/overview/apiALA.au/Virtual
Biodiversity
Researchand
Access
Network
forTaxonomySupporting
biodiversityresearchcommunities!http://www.biovel.eu/web-services/ModEco:物种分布分析与建模/ModEco/MaxEnt:基于最大熵理论的物种生境分布预测
/~schapire/maxent/DesktopGARP:物种分布预测模型
/desktopgarp/OpenModeller:
跨平台的生态位模型工具
/
核心网络GBIF
全球最大的标本数据库,免费下载
TPL
/
植物名称审核最权威的名录
IPNI
/
全球植物名称索引(名称文献最全)
EOL
生命大百科(集成信息最全面)BHL
/
生物多样性历史文献库
COL
/
生物名录(最全面)NSIICVHCFHPPBC
国家标本平台(中国标本最全面)
中国数字植物标本馆(中国植物标本)
中国自然标本馆(野外考察数据管理)
中国植物图像库(审核过的植物图像库)ColChina
/
物种2000中国节点4.
分类学数据管理技能分类学数据管理技能1、野外调查与图库管理(CFH)
2、标本数据查询(NSII)3、常用数据格式与软件介绍
4、名称批量校对5、植物志编译6、植物名录与植物志编辑系统
7、社区共享与数据论文3、常用数据格式与软件介绍
⚫平面文件
(flat-file)重点是要知道:
数据怎样进行导入导出–
txt,csv–
纯文本,数据结构依靠特殊标记由软件解析⚫关系数据库
(relational
DB)–
基于实体联系模型
(E-R模型)–
表中的记录(record/tuple)键唯一确定–
表之间通过外键建立联系–
有通用的标准:SQL–
Excel、
Access、
Sqlite
、MySQL、SQL
Server、Oracle
⚫数据交换文件格式–
XML、JSON、YAML4.
名录自动校对:/App/NameChecker/植物名称批量校对/BioBook/ParseNames.aspx
植物学名校对工具•
Taxonomic
Name
Resolution
Service
(分类学名称解析系统,
TNRS)依据的数据源为Tropicos,
Global
Compositae
Checklist(/compositaeweb/
),
USDA
Plants(/java/)和NCBI
Taxonomy(/Taxonomy/)。登录网站http:///TNRSapp.html/使用•
Plantminer
(植物名称校对者)依据的数据源为Tropicos,
World
Checklist
of
Selected
Plant
Families
(WCSP)
(/wcsp/)和The
Plant
List
(
Carvalho
et
al.,
2010)。打开
/,使用Email接受结果•
Taxonstand
(学名标准化软件包)Taxonstand是一个R软件包,
它依据The
Plant
List的数据进行名录比对,
校正错误
名称,
给出名称所在的科、相应的接受名和命名人。➢
install.packages
("Taxonstand")/article/2015/1005-0094-23-2-252.html5、植物志编译系统///目前支持的特性:•••••••••••自动识别
Excel
电子表格识别常见的列表头,自动关联到植物志属性字段植物名称自动识别,支持中名、学名根据Excel表格生成植物志网页批量生成学名索引、中文名称笔画索引、中文拼音索引网页批量处理照片(声称缩略图、缩放图)自动识别照片名称中的物种信息,并按科、属、种的拉丁名生成目录,分
类整理照片物种照片与物种网页自动关联网页模版可以替换、定制生成可切换分类系统的物种树修改Excel表格、照片后,一键发布重新生成即可更新6.
植物名录与植物志编辑系统•
实例:•
PVH
与
校园网网站系列•
名录管理功能:Excel
名录表格上传,批量导入后台
的MySQL数据库,前端Web页面实现名录的逐条编
辑功能•
植物志编辑系统:采用Wiki机制,保留历史版本,支
持地图功能,自动超链接,Markdown格式支持。GBIF的典型大数据特征:•4亿条记录,450个数据提供者,1万多个数据集•100多万个物种名称•特点和关键数据的缺乏:濒危种、入侵种•只有58%以上的物种有1条以上的地标化记录(0.1度网格)
•22%以下的物种有10条以上的地标化记录(0.1度网格)•6%的物种有100条以上的记录7.
社区共享与数据论文发表数据论文是数据共享的有效途径如何发表数据论文?•
GBIF官网:
ttp:///publishingdata/datapapers•
林永昌鼓励发表「资料论文」是促进生物多样性数
据公开分享的有效策略
(PDF)C、参与公民科学,以众包开展大规模研究5.
e-Science
软件工具研发1.
网络信息资源搜集2.
虚拟工作组(群组)3.
数字标本馆4.
野外考察图像处理5.
自然笔记App6.
活植物管理系统7.
园丁笔记App8.
自然保护区生物资源管理系统
9.
植物志网站编译系统10.
植物志电子书编译打包系统www.iBe-Science软件工具研发•国内唯一支持无限二级域名•可以创建生物多样性网站的平台
•具备Wiki
方式植物志编辑•具备名录管理•具备图库管理•具备完整的用户社区管理•(用户可以创建群组)•(群内自建角色系统)•(跨域的单点登录系统)•(具备网站二次开发与扩展能力)专业软件工具库人工搜集网址Spider爬行采集生物多样性信息
导航网站知识分析与抽取人工知识校对用户收藏网址生物多样性
搜索引擎人工整理基础库多终端访问
(Web+桌面+移动)互联网生物多样性
信息源数据库基础库
(物种、地理)生物多样性
本体知识库生物多样性
网络资源库索引库专题标本库专题图像库数字化文献库电子志书名录专题应用面向用户的个性化生物多样性e-Science工作平台植物志编撰系统与案例课题、研究专题门户网站创建系统
野外考察技术体系活植物管理系统注册会员
>680物种信息
>
500万条
地理地标信息
>
700万
集成
CPNI
2.0
TPL
COL
COL-China2013
API集成
GBIF
EOL
BHL
IPNI
CFH搜索搜索
中国植物志,CNKI集成搜索系统上线(软件著作权)1.
信息资源搜集保藏1、图像截屏、图像快速上传、保存
2、文章摘录3、群组讨论4、自建栏目,组织信息5、QQ群组对接2.
虚拟工作组(群组)3.
数字标本馆标本馆:
26家标本记录:
5,382,935
条
标本照片:
2,867,661
张标本管理模块功能体系•
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年租赁展览设备合同
- 2024年高品质铝合金门套安装工程合同范本3篇
- 2025年国际贸易合同标的包装材料环保认证协议3篇
- 2025年度木地板品牌新品研发与上市合作合同3篇
- 2024年货车租赁协议(含保险条款)
- 2024云南光伏扶贫项目设计施工与扶贫资金管理合同3篇
- 2024年甲方与乙方就新能源项目研发合作之合同
- 2025版政府机关办公家具采购与服务合同3篇
- 二零二五年度个人房产买卖合同范本15篇
- 2024年车辆抵押贷款协议样本版B版
- 肌骨超声简介
- 神经外科临床实习教学计划
- 基本光刻工艺流程
- 胸腔闭式引流护理-2023年中华护理学会团体标准
- 高中体育足球教学教案 全册
- 艺术概论PPT完整全套教学课件
- 社团啦啦操训练计划
- 2023-2024学年四川省雅安市小学语文二年级期末评估试题详细参考答案解析
- UPS维护保养检查表
- 英语人教新目标七年级上册微课PPT
- 2023年安全生产先进集体申报表
评论
0/150
提交评论