大数据环境下的文献分析与利用课件_第1页
大数据环境下的文献分析与利用课件_第2页
大数据环境下的文献分析与利用课件_第3页
大数据环境下的文献分析与利用课件_第4页
大数据环境下的文献分析与利用课件_第5页
已阅读5页,还剩87页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大数据环境下的文献分析与利用叶艳鸣2019·10大数据环境下的文献分析与利用一、几点认识一、几点认识大数据的海啸——巨量信息43,600,000条结果大数据的海啸——巨量信息43,600,000条结果大数据的海啸大数据的海啸大数据时代的四个特征大数据时代的四个特征苹果AppStore应用商店每天下载4600万款应用新浪微博用户每日发博量超过1亿条百度每日处理的搜索量超过了50亿Facebook每天处理的数据量(2019年):处理27亿次Like按钮点击。上传3亿张图片。吸收逾500TB新数据。一组数据苹果AppStore应用商店每天下载4600万款应用Fac国际数据公司(IDC)的研究结果表明:2019年全球产生的数据量为0.49ZB2009年的数据量为0.8ZB2019年增长为1.2ZB2019年的数量更是高达1.82ZB相当于全球每人产生200GB以上的数据而到2019年为止人类生产的所有印刷材料的数据量是200PB全人类历史上说过的所有话的数据量大约是5EBIBM的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了2020年,全世界所产生的数据规模将达到今天的44倍。国际数据公司(IDC)的研究结果表明:大数据时代的四个特征大数据时代的四个特征各种结构化与非结构化数据各种结构化与非结构化数据大数据时代的四个特征大数据时代的四个特征基因组数据地理空间数据人口数据经济运行数据卫星遥感数据……基因组数据大数据时代的四个特征大数据时代的四个特征气象数据航天遥测遥控数据交通流量数据地震监测数据……气象数据14大数据的阶梯处理过程模型多阶段流水处理模型:数据清理数据集成数据仓库任务相关数据选择数据挖掘模式评估knowledge14大数据的阶梯处理过程模型多阶段流水处理模型:数据清理数主要技术说明内容管理技术数据建模技术、版本控制技术、检索技术、文件路由技术等文档管理技术分类归档、外部特征管理、关键词管理信息提取技术人工智能技术、Bayesian概率和词频统计分析、向量空间模型信息过滤技术固定文章集法、协作过滤技术文本挖掘利用智能算法,并结合文字处理技术,分析大量的非结构化文本源数据仓库在线分析处理(OLAP)、在线事务处理(OLTP)分类技术决策树、贝叶斯方法、神经网络、遗传算法、粗糙集和实例推理(CBR)等。聚类技术统计分析方法、模糊逻辑、最近邻技术、规则归纳bookmark智能化网络信息服务系统根本原因分析它是一种回溯性失误分析工具云模型解决数据挖掘中的知识表示问题可视化技术几何投射技术、基于图标技术、面向像素的技术、层次技术、基于图表技术主要的知识发现技术主要技术说明内容管理技术数据建模技术、版本控制技术、检索技术基于文献的知识发现原理与技术基于文献的知识发现基于相关文献的知识发现基于非相关文献的知识发现基于全文献的知识发现共词分析理论与方法共引分析理论与方法Swanson理论与方法文本挖掘理论与方法资料来源:冷伏海《基于文献的知识发现的应用进展研究》基于文献的知识发现原理与技术基基于相关文献的基于非相关文献的大数据的开发路径BigdataMatadataLinkdata大数据的开发路径BigdataMataLinkdata知识发现进阶知识发现进阶二、“大数据”困局的破解之道二、“大数据”困局的破解之道由《易经》想到的:《易经》道:“易”有三易:简易变易不易由《易经》想到的:《易经》道:“易”有三易:简易:万事万物都是非常简单的,大道至简《周易·系辞上》:易有太极,是生两仪,两仪生四象,四象生八卦现代计算机之“0、1”世界《易经》之简易简易:万事万物都是非常简单的,大道至简《易经》之简易变易:宇宙万物,时刻变化,人事皆是如此《周易·系辞上》:知变化之道者,其知神之所为乎?《易经》之变易变易:宇宙万物,时刻变化,人事皆是如此《易经》之变易不易:变的规律本身是相对不变的,是相对静止和相对稳定的,是可以感知的《周易·系辞上》:易无思也,无位也,寂然不动,感而遂通天下之故《易经》之不易不易:变的规律本身是相对不变的,是相对静止和相对稳定的,是可岩刻、结绳记事、文字起源远古人类应对“大数据”之路径实体世界

符号化符号化复杂简化岩刻、结绳记事、远古人类应对“大数据”之路径实体世界

日出云端与“旦”字的产生喂…有好“大”一片树林呀

信息的标识:实物→图画→象形文字日出云端与“旦”字的产生喂…有好“大”一符号的产生:虚拟世界的起源人与自然区分的分水岭符号的产生:虚拟世界的起源人与自然区分的分水岭语言、书籍、通信知识体系起源古代信息世界

符号化知识体系复杂简化人类应对“大数据”之路径语言、书籍、通信古代信息世界符号化知识体系复杂大数据环境下的文献分析与利用课件近代-现代藏书体系

符号化目录体系复杂简化书、报、刊、学位论文、标准、专利……目录学起源人类应对“大数据”之路径近代-藏书体系符号化目录体系复杂目录系统OPAC系统目录系统OPAC系统新世纪大数据

符号化LinkedData复杂简化数字化、网络化大数据时代来临人类应对“大数据”之路径新世纪大数据符号化LinkedData复杂《易经》思想给出的“大数据”困境破解之道《易经》思想给出的大数据环境下的文献分析与利用课件三、基于知识挖掘的文献分析与利用——以基因组研究为例三、基于知识挖掘的文献分析与利用1、纵观全局的动态调研1、纵观全局的动态调研研究概貌315,264条研究概貌315,264条研究概貌研究概貌研究概貌研究概貌2、研究关联性分析(热点追踪)2、研究关联性分析(热点追踪)主要研究领域(关键词分析)主要研究领域(关键词分析)研究相关性追踪研究相关性追踪不同时期研究热点变化追踪2019-2019年2019-2019年不同时期研究热点变化追踪2019-2019年2019-2013、研究关联性分析(时间序列)3、研究关联性分析(时间序列)研究继承性追踪研究继承性追踪研究继承性追踪(引用)研究继承性追踪(引用)4、重要成果追踪(竞争情报)4、重要成果追踪(竞争情报)特定研究者追踪(专家)特定研究者追踪(专家)特定研究者追踪(主要成果)特定研究者追踪(主要成果)特定研究者追踪研究重点与方向合作团队特定研究者追踪研究重点与方向合作团队特定研究者追踪特定研究者追踪特定文献分析—图书特定文献分析—图书5、特定文献分析5、特定文献分析特定文献分析—最新成果特定文献分析—最新成果特定文献分析—早期研究1966年就有了基因组研究特定文献分析—早期研究1966年就有了特定文献分析—影响力最大的图书特定文献分析—影响力最大的图书特定文献分析—期刊论文特定文献分析—期刊论文特定文献分析—最具影响的期刊论文特定文献分析—最具影响的期刊论文特定文献分析—CSCD期刊论文特定文献分析—CSCD期刊论文特定文献分析—SCI期刊论文特定文献分析—SCI期刊论文特定文献分析—学位论文特定文献分析—学位论文特定文献分析—学位论文特定文献分析—学位论文特定文献分析—学位论文特定文献分析—学位论文特定文献分析—标准特定文献分析—标准特定文献分析—专利特定文献分析—专利关键词:禽流感不同文献敏感度关键词:禽流感不同文献敏感度关键词:禽流感不同文献敏感度关键词:禽流感不同文献敏感度竞争态势分析竞争态势分析6、机构研究能力评价分析6、机构研究能力评价分析学术产出评价—天津职业技术师范大学学术产出评价—天津职业技术师范大学学术产出评价—天津职业技术师范大学学术产出评价—天津职业技术师范大学学术产出评价—高产学者、高影响力成果戴怡(27)周明星(23)王仲民(22)张学英(20)张兴会(20)赵丽(15)关志伟(15)蓝欣(15)郑宏兴(15)曹晔(14)学术产出评价—高产学者、高影响力成果戴怡(27)五、基于发现的自助文献服务五、基于发现的自助文献服务云南财经大学发表的关于“云南或者昆明的区域经济”文献专题推送此公式检索结果58篇文献云南财经大学发表的关于“云南或者昆明的区域经济”文献专题推送检索:系统动力学社会化服务检索:系统动力学社会化服务检索系统动力学收藏到学习空间点击保存去我的收藏检索系统动力学收藏到学习空间点击保存去我的收藏大数据环境下的文献分析与利用课件分享分享到新浪微博分享分享到新浪微博大数据环境下的文献分析与利用课件OPAC:本馆纸书数据库:

书世界、CNKI、万方、超星书、方正….读秀:

图书补缺百链:

期刊等文献补缺发现系统无缝对接的全文服务功能OPAC:本馆纸书数据库:书世界、CNKI、万方、超星书数据库云共享服务读秀数据库云共享服务读秀六、文献利用行为分析六、文献利用行为分析大数据环境下的文献分析与利用课件数据库使用量数据库使用量学科使用量统计学科使用量统计图书馆是一个生长的有机体——阮冈纳赞(印度)图书馆是一个生长的有机体每一次信息技术进步都极大地推动了科学技术的飞跃发展大数据环境下的文献分析与利用课件知识发现为科技创新插上飞翔的翅膀大数据环境下的文献分析与利用课件谢谢谢谢知识发现为科技创新插上飞翔的翅膀大数据环境下的文献分析与利用课件周明星(65)戴怡(46)郑宏兴(42)王仲民(39)张兴会(35)张学英(32)蓝欣(30)孟庆国(28)关志伟(28)刘晓(2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论