同方知网KBase数据库介绍:知识领域需求驱动的数据库探索者_第1页
同方知网KBase数据库介绍:知识领域需求驱动的数据库探索者_第2页
同方知网KBase数据库介绍:知识领域需求驱动的数据库探索者_第3页
同方知网KBase数据库介绍:知识领域需求驱动的数据库探索者_第4页
同方知网KBase数据库介绍:知识领域需求驱动的数据库探索者_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

同方知网KBase数据库介绍知识领域需求驱动的数据库探索者陈琳|同方知网数字出版技术股份有限公司 Chapter01知网简介同方知网同方知网是以数据与技术双轮驱动的知识服务提供商,1995年始创于清华大学,2020年随同方股份加入中核集团,成为中核集团下属成员单位。同方知网致力于全方位、立体化、体系化打通国内国际知识生产、传播和利用的全过程,是数字出版产业与期刊、图书、报纸等各类传统出版产业深度融合发展的开拓者。知网简介-定位与战略企业定位和目标企业目标:建设中国特色、世界一流的学术资源信息平台“12345”战略“12345”战略建设“一个平台”:中国特色、世界一流的学术资源信息平台;实现“两大效益”:社会效益、经济效益;领跑“三条赛道”:数字出版、增值服务、互联网平台;强化“四种能力”:品牌建设、资本运作、国际经营、风险防控;实施“五项工程”:版权固本、数据强基、技术创新、服务增值、平台转型;知网简介-战新业务人工智能同方知网积极融入人工智能产业变革,发布了我国首个专业知识增强的知识服务和科研行业大模型,以全栈自主可控为基础,注入了知网专业知识数据,有效解决了通用大模型可信度低、专业性差、更新时效性低等突出问题,为千行百业的数智化升级赋能。人工智能数据要素同方知网前瞻性布局数据要素产业,持续创建数据要素产业生态合作圈,面向知识资源产业链上下游客户打造集数据资源化、数据产品化、数据资产化于一体的综合服务平台;同时积极开展数据入表、数据治理、数据资产化、数据应用场景、数据交易与流通等服务,加快数据要素产业升级。数据要素Chapter02第二部分KBase介绍KBase介绍研发语言:C/C++同方知网:完全自主知识产权研发周期:20余年研发历程KBase介绍-发展历程版本时间主要特性FTS0.x1997-1998数据库核心、K-SQL解析FTS1.0~3.01999-2002嵌入式数据库、全文检索引擎、表、视图、数值、多编码支持KBase3.02002-2003C/S架构全文检索数据库、企业管理器、向量索引KBase4.02004并行计算、查询分析工具、UNIX(SOLARIS)版、数据迁移工具KBase5.02005-2006网格计算(USP、OpenURL、Z39.50)、数据批量作业、AWE、内存表、检索快照、全切分分词KBase6.02007非结构化数据库管理系统、分布式集群、UNIX(AIX)、ADO.net接口、智能标引工具、关键词分析统计工具KBase7.02008集成搜索引擎、集群客户端接口、词典管理工具、WORD索引、关联检索、文档数据类型KBase8.02009-201064位版本、数据和索引分离、指纹索引、繁简统一、集群查询缓存、数据挖掘脚本化QBE集成、图片检索KBase9.02010-2011排序分组并行计算、多线程索引、性能升级(并行、集群、大内存)KBase10.02012-2013RANK排序、相关查询、Linux版、PHP接口KBase11.02013-2019智能检索引擎、关联表、IOCP+重叠IO网络模型、组合词典、自动刷盘、转义序列、敏感词过滤、读写分离系统、KGuard监控系统、Python接口KBase12.02020-2022国际化升级、数据同步系统、动态客户端负载均衡器、国产化与虚拟化版本、新版Java接口(JNA)、Go语言接口KBase13.02023-2024向量数据库引擎、跨平台管理工具DBKit、融合HFS、语义检索KBase介绍-主要特性:文献检索与全文索引KBase介绍-主要特性:分布式集群•客户端负载均衡器•分布式集群•代理层:不存储数据,负责结果集合•中心节点、副中心负责日志收集和调度KBase介绍-主要特性:读写分离系统自动化、实时性、一致性KBase介绍-NXD数据库引擎KBaseKBaseNXD数据库管理系统是一款创新的数据库产品,专为满足日益增长的XML数据管理需求而设计。它利用XML数据的结构化特性,为用户提供了一个强大且高效的XML数据存储和管理平台。数据库技术的发展在很大程度上受到应用需求与应用场景的推动。数据库技术的发展在很大程度上受到应用需求与应用场景的推动。国产数据库,只有通过大力推广应用才会真正有长足的发展!KBase介绍-RDF数据库引擎RDF在知网节的应用知网节是知识网络节点的简称,它以一篇文献作为节点,围绕这篇文献构建起一个知识网络。关系数据库问题RDF优势•对关联文献分组统计,比图数据KBase介绍-向量数据库引擎随着AI应用的普及,向量检索在包括语义检索、图片搜索、视频搜索、文献推荐、智能问答、AIGC、知识增强等应用场景中都有广泛需求。随着LLM、AIGC的技术发展,向量数据的管理需求更是得到空前释放,同方知网从2023年开始,面向AI,面向大模型,基于KBase打造原生向量数据库系统,建立了AIGC时代的知网数据库技术基座。KBase面向多种不同的向量计算、检索场景,支持各种对应的向量索引算法,实现在单机上,高维向量数据规模为十亿量级时,响应时间达到毫秒级别。KBase介绍-向量数据库引擎知网对向量数据库的共性需求、个性化需求•人工智能应用中向量数据存储和检索技术需求:如论文查重、AI学术助手、AI写作、智能医疗等。•大规模海量文本数据的语义检索需求:段落、全文、篇名、摘要等信息的高性能实时的文本语义检索能力。•多模态数据的检索需求:文本、图片等混合数据的语义检索能力。•混合检索需求:向量数据与非向量数据之间的混合检索能力。•公司主营业务技术支撑,技术发展创新的需要。大模型时代向量数据库的通用需求•大模型的快速应用,推动向量数据库向高扩展、高性能、实时性方向发展。•作为大模型的外部知识库,提高大模型回答的准确性和可靠性,还可广泛应用于推荐系统、自然语言处理等•向量数据库的研发和应用将不断推动人工智能技术的进步,助力各类人工智能应用取得更大的成功。KBase介绍-融合分布式文件系统HFSChapter03第三部分KBase应用领域KBase应用领域政府教育教育企

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论