![朱洁-大模型时代数据库技术创新_第1页](http://file4.renrendoc.com/view2/M00/22/1E/wKhkFmaYYr6AA_oQAAB_WUjT3gc676.jpg)
![朱洁-大模型时代数据库技术创新_第2页](http://file4.renrendoc.com/view2/M00/22/1E/wKhkFmaYYr6AA_oQAAB_WUjT3gc6762.jpg)
![朱洁-大模型时代数据库技术创新_第3页](http://file4.renrendoc.com/view2/M00/22/1E/wKhkFmaYYr6AA_oQAAB_WUjT3gc6763.jpg)
![朱洁-大模型时代数据库技术创新_第4页](http://file4.renrendoc.com/view2/M00/22/1E/wKhkFmaYYr6AA_oQAAB_WUjT3gc6764.jpg)
![朱洁-大模型时代数据库技术创新_第5页](http://file4.renrendoc.com/view2/M00/22/1E/wKhkFmaYYr6AA_oQAAB_WUjT3gc6765.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
j百度智能云百度智能云数据库产品总架构师个人著作个人著作《大数据架构详解》获得2017电子工业出版社优秀作者奖公众号公众号《大数据和云计算技术》01数据库与大模型目录目录数据库与大模型4j百度智能云数据库行业发展史概览j百度智能云大型机大型机科学研究数据库层次数据库数据库层次数据库大型商业应用大型商业应用关系型数据库企业信息化ERP/CRM/财务企业BI个人办公个人娱乐关系型数据库数据仓库Teradata媒体搜索社交开源数据库开源数据库新媒体移动App云计算物联网在线办公、教育娱乐、短视频云数据库分布式数据库AuroraOceanbaseCockroachDBGaiaDBAI原生应用Jasper微软copilot大模型二次激发了数据库和AI的结合j百度智能云数据库智能驾驶舱数据库智能驾驶舱j百度智能云大模型最新技术栈j百度智能云各种App各种App私有知识库互联网,金融,多媒体各种Agent客服,销售数据库智能驾驶舱数据库智能驾驶舱低代码态开发代码态开发大模型精调,部署相关工具链8j百度智能云j百度智能云相似度检索语义搜索文本和向量混合检索•多路召回,排序模型检索结果给大模型总结矢百矢百数据提取websiteDatabase文档音频文档视频数据索引•按固定大小•text-embedding-3检索•专有名词处理•针对场景优化搜索推荐copilotj百度智能云j百度智能云•性能好,尤其是响应时延更好•复杂问题,安全问题处理更好j百度智能云j百度智能云基于大模型的推理能力,搭配向量数据库统一的客户向量数据全生命周期管理•针对私域数据的向量标量混合检索•复杂的向量和标量混合查询条件支持•支持私有化部署,集群小型化部署j百度智能云传统数据库支持向量的缺陷j百度智能云全栈LLM开发/全栈LLM开发/•支持主流的LLMs框架集成开发•集成百度千帆Embedding模型,基于百度中文语料并加入知识图谱进行训练,中文实体和短语性能好海量向量存储/•分布式架构,支持百亿级向量规模和十万级分片数量•同时支持向量数据和标量数据•支持4096维的高维向量•支持向量索引量化压缩j百度智能云高性能访问高性能访问/•支持HNSW/Puck/PQ等高性能算法•毫秒级ANN向量检索延时•架构和数据引擎多方面工程优化,各场景性能均高于开源产品3~7.5倍弹性&高可用弹性&高可用/•提供弹性伸缩能力,最大上千节点•内建自动化管理和监控•支持本地磁盘和云存储设施RPC通信分布式数据引擎RPC通信分布式数据引擎文本检索&生成相似图片检索文本检索&生成相似图片检索推荐系统大模型推理大模型知识库接入服务查询检索存储支持存储支持j百度智能云ChatGPTChatGPT千帆集群管理表分区Partition索引副本表分区Partition索引副本矢成熟的分布式架构矢百高可靠、高可用、强扩展、大规模百系统分为代理节点、数据节点和管理节点•代理节点:无状态&对等,支持负载均衡•管理节点:基于Raft协议的高可用设计,管理集群的物理拓扑、逻辑拓扑和数据库资源等•数据节点:负责数据的增删改、查询和检索等。基于Raft协议管理表/集合数据的分片及其副本,支持自动Failover和弹性伸缩等数据类型数据类型•支持强Schema模型,同时支持标量和向量数据类型•支持二级索引,支持各类向量索引•支持标量检索、向量检索和标量向量混合检索数据存储与均衡•支持标量和向量数据的增删改以及批量处理•基于LSM模型,支持行存、列存、行列混存•支持引擎内再分片以及细粒度向量索引调度数据压缩数据备份恢复硬件优化•支持指令集优化、CPU硬件优化、编译器优化等表/集合列族列/字段标量索引数据类型系统j百度智能云数据/控制接口数据/控制接口状态管理状态管理CompactionCompaction调度快照SegmentSegment路由恢复增/删/改/扫描/查询/检索/迭代器接口增/删/改/扫描/查询/检索/迭代器接口主键索引缓存主键索引缓存向量索引缓存向量索引缓存标量数据缓存标量数据缓存向量索引文件向量索引文件VectorDB支持常见标量类型字段,并支持向量和标量的混合检索检索预过滤•再在向量索引中进行bitmap过滤•最后对结果集进行向量相似性查询检索时过滤•进行向量检索时同时按标量条件过滤检索后过滤•先做相似性检索,再对结果集进行过滤数据分段检索优化•按统计信息对索引分段采用不同过滤机制j百度智能云 检索后过滤检索结果查询时过滤Inlinefilter预过滤标量索引逻辑执行计划元数据统计信息物理执行计划服务监听HTTP协议语法分析AST 客户端存储服务解析器解析器协议层执行器百度智能云VectorDB性能测试报告VectorDBVectorDB和某开源系统的对比测试结果,性能(QPS)提升3倍到7.5倍••检索QPS或吞吐:系统在单位时间内能够处理的检索请求数量,是衡量检索性能的关键指标•召回率:检索的TopK结果中,满足真实情况(KNN检索)的TopK集合的比例,是衡量向量检索精度的关键指标百度智能云VectorDB开源向量数据库•测试规格:数据节点4核8GB,数量为3个•数据集:SIFT128、COHERE768、GIST960三种维度的数据集,大小为•数据表配置:数据表1个分区/分片,分片副本数为3百度智能云VectorDB开源向量数据库j百度智能云j百度智能云 分布式架构数据强同步数据强同步 丰富的检索方式完整数据库管控能力 信创平台全兼容高性能查询AIAI4DB:数据库运维应用矢百矢百组织权限组织权限慢日志分析查询治理趋势高风险请求任务创建AI产品咨询产品咨询全量请求分析TOP数据分析SQL注入压测控制报告分析优化建议操作审计增强能力 访问来源分析报告分析风险提示合规报表健康评分大模型告警配置告警模板告警规则仪表盘监控展示监控接入会话情况事件和建议执行完事件计划事件数据源操作审计增强能力 访问来源分析报告分析风险提示合规报表健康评分大模型告警配置告警模板告警规则仪表盘监控展示监控接入会话情况事件和建议执行完事件计划事件数据源知识检索数据开发脱敏规则手动配置备份回滚流程中心定时发布消息通知数据归档数据开发脱敏规则手动配置备份回滚流程中心定时发布消息通知数据归档j百度智能云智能领航员:数据库copilotj百度智能云制造、科研等行业头部客户行业最汇聚数百名数据库专家大模型相比传统算法带来了更好的优化效果相似度检索相似度检索文档加载/切分/强化知识点模板知识点用户问题领域知识解答j百度智能云原理•利用RAG(Retr
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 单位厨房采购合同范本
- 建筑装饰与建筑市政道路设计考核试卷
- 《贸易政策与理论》课件
- 农村基层卫生服务体系建设考核试卷
- 劳动合同范本 北京
- 以赠予代购合同范本
- 冰凉粉配料采购合同范例
- 人事商业合同范本
- 企业正规劳务合同范例
- 冷冻盐水采购合同范例
- 个人ip运营策划方案
- 《盛开的紫荆花》课件
- 广东省广州市黄埔区2023-2024学年八年级上学期期末生物试卷+
- 我们怎样思维经验与教育
- 北京市丰台区市级名校2024届数学高一第二学期期末检测模拟试题含解析
- 赵匡胤:中国北宋时期的开国皇帝2
- 预防保健科护理管理质量控制考核标准
- 皮下抗凝剂的注射规范
- 食管癌护理小讲课课件
- 护理组长竞聘讲稿-护理组长竞聘主题教学课件
- 2023北京市高级中等学校招生考试英语答题卡A4版word版可以编辑
评论
0/150
提交评论