2023非结构化数据中台实践白皮书_第1页
2023非结构化数据中台实践白皮书_第2页
2023非结构化数据中台实践白皮书_第3页
2023非结构化数据中台实践白皮书_第4页
2023非结构化数据中台实践白皮书_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

非结构化数据中台实践白皮书2023目录Content01

数字化转型催生数据驱动型组织

非结构化数据中台助力数据驱动型组织非结构化数据中台的应用场景

非结构化数据中台的建设指南非结构化数据中台的未来趋势数字化转型催生数据驱动型组织数字化转型持续深入数字化转型催生数据驱动型组织01数据中台是数据能力建设的核心支撑01非结构化数据中台兴起数字化转型持续深入数字化转型持续深入Page Page PAGE4需求数字化需求数字化转型政策技术速涌现,数字化转型持续深入。政策驱动式和治理方式变革。发展数字经济已上升到国家战略高度,数字化转型将步入深水区。技术驱动数字化转型的核心是数据。数字化转型进程中,海量、多元化的数据积累,使得数据可赋能更多场景、行业。同时,云计算、大数据、人工智能、5G字化转型的门槛,使更多企业深入推进数字化转型成为可能。

数字化转型是指企业利用数字技术,通过商业模式、业务流程、组织架构等重塑,为客户创造新的价值。数字化转型催生数据驱动型组织数字化转型催生数据驱动型组织Page Page PAGE5数字经济时代,催生以数据为代表的新型生产要素。以数据驱动业务,打造数据驱动型组织,已然成为企业数字化转型的主线。数据辅助辅助数据辅助辅助流程经验决策传统企业中,数据是副产物,业务人员基于行业经验和原有流程去做业务,数据主要是用于监测业务进展和洞察一些规律,由业务人员做最终决策。业务人员业务系统数据数据驱动业务人员辅助驱动数据驱动型组织,强调以数据为生产要素。在业务决策中,以事实、指标和数据作为核心指导,而业务人员是以辅助角色支撑数据驱动业务。中台数据业务系统数据驱动型组织的定义数据驱动型组织的定义Page Page PAGE6数据驱动型组织是以数据为生产要素的组织,以数据驱动业务,实现持续增长和创新发展,以重塑组织的生产力。以数据为生产要素数据驱动型组织将数据视为企业资产,最大程度上利用数据的价值,关注数据的完整性、关联性以及数据质量。以数据为生产要素数据驱动型组织将数据视为企业资产,最大程度上利用数据的价值,关注数据的完整性、关联性以及数据质量。数据驱动决策数据驱动型组织在进行关键业务决策时,以数据为基础,通过高质量的数据分析驱动业务,而不是凭借经验或将各类信息简单堆砌。数据驱动创新数据驱动决策数据驱动型组织在进行关键业务决策时,以数据为基础,通过高质量的数据分析驱动业务,而不是凭借经验或将各类信息简单堆砌。数据驱动创新数据驱动型组织注重知识沉淀和传承,以保证业务的持续创新能力,并在开辟新的业务时,以知识为起点,通过认知智能实现智能化创新。实现数据驱动业务,核心在于构建数据能力实现数据驱动业务,核心在于构建数据能力Page Page PAGE7从数据生产要素到数字资产,进而以数据驱动业务,落地业务价值,核心在于构建数据能力。数据海量、分散、多元化生态合作数据设备运转数据客户行为数据数据海量、分散、多元化生态合作数据设备运转数据客户行为数据企业经营数据数字资产数字资产是以电子数据形式经济价值的非货币性资产。标准、统一、价值数据驱动业务 数据驱动运营 数据驱动创新 数据驱动决策 落地业务价值构建数据能力数据中台是数据能力建设的核心支撑数据中台是数据能力建设的核心支撑Page Page PAGE8应用场景垂直行业 金融 政府与公共服务 消费品与零售 …… 通用职能 应用场景垂直行业 金融 政府与公共服务 消费品与零售 …… 通用职能 营销 运维 财务……数据中台 数据整合 数据治理 数据洞察 数字资产数据源数据采集层共识。为支撑,盘活全域数据。数据中台成为核心业务系统。数据是关键生产要素,进行数据治理的数据中台嵌入业务流程,已然成为核心业务系统。基于数据中台,企业具备面向全域数据、面向进而以数据驱动业务,落地业务价值。非结构化数据成为增长主力非结构化数据成为增长主力Page Page PAGE9机器数据知识图谱机器数据知识图谱数据非结构化数据的定义数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。包括所有格式的办公文档、文本、图片、XMLHTML、非结构化数据的定义数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。包括所有格式的办公文档、文本、图片、XMLHTML、各类报表、图像和音频/视频信息等。非结构化数据的特点海量数据规模,且数据存储占比高数据来源丰富,分散各个系统非结构化数据结构化数据非结构化数据全域数据非结构化数据的特点与挑战非结构化数据的特点与挑战PagePagePAGE10传统的非结构化数据管理,内容对象、元数据与索引是分离存储和独立管理,难以同时灵活横向扩展,加剧海量非结构化数据的管理复杂性。海量 传统的非结构化数据管理,内容对象、元数据与索引是分离存储和独立管理,难以同时灵活横向扩展,加剧海量非结构化数据的管理复杂性。海量业务数据孤岛、知识数据孤岛、桌面数据孤岛三大数据孤岛使得文档数据分散储存,无法统一管理,难以快速准确地搜索,业务系统重建数据难以整合。分散对于非结构化数据而言,形式多样关系复杂,基于常规单一算法技术很难识别、分析。多样对于非结构化数据而言,形式多样关系复杂,基于常规单一算法技术很难识别、分析。多样非结构化数据,结构形式复杂,实体和关系分离,建立非结构化数据知识图谱体系以进一步挖掘深层次价值面临巨大挑战。异构非结构化数据管理需要革新的底层架构非结构化数据管理需要革新的底层架构PagePagePAGE11底底层数据挑战结 数据架构挑战 非结化从数据库到数据仓库、大数据平台,传统数据架构并非面向非结构化数据 构化设计;再演进到结构化数据中台,非结构化数据处理能力仍然是瓶颈,非 数结构化数据需要革命性的数据架构。 据仅仅依靠数据分析技术难以解决问题,必须将计算机视觉、NLP、知识图仅仅依靠数据分析技术难以解决问题,必须将计算机视觉、NLP、知识图现知识复用与智能搜索。智能技术挑战非结构化数据中台兴起非结构化数据中台兴起PagePagePAGE12非结构化数据中台 数据整合 非结构化数据中台 数据整合 数据治理 数据洞察 人工智能驱动 数据架构底座 数字资产数据源文档、图片等非结构化数据应用场景垂直行业 金融 政府与公共服务 消费品与零售 …… 通用职能 营销 IT运维 财务 …… 各行各业应用。非结构化数据中台助力数据驱动型组织数据驱动型组织面临的非结构化数据挑战02非结构化数据中台解决方案02中国非结构化数据中台实践白皮书V2数据驱动型组织的两大需求数据驱动型组织的两大需求PagePagePAGE14对于数据驱动型组织而言,数据已然具备生产要素的地位,实现数据的资产化、知识化,是打造数据驱动型组织的核心支撑。数据价值挖掘是数据资产化、知识化的基本路径,在数据价值挖掘的同时,数据驱动型组织必然着眼数据安全问题,数据安全业务合规是数据驱动型组织实现数据驱动业务的根基。因而,对于数据驱动型组织,数据价值挖掘、数字资产安全管理都是不可忽视的需求。数据价值挖掘数据是数据能力的核心。数据量、数据的使用程度、内化数据的过程数据价值挖掘数据是数据能力的核心。数据量、数据的使用程度、内化数据的过程都是数据驱动型组织构建数据能力的考量因素,而能否有效地挖掘数据价值尤为关键。数字资产安全数据资产安全是构建数据能力的根基。落地数据驱动型组织,数据资产至关重要,而最大限度地保护数据资产安全,是数据驱动决策赋能业务的基础。数据价值挖掘诉求是分阶段的数据价值挖掘诉求是分阶段的PagePagePAGE15对于一个企业而言,数据价值挖掘是战略层面的规划,是一项长期工作。对于整个非结构化数据中台的建设,更多的企业选择从顶层设计出发,逐级分段建设。根据企业自身的业务目标逐级建设,从底层场景领域、从优先场景领域切入,逐步纳入更多的业务模块,以达到企业数据能力的逐级进化和价值的持续叠加。面对海量非结构化数据,企业对于数据价值挖掘的诉求主要分为三个阶段:数据整合、数据治理、数据洞察三个阶段。数据洞察整合不同终端数据,打破数据孤岛,对数据进行统一存储管理数据洞察

识别捕获数据信息,并基于有序的制度和组织,实现数据的管理与应用

构建知识网络,建立数据间的关系,深入挖掘数据价值阶段3阶段1 合

阶段2 理 非结构化数据价值挖掘的业务挑战非结构化数据价值挖掘的业务挑战PagePagePAGE16 数据整合

数据治理

数据洞察 挑战海量非结构化数据的访问与查询存在巨大挑战;挑战海量非结构化数据的访问与查询存在巨大挑战;跨地域统一内容管理易网络拥塞,访问难;类型各异、存放在异构环境中的非结构化数据进一步加大管理难度。挑战数据类型多样,对于数据信息识别、内容提取面临挑战;内容与业务割裂,数字化服务能力缺失,内容无法自动流转,人力投入成本高。挑战复合内容难以有效识别与组织利用;隐性知识难以有效识别、表达及获取,精准描述关键信息难度大;非结构化数据知识体系复杂,基于知识网络洞察数据价值面临巨大挑战。数字资产安全需要立体安全数字资产安全需要立体安全PagePagePAGE17企业需要搭建包括数据安全、访问安全、信息安全等在内的立体安全体系。

个人隐私数据信息安全企业敏感信息信息安全非法内容管控

内容边界安全访问安全内容访问审计访问安全跨网跨地域多文档域访问安全

实时杀毒数据安全数据备份恢复数据安全数字资产安全的业务挑战数字资产安全的业务挑战PagePagePAGE18敏感内容泄漏主动或被动的泄密访问安全挑战敏感内容泄漏主动或被动的泄密访问安全挑战无法进行访问安全全面管控病毒攻击风险形态各异的病毒无孔不入,企业的数据安全面临高危风险文件备份性能不足海量文件或小文件的备份和恢复性能严重不足,内容数据缺乏高效的保护方案信息安全访问安全数据安全非结构化数据中台解决方案助力数据驱动型组织非结构化数据中台解决方案助力数据驱动型组织PagePagePAGE19非结构化数据中台 人工智能驱动 非结构化数据中台 人工智能驱动 数据架构底座 数据安全数字资产安全数据整合数据价值挖掘应用场景垂直行业 金融 政府与公共服务 消费品与零售 …… 通用职能 营销 IT运维 财务 …… 理 能 新 对象数据池 元数据池 索引数据池索引数据进行汇集、管理,融合人工智能技术,提供先进的数据架构底座,构建非结构化数据能力。赋能、知识创新等。非结构化数据中台基于双路径建设实现数据的资产化、知识化非结构化数据中台基于双路径建设实现数据的资产化、知识化PagePagePAGE20 数据价值挖掘 数字资产安全

数据整合 数据治理 数据洞察数非 据结 资构 产化 化知数 知据 识化数据安全 访问安全 知识安全整合、治理、洞察非结构化数据的中台整合、治理、洞察非结构化数据的中台PagePagePAGE21数据数据治理数据洞察数据价值挖掘路径,非结构化数据中台主要基于业务主题落地,实现数据的整合、治理、洞察,进而实现资产化、知识化,非结构化数据中台涉及的业务主题主要有文档管理、内容赋能、知识创新。底层数据源的所有非结构化数据文档管理体系、内容赋能体系底层数据源的所有非结构化数据文档管理体系、内容赋能体系理知识创新体系数据数据整合非结构化数据中台立体安全的非结构化数据中台立体安全的非结构化数据中台PagePagePAGE22基于非结构化数据中台底层架构,集成数据安全、访问安全、信息安全不同层面的数字资产安全方案,从安全维度支撑非结构化数据中台的资产化、知识化。AI技术驱动的信息安全方案信息安全敏感内容管控信息安全敏感内容管控隐私信息保护内容脱敏访问安全统一的权限及安全策略开放的防泄密集成访问安全统一的权限及安全策略开放的防泄密集成密级管理访问审计数据安全数据安全高性能备份恢复实时杀毒 非结构化数据中台 数据安全方案:数据备份恢复数据安全方案:数据备份恢复PagePagePAGE23面向海量非结构化数据,基于对象存储的备份恢复方式面临巨大挑战,一是备份性能慢,二是恢复性能慢,而数据备份恢复性能低下的根本原因在于单位时间内磁盘的吞吐率无法提升。数据中心异地灾备中心数据中心异地灾备中心对象数据 编排调度服务 对象聚合技术备份 备份数据库 恢复备份 灾备对象存储 恢复元数据关系数据网关IMPCMobilePLMIMPCMobilePLMERPOA关键业务系统OSS爱数数据安全方案采用OSS网关对象聚合技术,并结合编排调度服务,提出高性能备份恢复方案,相比传统的NAS、对象存储备份恢复技术,性能得到数十倍的提升。数据安全方案:实时杀毒数据安全方案:实时杀毒PagePagePAGE24病毒无时无刻不威胁着企业数据安全,实时杀毒是数据安全的首要任务。业务系统OAERPPLM业务系统OAERPPLMIM 时/实时杀毒 指定文档库杀毒

OpenDocAPIManagementAPI

内容流

业务场景 终端WindowsMac终端WindowsMaciOSAndroid

历史版本一键恢复数据中心Alita引擎 数据中心Alita引擎 务 务 内容开放框架实时杀毒 务 务 访问控制及安全方案访问控制及安全方案PagePagePAGE25换 单导设网络隔离设备部署控制台管理控制台对象存储 元数据服务器备AnyShare文档域B部署控制台管理控制台对象存储 元数据服务器下载AnyShare文档域A研发区域数据处理存储节点研发区域数据处理存储节点办公区域文档集服务对象存储爱数方案特性说明跨网环境数据交换场景,即有网络设备隔离,数据被下载之后会进行打包和加密,以保障传输过程中的文档安全。自行确认同步数据。可以支持的网络隔离设备,包括网闸、光闸、防火墙、摆渡机、隔离器。AI技术驱动的信息安全方案AI技术驱动的信息安全方案PagePagePAGE26文档文档生产系统应用OA业务应用DPO生产系统应用OA业务应用DPO部门隐私统计信息查询组织隐私分布状态监控爱数信息安全方案智能识别隐私内容自动智能识别隐私文件风险等级自动智能评估立体监控实时、分层、多视角企业隐私分布及风险动态“一目了然”高效保护AS无感实现隐私数据识别和保护,极大节约人力管控成本爱数信息安全方案智能识别隐私内容自动智能识别隐私文件风险等级自动智能评估立体监控实时、分层、多视角企业隐私分布及风险动态“一目了然”高效保护AS无感实现隐私数据识别和保护,极大节约人力管控成本支持DPO一键式合规设置,灵活适配GDPR、个人信息保护法等法规要求,极大降低合规体系建设成本InfoInsight隐私状态监管隐私数据定级隐私数据识别主文档 业务数据 办公数据 终端WindowsMacweb文档所有者查看文档隐私类别查看文档隐私详情非结构化数据中台的应用场景• 文档管理03• 内容赋能03• 知识创新中国非结构化数据中台实践白皮书V2非结构化数据中台应用场景非结构化数据中台应用场景PagePagePAGE28基于非结构化数据中台的业务主题主要有:文档管理、内容赋能、知识创新等,不同业务主题之下包含更为具象的应用场景。在不同应用场景中,数据驱动型组织需求侧重虽有不同,但都有数据价值挖掘、数字资产安全两个维度的需求考虑,需要基于非结构化数据中台进行数据价值挖掘、数字资产安全管理,实现不同应用场景下的业务赋能、业务合规。文档管理内容赋能知识创新定义:据知识化,落地知识运营管理。典型应用场景:文档管理内容赋能知识创新定义:据知识化,落地知识运营管理。典型应用场景:产品咨询、员工培训、项目竞标、知识共享交流等。定义:务流程自动化。典型应用场景:表单自动采集、电子发票管理、合同管理与合规、信贷业务管理等。定义:索与部门协作效率。典型应用场景:设计文档管理、客户数字资产生命周期管理、协作办公等。业务主题数字资产安全管理数据、访问、知识安全数据价值挖掘数字资产安全管理数据、访问、知识安全数据价值挖掘数据整合、治理、洞察文档管理:业务挑战文档管理:业务挑战PagePagePAGE29随着数字化转型的持续深入,文档数据种类多样,持续积累,成为数据资产不可忽视的重要组成部分,而传统的文档存储和管理模式已不再适应当下文档管理需求。文档管理场景业务挑战主要聚焦于文档统一管理、安全合规、数字资产沉淀三个方面。挑战1:文档统一管理低。挑战1:文档统一管理低。挑战2:业务合规险。挑战3:数字资产沉淀存储资源重复建设,可扩展性差;周期流转,持续沉淀数字资产。案例例:制造业/新能源某新材料集团股份有限公司是一家锂离子二次电池用正负极材料专业化生产厂家,近年来集团业务规模快速发展,传统的文档存储和管理模式面临巨大挑战。

• 文档散落存储在个人PC无统一存储机制,对日常办公管理带来极大不便;• 缺乏有效的内容安全管控、在线杀毒、合规审计、备份容灾等机制,存在丢失与泄密风险。• 业务系统(OA,CRM,SAP,HR,邮箱系统等)多,缺乏合理的文档归档机制。文档管理:解决方案文档管理:解决方案PagePagePAGE30终端终端文档管理解决方案对所有结果性文档统一管理,并规定管理权责、权限以及规范,以实现文档从创建到使用流转,再到最后归档销毁的全生命周期管理。在数字资产安全方面,文档管理业务场景主要涉及数据安全、访问安全需求,需要建立内容安全管控、在线杀毒、合规审计、备份容灾等机制,满足业务合规要求。ERPOA关键业务系统非关键业务系统数字资产管理业务合规文档统一管理非结构化数据中台ERPOA关键业务系统非关键业务系统数字资产管理业务合规文档统一管理非结构化数据中台自动分类内容数据湖智能搜索内容总线访问安全数据安全文档管理:爱数全生命周期解决方案文档管理:爱数全生命周期解决方案PagePagePAGE31获取电脑桌面获取电脑桌面移动终端其他终端仪 使用可见易用数据赋能业务运营文档外发安全协作高效协作统一存管安全合规移动办公非法内容管控失文档电子化管理业务系统调用分类团队协作空间文档库归档库标签业务导向加持摘要元数据加持识别统一管理规范搜索智能内容分析及检索延续/修订/废止/删除到归档归档库归档归档库票据电子影像归档库企业文化资料归档库音视频文件归档库项目资料文档管理:业务价值文档管理:业务价值PagePagePAGE32制造业/新能源例:某新材料集团股份有限公司基于爱数非结构化数据中台实现的业务价值提升效率:研发及办公协同效率制造业/新能源例:某新材料集团股份有限公司基于爱数非结构化数据中台实现的业务价值提升效率:研发及办公协同效率合规:为ISO27001中文档管理打好合规基础•实现文档电子化,面向业务、组织部门的业务诉求形成不同的文档分类管理和规范流程,提高运营效率业务合规业务合规沉不同业务领域,促进知识沉淀和复用。淀核心数据文档管理:某化工勘察设计企业案例文档管理:某化工勘察设计企业案例PagePagePAGE33文档数据采集量不足10%文档系统速度慢,用户体验差,文档安全合规管理混乱;不支持云计算架构和海量数据存储;无标准API接口,无法对接新业务系统;对非文档数据认识不足文档数据采集挑战文档数据采集量不足10%文档系统速度慢,用户体验差,文档安全合规管理混乱;不支持云计算架构和海量数据存储;无标准API接口,无法对接新业务系统;对非文档数据认识不足文档数据采集挑战文件检索效率低权限规则不灵活,颗粒度不细;缺少复杂搜索的能力;知识能力薄弱缺少自动化的内容理解能力,全靠人力整理;知识交付能力薄弱;无法满足客户需求境外项目调用文件的速度和合规要求无法满足;多通过国外网盘管理文件。文档数据使用挑战解决方案:非结构化数据中台AnyShare实现海量非结构化数据存储、智能内容搜索以及内容安全合规。论文入库图纸归档文件100G论文入库图纸归档文件100G每年产生量15万张>300篇结果型文件施工进度报告概要设计施工进度报告概要设计需求说明过程型文件

非结构化数据中台内容集成开放框架内容数据湖

办公文档和业务文档知识化海量知识沉淀收益:的十分之一;将数TB收益:的十分之一;将数TB化数据统一管理,实现文档全生命周期的保护,满足合规性要求;索结果随时预览;现知识运营筑基,赋能业务。识运营 员工/合作伙伴培训赋能智能知识查找智能知识推荐API集成 数据调用关键业务系统OA DPM PMS4.0 DMS内容赋能:业务挑战内容赋能:业务挑战PagePagePAGE35使用者体验内容在不同的业务系统中碎片化存在,形成孤岛,无法实现跨业务的统一使用统一检索使用者体验内容在不同的业务系统中碎片化存在,形成孤岛,无法实现跨业务的统一使用统一检索的体验。一致性风险内容在不同业务系统中流转,需要人工覆盖割裂的环节,带来内容一致性的风险。业务合规面对国内外日益严格的合规要求业务合规面对国内外日益严格的合规要求(GDPR,个人隐私安全法),各个业务系统中碎片化存在的内容,蕴含着大量合规风险无法有效识别。数字化服务能力大量的内容受困于孤立的业务应用中,缺失内容服务能力,无法适应多样化的业务发展数字化服务能力大量的内容受困于孤立的业务应用中,缺失内容服务能力,无法适应多样化的业务发展和用户使用要求,内容价值无法体现。IT管理业务系统与文档脱离,系统间接口过于复杂,易形成内容蜘蛛网,维护难度巨大,缺少标准化内容管理规范进行统一管理。内容赋能:解决方案内容赋能:解决方案PagePagePAGE36MacWindows终端MacWindows终端基于非结构化数据中台能力,集成OCR等第三方生态应用,实现内容赋能业务运营。非关键业务系统理 影像数据OCR图谱标签OCR非关键业务系统理 影像数据OCR图谱标签OCR图谱标签表格数据数据转换数据转换文档的文本内容提取内容提取非结构化数据中台内容数据湖内容总线内容管理体系架构内容生态应用网智电子档案管理内容识别方案SAP智能内容管理拓维合同管理方案内容元数据内容数据内容分析数据内容处理服务 流程自动化 业务数据贯通 电子档案管理 合同管理 流程自动化合同管理SAP内容管理ERPOA关键业务系统ERPOA关键业务系统内容赋能:业务价值内容赋能:业务价值PagePagePAGE37提升生产力内容与业务结合,提高业务运营效率。内容数据结构化,自动化流转,降低人力投入。充分利用内容价值,实现数据资产化,赋能更多业务场景。提升生产力内容与业务结合,提高业务运营效率。内容数据结构化,自动化流转,降低人力投入。充分利用内容价值,实现数据资产化,赋能更多业务场景。降低TCO统一内容服务能力赋能给各业务系统,避免重复造轮子。内容总线架构,显著降低业务集成复杂度,敏捷式构建统一内容管理。业务合规内容基于业务自动流转,避免人工参与带来的合规风险。高性能备份、归档等合规要求。某保险集团:“业务+数据”双中台实现7个主要业务系统的线上数据整合,设计面向业务自主分析的6大主题数据集,报表某保险集团:“业务+数据”双中台实现7个主要业务系统的线上数据整合,设计面向业务自主分析的6大主题数据集,报表查询效率由原先数分钟提升至秒级;实现线下5T文件资料的文档云集中管理,探索线下数据价值应用连接业务中台,业务文档全流程打通,自动流转,合规且高效预览、属性查询等服务直接调用,告别重复造“轮子” 集团项目管理系统 账单与结算在线系统 理赔在线体系 承保在线系统 合同管理场景:某制造业企业案例合同管理场景:某制造业企业案例PagePagePAGE38业务挑战:某制造业企业的市场部负责合同的录入以及合同筛选支撑销售招投标,业务人员较少但合同数量持续增长,合同管理面临挑战。人工录入合同,效率低,人工成本高;业务挑战:某制造业企业的市场部负责合同的录入以及合同筛选支撑销售招投标,业务人员较少但合同数量持续增长,合同管理面临挑战。人工录入合同,效率低,人工成本高;制造业合同包含大量非结构化数据,无法合同内容与ERP象,需要人工对合同内容逐一审查。プ䊨 ♳⠛

CRM系统合同编号及链接 Ꝉ㈒投标文件电子版PDF ꧋䧭 ⥂

䫏叻㼆䎾❡ㅷざず霆僈AnyShareFamily7智能内容云合同扫描件A 合同扫描件B 合同扫描件♧㤛ꨪ⟝ ♧⚡鲶䪬 ♧⚡巊⾓

兰腊唬程䋑㖞⚁プ合同管理系统荈⸓䔶Ⰶ图片自动标签

图片摘要

图片OCR识别

合同各类关键信息收益:收益:录入合同、辅助销售找寻对应合同人力投入下降50%,且人力主要用于合同关键信息的校正确认,查找投标用的合同证明完全基于中台实现;合同管理场景:某运营商案例合同管理场景:某运营商案例业务挑战:某运营商合同管理系统的用户规模超40万,年新增合同100同审批比对费时费力(电子合同、合同数据、打印合同),海量合同履约风险,基于合同的关键条款识别与任务匹配难。解决方案:基于识别合规风险,主要用于合同及合同方关系分析及风险管理、合同条款内容合规性及风险发现。合同管理系统业务人员 审批人员 监管人员 业务人员合同起草合同审批合同定稿合同履约激活合同起草合同审批合同定稿合同履约激活合同上传

OCR识别与自动录入

元数据同步 履约风险提醒 内容数据湖

内容分析服务合同分类

类、摘要甲方:xx甲方:xx乙方:yy标的物:zz金额:M定金:N签订日期:DD免责条款:无

知识提取:合同结构化

合规性检测服务于审批、履约管理数据一致性检查;条款完备性检查;数据一致性检查;条款完备性检查;条款准确性检查;履约合规性检查;关联公司异动风险检查;… 合同知识网络 知识创新:业务挑战知识创新:业务挑战PagePagePAGE40对于数据驱动型组织而言,数据知识化可以推动学习型组织建设,赋能业务运营,更进一步以知识网络为核心挖掘数据价值,驱动业务创新,支撑战略决策。知识创新场景之下,实现数据知识化面临知识层面的多项挑战。知识收集、整理依赖人工集、整理,员工不胜其烦,难以持续;辑,工作量大,成效堪忧;智能化知识搜索挑战分析;也无法支持用户搜索意图理解,难以快速、精准找到需要的知识。

海量知识的管理、拓展、安全性挑战科技企业例:某集团企业原有知识管理现状与痛点积累几TB科技企业例:某集团企业原有知识管理现状与痛点积累几TB常慢,文档稍微大一些就需要下载查看,用户体验极差。效。麻烦,知识标签库维护异常纠结;用户活跃度低,经常反馈需要的找不到想要的知识和文档,看到的版面千篇一律;用户和场景导向的个性化推荐挑战战。知识创新:解决方案知识创新:解决方案PagePagePAGE41支撑支撑支撑支撑文档知识化智能分析推荐业务对象知识图谱文档对象 概念对象用户画像 意图理解能力 知识搜索能力 个性推荐能力 知识网络文档库A 文档库NOffice PDF 智能表格内容管理文档管理团队内容协作提炼知识库N知识库知识库B知识库A内容平台知识标注服务模型训练服务知识抽取服务智能知识运营方案助力知识创新体系建设。以爱数案例为例,通过AnyShare人工智能技术,由构建企业私域数据知识网络,形成一个千人千面、个性化、智能化的知识中心,并通过智能知识整合场景赋能业务系统和流程。企业知识中心KnowledgeCenter主题知识卡片企业知识中心KnowledgeCenter主题知识卡片知识文档卡片个性推荐知识社区第三方业务/培训系统:内嵌知识应用概念知识智能搜索个性推荐自动标签非法内容管控隐私数据识别构建企业私域数据知识网络,打造企业知识大脑构建企业私域数据知识网络,打造企业知识大脑PagePagePAGE42知识网络知识网络知识服务精准知识搜索与智能推荐 找客户 内部市场文档 外部市场文档 找项目 内部项目资料 外部相关项目 找友商 内部竞争分析 外部情报信息 结构3结构4关系B关系C关系D结构2结构专业图谱关系A结构1条款3条款4关系C合同规则知识库关系A条款2条款1关系D关系B友商4友商1关系B关系C关系D友商3友商2关系A情报图谱客户4客户1关系B关系C关系D客户3客户2关系A客户图谱项目3项目4关系C关系B关系D项目1项目2关系A项目图谱企业私域数据知识网络业务关系模型

文档知识模型

知识主题/标签 客户系统/项目管理系统/服务系统 文档知识库 客户系统/项目管理系统/服务系统 文档知识库 知识主题、知识文档知识创新:业务价值知识创新:业务价值PagePagePAGE43提高工作效率缩短工作交接时间隐私保护业务合规提高工作效率缩短工作交接时间隐私保护业务合规缩短工作培训时间问题重复发生率降低节省成本节省培训费用知识复用提高效率、节省成本科技企业例:某高科技公司基于爱数非结构化数据中台实现知识运营的业务价值定量衡量现有员工1000余人,约500人使用知识管理系统,在知识搜索、工作交接、新岗培训层面,大约可节约40000工时/年;公司全员培训费用为每人约3500元/年,通过知识管理系统进行共享通过问题事后学习,事前预防,有效规避研发制造过程中出错的概率,较以往节约研发和测试成本1.4亿/年;知识创新:某建筑设计企业的项目知识运营知识创新:某建筑设计企业的项目知识运营PagePagePAGE44业务挑战:问题主要有:如何快速准确找到设计参考资料包括设计图片、如何减少知识整理的手工工作量、设计新人学习,如何让知识找人。解决方案:知识运营整体方案包含AnyShareEnterprise内容平台、知识网络、AnyShareKnowledgeCenter知识中心应用三大产品组合形成,分知识网络基于业务标签的知识主题自动生成知识网络基于业务标签的知识主题自动生成文档与知识主题自动归集;基于标签的知识主题与知识文档推荐基于用户画像的知识主题与知识文档推荐内容管理平台文档统一生命周期管理、数字资产安全;文档过程共享协作与知识自动归集;统一文档知识库;文档智能检索、图片智能检索;文档知识化智能分析推荐知识中心知识卡片:知识主题、知识文件;互动问答解决方案AnyDATAAnyShareEnterpriseAnyShareKnowledgeCenter精准知识与图片搜索精准知识与图片搜索大量内外部设计参考资料,设计过程资料,特别是设计效果图,如何快速服务于新的设计项目,需要精准知识搜索、图片搜索。简化知识整理和运营互动简化知识整理和运营互动不能接受维护标签库、打标签大量的人肉运营工作,必须自动化。简化运营复杂性,设计师繁忙,重点围绕专业主题/知识交流互动,让知识主动找人让知识主动找人避免千篇一律的知识门户,希望根据用户角色、岗位、爱好,实现个性化的知识推荐。知识创新案例:智能的知识与图片搜索知识创新案例:智能的知识与图片搜索经过业务知识关系优化的知识精准搜索推荐;经过机器学习训练的建筑设计图片智能检索;基于知识网络的精准知识搜索推荐(搜索意图匹配:搜索关键词与知识标签直接及间接匹配度越高,越接近用户搜索意图,推荐越精准)

面向建筑设计行业的图谱智能检索(经过大量机器学习,搜索图片内相关建筑样式、风格,实现以图搜图、以文搜图)知识创新案例:千人千面的知识中心知识创新案例:千人千面的知识中心知识主题发现和描述生成,减少主题编辑工作量;知识主题与AnyShare知识文件自动关联,减少上传归集工作量;知识主题、知识文件基于用户画像自动推荐;千人千面的知识主题、知识文件推荐(用户画像、知识主题与标签:来自知识网络)千人千面的知识主题、知识文件推荐(用户画像、知识主题与标签:来自知识网络)知识主题自动发现、文档自动关联、专家互动(主题发现、自动关联:来自知识网络)知识创新案例:社区式知识圈知识创新案例:社区式知识圈社区式知识圈:知识主题互动、知识文档互动、知识专家互动;无处不在的关联推荐、个性化推荐;知识专家交流互动:知识问答本知识文件所在知识主题下其他知识文件知识专家交流互动:知识问答(相关文档推荐)知识评论互动包含本知识文件的其他知识主题(主题标签的相关推荐非结构化数据中台的建设指南04非结构化数据中台建设方法论04非结构化数据中台的具体建设路径中国非结构化数据中台实践白皮书V2非结构化数据中台建设方法论非结构化数据中台建设方法论PagePagePAGE49非结构化数据中台是企业数据创新运营的体系,需要从战略、组织架构、建设内容等方面进行考虑,并需要一套完整的实施交付方法论实现战略到业务的落地。战略战略 非结构化数据中台需要定位于企业级战略。组织运营

组织运营非结构化数据中台需要企业组织运营架构提供必要保障支撑。技术 数体系 体体系 需求调研规划 蓝图绘制

服务 运营体系 体系开发 持交付 运

内容非结构化数据中台的建设主要包括技术体系、数据体系、服务体系和运营体系等内容。交付方法论包括体系规划、需求调研与蓝图绘制、开发与交付、持续运营。中台战略中台战略PagePagePAGE50保障是三个重要考量维度。从业务战略切入台战略的制定也需从业务战略切入。从业务战略切入台战略的制定也需从业务战略切入。明确数据中台的价值。基于业务战略规划,明确数据中台在业务战略实现过程中的价值,制定数据中台项目落地评价指标。具价值的领域以及核心应用场景。制定数据战略型的基础。梳理企业数据流全貌,包括系统类型,存储方式,访问频率,价值高低等,指处理加工、分析挖掘、交易使用建立数据治理体系,数据治理包括战略层的标准和流程制定、数据基础架构技术战略管理、统一的集成交换技术标准等。战略落地保障制度、流程、资源的保障。数据文化是重视、实践、鼓励使用数据来改善决策的集体信念和行为,比如分享和社区的建立。制度、流程层面,主要在于优化,以适应数据中台引入的新业务模型。备、人才资源等。组织运营架构建设组织运营架构建设PagePagePAGE51主要需要思考数据中台由谁来建、谁来维护、谁来经营、业务需求如何承接、效果怎样衡量等问题。中台的建设、维护、运营以及业务的承接、中台服务的推广等,需要建立数据中台团队支撑;同时,业务、后台、管理等团队需要有对应的组织人员与中台团队对接,以适应企业中台运转模式。中台组织运营架构中台组织运营架构 数据中台 建设团队维护团队运营团队产品团队业务团队业务团队企业高层支持推进管理团队后台团队数据中台的内容数据中台的内容PagePagePAGE52体系、运营体系四大体系。技术体系数据体系技术体系数据体系技术体系主要是指数据基础架构,为企业数据治理与服务提供技术平台和能力。分为两个层面,大数据存储计算技术与数据中台工具技术组件,工具技术组件是核心关注点。 数据体系是数据中台建设、管理、使用的核心要素。数据中台始终围绕数据体系的建设和使用,针对不同企业的不同业务,建设不同的数据体系。技术体系主要是指数据基础架构,为企业数据治理与服务提供技术平台和能力。分为两个层面,大数据存储计算技术与数据中台工具技术组件,工具技术组件是核心关注点。数据体系是数据中台建设、管理、使用的核心要素。数据中台始终围绕数据体系的建设和使用,针对不同企业的不同业务,建设不同的数据体系。服务体系运营体系服务体系运营体系服务体系是通过数据中台的服务组件能力,把数据变成一种服务能力,让数据能够方便地参与到业务中并为业务带去价值。 运营体系包括平台流程规范执行监督、平台资源占用的监管及优化推动、数据质量的监督及改进推动等,是数据中台得以健康、持续运转的基础。服务体系是通过数据中台的服务组件能力,把数据变成一种服务能力,让数据能够方便地参与到业务中并为业务带去价值。运营体系包括平台流程规范执行监督、平台资源占用的监管及优化推动、数据质量的监督及改进推动等,是数据中台得以健康、持续运转的基础。交付方法论交付方法论PagePagePAGE53T(Think)-P(Plan)-A(Action),是从企业的数据驱动战略以及业务模式出发,为企业提供专业的端到端的咨询、开发和交付的服务方案,并通过大数据基础设施进行有效落地,帮助客户实现数据驱动战略,带来实质性的投资回报。 体系规划

需求调研与蓝图绘制

开发与交付

持续运营 企业愿景与数据战略

题定义/范围

数据资产化

业务持续支持新业务探索 评估非机构化数据管理现状

应用场景需求

数据服务化

应用场景支持迭代回顾与增强 规划目标蓝图

非结构化数据中台方案蓝图

数字资产安全机制

系统持续支持检视与调优 设计演进路线 数据资产与服务设计 数字资产安全设计 Think基于业务诉求、愿景目标和战略规划,规划整体方案体系、交付路径等。PlanThink基于业务诉求、愿景目标和战略规划,规划整体方案体系、交付路径等。Plan业务、产品、技术之间协作,打通端到端的业务价值流。Action适应应用场景/应用需求变化,持续交付有效价值。持续技术深化,打造非结构数据中台,交付有效业务价值。方法论的敏捷交付理念方法论的敏捷交付理念PagePagePAGE54本质而言,敏捷交付不仅是一种能力,更是一种理念。基于TPA方法论,在体系规划与蓝图绘制阶段采用分阶段建设思路,配合持续运营模式,实现持续、高质量地交付非结构化数据中台有效价值。分阶段建设思路对于数据驱动型组织而言,非结构化数据从治理到洞察,从数据价值分阶段建设思路对于数据驱动型组织而言,非结构化数据从治理到洞察,从数据价值挖掘到数字资产安全,是一项战略层面的规划,但对于一个企业而言,更期待持续交付可衡量的有效价值。分阶段建设思路是指,在体系规划与蓝图绘制阶段分析项目难度,根包括从部门到部门、从场景到场景、从业务主题到业务主题的分阶段交付。 业务赋能 阶段1 文档管理 知识创新 阶段2阶段3持续运营持续运营,一是针对已交付产品,根据客户需求的变动以及技术推动,持续优化产品价值;二是针对蓝图规划中的不同阶段,基于TPA方法论持续交付;三是针对持续涌现的新应用场景,快速响应,实现有效价值交付。业务反馈和调整业务验证产品交付产品设计业务设计敏捷交付案例:助力某建筑设计公司实现知识运营敏捷交付案例:助力某建筑设计公司实现知识运营PagePagePAGE55项目背景:某建筑设计公司,从事建筑方案设计、施工图设计,包括规划、建筑、结构、室内、绿建等各专业。作为知识密集型企业,如何将内部设计结果、经验转化为企业知识,实现知识运营,对于落地数据驱动型组织至关重要。需求剖析需求剖析内容基础架构 01海量、分散带来的安全、合规风险;性。文档管理 02文档管理体系是知识管理的基础业务内容管理 03设计流程中的大量内容存储压力、可管理压力、检索能力。知识管理 04知识分类组织及建设;知识数字化运营及激励;知识的多样性呈现及运营敏捷交付敏捷交付主要为理正协同设计平台做底层开发及企业内部体系梳理。项目一期筑森所有的应用系统数据都会迁移到主要为理正协同设计平台做底层开发及企业内部体系梳理。项目一期筑森所有的应用系统数据都会迁移到AnyShareFamily7中,并应用知识图谱技术,实现以文搜图、以图搜文的功能。项目二期根据筑森的实际需求构建企业内部的数据湖,实现针对于非结构化数据的数据洞察。项目三期非结构化数据中台建设路径非结构化数据中台建设路径PagePagePAGE56非结构化数据中台基于业务主题分阶段建设,整体建设路径主要分为四个阶段,分别是评估与规划、文档管理体系建设、内容赋能体系建设、知识创新体系建设。阶段1现状、起步 评估、规划 数字化战略规划;项目目标设定;演进路线规划;

文档管理体系阶段2有序的电子文档管理文档管理体系建设文档管理体系建设文档管理体系规划及目标需求调研与蓝图规划系统建设与初始化系统上线及运营基于业务构建文档分类、文档组织、文档流转等体系制度,

内容赋能体系阶段3全面的内容管理及赋能内容赋能体系建设内容赋能体系建设内容赋能体系规划及目标内容赋能场景调研及蓝图内容赋能应用开发及上线将内容通过业务集成、内容应用、流程自动化等方式融入业务场景中,打通业务与内容,实现业务赋能。

知识创新体系阶段4知识创新与运营知识创新体系建设知识创新体系建设知识创新体系规划及目标建设智能知识应用规划设计知识运营机制建立基于内容飞轮架构,智能知识运营方案助力知识创新体系建设,实现知识赋能,构建数据驱动型组织。文档管理体系建设文档管理体系建设PagePagePAGE57文档管理体系的建设流程主要有:文档管理体系规划及目标,需求调研与蓝图规划,系统建设与初始化,系统上线及运营。体系规划及目标评估非结构化数据管理现状规划目标蓝图设计演进路线需求调研与蓝图规划企业级文档分类体系元数据体系权限体系文件夹结构用户组织与角色文件工作流数字资产安全体系文档管理制度定义系统建设与初始化初始化用户信息据等相关设置文档数据迁移运营体系建设审计体系建设系统上线及运营体系规划及目标评估非结构化数据管理现状规划目标蓝图设计演进路线需求调研与蓝图规划企业级文档分类体系元数据体系权限体系文件夹结构用户组织与角色文件工作流数字资产安全体系文档管理制度定义系统建设与初始化初始化用户信息据等相关设置文档数据迁移运营体系建设审计体系建设系统上线及运营用户培训及生产系统切换系统试运行系统持续运营系统推广业务价值指标体系建设Think根据非结构化数据管理现状,Plan基于数字资产管理与安全维度的需求调研,制定业务蓝图。Action交付与运营平台开发StepTwo内容赋能体系建设内容赋能体系建设PagePagePAGE58内容赋能体系的建设流程主要有:内容赋能体系规划,内容赋能场景调研与蓝图,内容赋能应用开发及上线。对于内容赋能体系,除单一业务场景体系建设之外,同时涉及新增业务场景的持续交付。StepOneStepTwoStepThreeStepOneStepTwoStepThree内容赋能应用开发及上线业务系统集成整合业务流程集成对接内容应用开发及测试内容应用联调及演练内容应用上线实施内容赋能应用开发及上线业务系统集成整合业务流程集成对接内容应用开发及测试内容应用联调及演练内容应用上线实施内容应用运维保障内容赋能场景调研及蓝图业务系统核心流程梳理业务系统内容服务集成现状梳理业务系统内容高服务缺失识别业务系统公共服务能力归纳内容赋能场景蓝图内容赋能体系规划内容赋能体系成熟度评估内容赋能场景价值评定内容赋能体系目标制定Think根据内容赋能体系成熟度现状,确定整体建设规划。PlanThink根据内容赋能体系成熟度现状,确定整体建设规划。Plan基于业务场景的赋能、合规需求调研,制定内容赋能场景蓝图。Action开发、交付与持续运营知识创新体系建设知识创新体系的建设流程主要有:建设内容平台、构建知识网络、打造知识中心、创新知识应用。赋能组织 创新知识应用 通过实时的内容平台和知识网络实现赋能业务场景:赋能业务流程的智能化知识应用(知识应用无处不在通过实时的内容平台和知识网络实现赋能业务场景:赋能业务流程的智能化知识应用(知识应用无处不在精准知识搜索、场景知识自动关联、用户个性化推荐利用企业知识中心实现社区化知识运营:知识卡片:知识主题、知识文件利用企业知识中心实现社区化知识运营:知识卡片:知识主题、知识文件动利用人工智能、知识图谱技术实现知识自动抽取和关联:基于文档知识模型,抽取业利用人工智能、知识图谱技术实现知识自动抽取和关联:基于文档知识模型,抽取业络;基于知识网络,实现文档与知识主题自动关联、精准知识搜索、个性化推荐利用内容总线、内容数据湖实现端到端知识库体系:利用内容总线、内容数据湖实现端到端知识库体系:业务活动的知识自动归集、自动标签(桌面和业务流程);知识分类及知识库建立基于TPA交付方法推进知识创新体系建设Page59基于TPA交付方法推进知识创新体系建设05非结构化数据中台的未来趋势05中国非结构化数据中台实践白皮书V2落地更多应用场景,非结构化数据中台趋于行业化落地更多应用场景,非结构化数据中台趋于行业化PagePagePAGE61随着数字化转型的持续深入,非结构化数据中台的应用行业边界扩

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论