版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数字化转型催生数据驱动型组织01目录非结构化数据中台助力数据驱动型组织02非结构化数据中台的应用场景03Content非结构化数据中台的建设指南04非结构化数据中台的未来趋势0501数字化转型催生数据驱动型组织中国非结构化数据中台 实践白皮书V2数字化转型持续深入数字化转型催生数据驱动型组织数据中台是数据能力建设的核心支撑非结构化数据中台兴起需求驱动全球经济下行,人口红利、城镇化红利、互联网红利逐渐消失,数字化转型是未来唯一的增 长红利。当下,转型领军企业竞争壁垒已然显现,更多传统企业加速布局,数字原生企业快 速涌现,数字化转型持续深入。技术驱动数字化转型的核心是数据。数字化转型进程中,海量、
2、多元化的数据积累,使得数据可赋能 更多场景、行业。同时,云计算、大数据、人工智能、5G、物联网等技术的成熟,降低了数 字化转型的门槛,使更多企业深入推进数字化转型成为可能。数字化转型持续深入政策驱动“十四五”规划对数字化战略进行重要部署,强调以数字化转型整体驱动生产方式、生活方 式和治理方式变革。发展数字经济已上升到国家战略高度,数字化转型将步入深水区。数字化 转型需求技术政策数字化转型是指企业利用数字技术,通过商业模式、业务流程、 组织架构等重塑,为客户创造新的价值。Page 4数字化转型催生数据驱动型组织数字经济时代,催生以数据为代表的新型生产要素。以数据驱动业务,打造数据驱动型组织,已然
3、成为企业数字化转型的主线。传统企业中,数据是副产物,业务人员基于行业经验和原有流程去做 业务,数据主要是用于监测业务进展和洞察一些规律,由业务人员做 最终决策。数据驱动型组织,强调以数据为生产要素。在业务决策中,以事实、 指标和数据作为核心指导,而业务人员是以辅助角色支撑数据驱动业 务。数据辅助数据驱动业务系统数据中台驱动业务人员辅助业务系统业务人员流程数据经验决策辅助Page 5数据驱动型组织的定义数据驱动型组织是以数据为生产要素的组织,以数据驱动业务,实现持续增长和创新发展,以重塑组织的生产力。以数据为生产要素数据驱动型组织将数据视为企业资产,最大程度上利用数据的价值,关注数据的完整性、
4、关联性以及数据质量。数据驱动决策数据驱动型组织在进行关键业务决策时,以数据为基础,通过高质量的数据分析驱动业 务,而不是凭借经验或将各类信息简单堆砌。数据驱动型组织数据驱动创新数据驱动型组织注重知识沉淀和传承,以保证业务的持续创新能力,并在开辟新的业务 时,以知识为起点,通过认知智能实现智能化创新。Page 6实现数据驱动业务,核心在于构建数据能力从数据生产要素到数字资产,进而以数据驱动业务,落地业务价值,核心在于构建数据能力。海量、分散、多元化数据数据驱动业务数据驱动运营数据驱动创新数据驱动决策企业经营数据客户行为数据设备运转数据生态合作数据数字资产数字资产是以电子数据形式 存在并且预期会给
5、资产持有 者带来经济利益或具有潜在 经济价值的非货币性资产。落地业务价值构建数据能力整合、治理、洞察标准、统一、价值Page 7数据中台是数据能力建设的核心支撑随着数字化进程的持续推进,企业数据意识增 强,越来越多的企业对于数据中台的价值形成 共识。对于数据驱动型组织,数据能力建设涉及数据 的整合、治理、洞察与安全,需要以数据中台 为支撑,盘活全域数据。数据中台成为核心业务系统。数据驱动型组织, 数据是关键生产要素,进行数据治理的数据中 台嵌入业务流程,已然成为核心业务系统。基于数据中台,企业具备面向全域数据、面向 数据全生命周期的管理、治理和价值挖掘能力, 进而以数据驱动业务,落地业务价值。
6、应用场景数据中台数字资产数据源数据整合数据治理数据洞察数据采集层金融政府与公共服务消费品与零售营销IT运维财务Page 8垂直行业通用职能非结构化数据成为增长主力根据Gartner分析,企业80%的数据将会由非结构化数据构成。在数据爆炸式增长的当下,蕴含可观价值信息的非结构化数据,成为数据 驱动型组织数据的增长主力。数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻 辑表来表现的数据。包括所有格式的办公文档、文本、图片、XML、 HTML、 各类报表、图像和音频/视频信息等。非结构化数据的定义非结构化数据的特点海量数据规模,且数据存储占比高数据来源丰富,分散各个系统非结构化数据
7、结构化 数据非结构化 数据知识图谱 数据全域数据机器数据Page 9传统的非结构化数据管理,内容对象、元数 据与索引是分离存储和独立管理,难以同时 灵活横向扩展,加剧海量非结构化数据的管 理复杂性。非结构化数据的特点与挑战海量多样对于非结构化数据而言,形式多样关系复杂, 基于常规单一算法技术很难识别、分析。异构非结构化数据,结构形式复杂,实体和关系 分离,建立非结构化数据知识图谱体系以进 一步挖掘深层次价值面临巨大挑战。业务数据孤岛、知识数据孤岛、桌面数据孤 岛三大数据孤岛使得文档数据分散储存,无 法统一管理,难以快速准确地搜索,业务系 统重建数据难以整合。分散Page 10非结构化数据管理需
8、要革新的底层架构非结构化数据管理需要将底层数据打通,从源头保障数据资产的复用能力, 实现数字资产统一运营、全面合规、高效利用。从数据库到数据仓库、大数据平台,传统数据架构并非面向非结构化数据 设计;再演进到结构化数据中台,非结构化数据处理能力仍然是瓶颈,非 结构化数据需要革命性的数据架构。仅仅依靠数据分析技术难以解决问题,必须将计算机视觉、NLP、知识图 谱等技术融入其中,借助深度学习等人工智能技术实现数据治理,进而实 现知识复用与智能搜索。底层数据挑战数据架构挑战智能技术挑战非 结 构 化 数 据 中 台Page 11非结构化数据中台兴起非结构化数据中台对文档、图片等 非结构化数据进行汇集,
9、融合人工 智能技术,基于先进的数据架构底 座,对非结构化数据进行整合、治 理、洞察形成数字资产,进而赋能 各行各业应用。非结构化数据中台数字资产数据整合数据治理数据洞察数据源文档、图片等非结构化数据人工智能驱动数据架构底座应用场景Page 12金融政府与公共服务消费品与零售营销IT运维财务垂直行业通用职能02非结构化数据中台助力数据驱动型组织中国非结构化数据中台 实践白皮书V2数据驱动型组织面临的非结构化数据挑战非结构化数据中台解决方案数据驱动型组织的两大需求对于数据驱动型组织而言,数据已然具备生产要素的地位,实现数据的资产化、知识化,是打造数据驱动型组织的核心支撑。数据价值挖掘 是数据资产化
10、、知识化的基本路径,在数据价值挖掘的同时,数据驱动型组织必然着眼数据安全问题,数据安全业务合规是数据驱动型组织 实现数据驱动业务的根基。因而,对于数据驱动型组织,数据价值挖掘、数字资产安全管理都是不可忽视的需求。数据是数据能力的核心。数据量、数据的使用程度、内化数据的过程 都是数据驱动型组织构建数据能力的考量因素,而能否有效地挖掘数 据价值尤为关键。数据资产安全是构建数据能力的根基。落地数据驱动型组织,数据 资产至关重要,而最大限度地保护数据资产安全,是数据驱动决策 赋能业务的基础。数据价值挖掘数字资产安全Page 14数据价值挖掘诉求是分阶段的阶段 3数据洞察数据治理阶段 2数据整合Page
11、 15阶段1整合不同终端数据,打破数 据孤岛,对数据进行统一存 储管理识别捕获数据信息,并基于 有序的制度和组织,实现数 据的管理与应用构建知识网络,建立数据间 的关系,深入挖掘数据价值对于一个企业而言,数据价值挖掘是战略层面的规划,是一项长期工作。对于整个非结构化数据中台的建设,更多的企业选择从顶层设计出 发,逐级分段建设。根据企业自身的业务目标逐级建设,从底层场景领域、从优先场景领域切入,逐步纳入更多的业务模块,以达到企业数 据能力的逐级进化和价值的持续叠加。面对海量非结构化数据,企业对于数据价值挖掘的诉求主要分为三个阶段:数据整合、数据治理、数 据洞察三个阶段。非结构化数据价值挖掘的业务
12、挑战挑战数据洞察数据治理数据整合海量非结构化数据的访问与查询 存在巨大挑战;跨地域统一内容管理易网络拥塞, 访问难;类型各异、存放在异构环境中的 非结构化数据进一步加大管理难度。挑战数据类型多样,对于数据信息识 别、内容提取面临挑战;内容与业务割裂,数字化服务能 力缺失,内容无法自动流转,人力投入成本高。挑战Page 16复合内容难以有效识别与组织利 用;隐性知识难以有效识别、表达及 获取,精准描述关键信息难度大;非结构化数据知识体系复杂,基 于知识网络洞察数据价值面临巨大挑战。数字资产安全需要立体安全企业需要搭建包括数据安全、访问安全、信息安全等在内的立体安全体系。个人信息保护法,2020数
13、据安全法,2020上市公司信息披露管理办法,证监会通用数据保护条例,欧盟,2018(GDPR)个人隐私数据企业敏感信息非法内容管控信息安全电子公文归档管理暂行办法,2003商业银行资本管理办法,2013金融企业业务档案管理规定,2015药品生产质量管理规范,2010(GMP)内容边界安全内容访问审计跨网跨地域多文档域访问安全访问安全实时杀毒数据备份恢复网络安全法,2017信息安全等级保护管理办法,2007涉及国家秘密的信息系统分级保护管理办 法,2005数据安全Page 17数字资产安全的业务挑战海量文件或小文件的备份和恢复性能严重不足,内容数据缺乏高效的保护方案文件备份性能不足病毒攻击风险形
14、态各异的病毒无孔不入,企业的数据安全面临高危风险访问安全挑战企业在内容流转过程中没有统一的方式进行访问边界控制,机密信息识别、流转安全保护尚不完善, 无法进行访问安全全面管控敏感内容、个人隐私数据、非法信息难以识别与监管,靠人工识别管控工作量大效率低,经常发生 主动或被动的泄密敏感内容泄漏信息安全访问安全数据安全Page 18非结构化数据中台解决方案助力数据驱动型组织应用场景非结构化数据中台对对象数据、元数据、 索引数据进行汇集、管理,融合人工智 能技术,提供先进的数据架构底座,构 建非结构化数据能力。非结构化数据中台基于双路径建设,实 现数据的资产化、知识化,服务于企业 多业务主题场景,包括
15、文档管理、业务赋能、知识创新等。非结构化数据中台人工智能驱动数据架构底座对象数据池元数据池索引数据池知识创新文档管理内容赋能金融政府与公共服务消费品与零售IT运维财务垂直行业通用职能营销数据整合数据治理 数据洞察数 据 价 值 挖 掘数据安全访问安全 信息安全数 字 资 产 安 全Page 19非结构化数据中台基于双路径建设实现数据的资产化、知识化数字资产安全数据价值挖掘数据整合数据治理数据洞察数 据 资 产 化知识 化数据安全访问安全知识安全非 结 构 化 数 据Page 20整合、治理、洞察非结构化数据的中台数据价值挖掘路径,非结构化数据中台主要基于业务主题落地,实现数据的整合、治理、洞察
16、,进而实现资产化、知识化,非结构化数据 中台涉及的业务主题主要有文档管理、内容赋能、知识创新。数据 治理数据 洞察非结构化数据中台整合终端、业务系统、存储上 的所有非结构化数据在非结构化数据生成时即时治 理文档管理体系、内容赋能体系利用知识图谱、自然语言处理 等人工智能技术洞察非结构化 数据知识创新体系Page 21底层数据源数据 整合立体安全的非结构化数据中台非结构化数据中台数据安全高性能备份恢复实时杀毒数据安全方案访问安全统一的权限及安全策略开放的防泄密集成密级管理访问审计敏感内容管控隐私信息保护内容脱敏基于非结构化数据中台底层架构,集成数据安全、访问安全、信息安全不同层面的数字资产安全方
17、案,从安全维度支撑非结构化数据中台 的资产化、知识化。AI技术驱动的信息安全方案访问控制及安全方案信息安全Page 22数据安全方案:数据备份恢复面向海量非结构化数据,基于对象存储的备份恢复方式面临巨大挑战,一是备份性能慢,二是恢复性能慢,而数据备份恢复性能低下的根 本原因在于单位时间内磁盘的吞吐率无法提升。备份数据中心异地灾备中心OAERP数据采集PLMMobilePCIM内容 采集文档 上传元数据OSS网 关对象 聚合 技术备份数据库对象数据关系数据编排调度服务灾备对象存储恢复备份Page 23恢复应用一致性 任务调度爱数数据安全方案采用OSS网关对象聚合技术,并结合编排调度服务,提出高性
18、能备份恢复方案,相比传统的NAS、对象存储备份恢复技术,性能得到数十 倍的提升。关键业务系统数据安全方案:实时杀毒病毒无时无刻不威胁着企业数据安全,实时杀毒是数据安全的首要任务。OpenDoc APIClient/APP/WebManagement API内容生产WindowsMaciOSAndroid终端OAERPIMPLM业务系统消息服务杀毒引擎服务业务场景Alita引擎内容流历史版本一键恢复数据中心消息服务存储服务内容开放框架指定文档库杀毒定时/实时杀毒实时杀毒爱数基于数据备份、杀毒引擎服务、消息服务等手段, 实现指定文档库杀毒、定时/实时杀毒。Page 24访问控制及安全方案非结构化数
19、据的跨网流转大幅提升操作易用性及业务效率,而保证跨网的多文档域安全数据交换,需要建立统一、安全、可控、便捷的跨 网数据交换通道。跨网环境数据交换场景,即有网络设备隔离,数据被下载之后会进行打包和加密, 以保障传输过程中的文档安全。支持添加多个平级域,多个平级域之间可 自行确认同步数据。可以支持的网络隔离设备,包括网闸、光 闸、防火墙、摆渡机、隔离器。爱数方案特性说明文档域AAnyShare跨域文档库交换文档域B备部署控制台AnyShare管理控制台 对象存储元数据服务 器单导设网络隔离设备部署控制台 管理控制台 对象存储元数据服务器下载研发区域数据处理存储节点办公区域文档集服务对象存储Page
20、 25AI技术驱动的信息安全方案传统隐私数据识别、监控及保护主要基于人工管控,但随着非结构化数据积累,基于AI技术进行隐私数据识别、隐私数据定级、隐私数据 监管,成为最有效的信息安全方案。爱数信息安全方案智能识别隐私内容自动智能识别隐私文件风险等级自动智能评估立体监控实时、分层、多视角企业隐私分布及风险动态“一目了然”高效保护AS非结构化数据中台自带隐私保护功能, 无感实现隐私数据识别和保护,极大节约人力管控成本支持DPO一键式合规设置,灵活适配CCPA、 GDPR、个人信息保护法等法规要求,极大 降低合规体系建设成本生产系统文档应用OAERPPLM终端WindowsMacWORDExcelP
21、DF隐私数据识别web业务数据办公数据InfoInsight业务应用主文档隐私数据定级隐私状态监管文档所有者DPO查看文档隐私类别查看文档隐私详情组织隐私分布状态监控部门隐私统计信息查询组织隐私管控策略设定智能识别Page 26立体监控高效保护03非结构化数据中台的应用场景中国非结构化数据中台 实践白皮书V2文档管理内容赋能知识创新基于非结构化数据中台的业务主题主要有:文档管理、内容赋能、知识创新等,不同业务主题之下包含更为具象的应用场景。在不同应用场 景中,数据驱动型组织需求侧重虽有不同,但都有数据价值挖掘、数字资产安全两个维度的需求考虑,需要基于非结构化数据中台进行数据 价值挖掘、数字资产
22、安全管理,实现不同应用场景下的业务赋能、业务合规。非结构化数据中台应用场景文档管理内容赋能知识创新应用场景业务主题非结构化数 据中台数据价值挖掘数据整合、治理、洞察Page 28数字资产安全管理数据、访问、知识安全定义:沉淀业务系统的内容,实现业 务流程自动化。典型应用场景:表单自动采集、电子 发票管理、合同管理与合规、信贷业 务管理等。定义:在数据沉淀基础之上,实现数 据知识化,落地知识运营管理。典型应用场景:产品咨询、员工培训、 项目竞标、知识共享交流等。定义:沉淀结果性文件,提高文档搜 索与部门协作效率。典型应用场景:设计文档管理、客户 数字资产生命周期管理、协作办公等。案例文档管理:业
23、务挑战文档散落存储在个人PC、文件服务器、业务系统存储、分子公司各地方,无统一检索, 无统一存储机制,对日常办公管理带来极大不便;缺乏有效的内容安全管控、在线杀毒、合规审计、备份容灾等机制,存在丢失与泄密风险。业务系统(OA,CRM,SAP,HR,邮箱系统等)笨重缓慢,随着业务系统附件逐渐增 多,缺乏合理的文档归档机制。例:制造业/新能源某新材料集团股份有限公司是一家锂离子二次电池用正负极材料专业化生产厂家,近年来集团业务规模快 速发展,传统的文档存储和管理模式面临巨大挑战。随着数字化转型的持续深入,文档数据种类多样,持续积累,成为数据资产不可忽视的重要组成部分,而传统的文档存储和管理模式已不
24、再 适应当下文档管理需求。文档管理场景业务挑战主要聚焦于文档统一管理、安全合规、数字资产沉淀三个方面。存储资源重复建设,可扩展性差;文档管理脱离业务活动,无法实现文档生命 周期流转,持续沉淀数字资产。挑战3:数字资产沉淀海量非结构化数据散落于不同终端、业务系 统甚至异地,无法统一管理,内容搜索效率 低。挑战1:文档统一管理缺乏有效的内容安全管控、在线杀毒、合规 审计、备份容灾等机制,存在丢失与泄密风 险。挑战2:业务合规Page 29文档管理:解决方案文档管理解决方案对所有结果性文档统一管理,并规定管理权责、权限以及规范,以实现文档从创建到使用流转,再到最后归档销毁的全生 命周期管理。在数字资
25、产安全方面,文档管理业务场景主要涉及数据安全、访问安全需求,需要建立内容安全管控、在线杀毒、合规审计、 备份容灾等机制,满足业务合规要求。关键业务系统OAERP终端WindowsMac非关键业务系统项目管理 扫描打印机数据采集业务合规数据应用数据安全内容总线内容数据湖数字资产管理文档统一管理非结构化数据中台访问安全智能搜索自动分类Page 30文档管理:爱数全生命周期解决方案文档管理解决方案的核心是文档全生命周期管理。全生命周期管理,是指基于与业务活动一致的流程设计,实现文档从创建到使用流转,再 到最后归档销毁的管理,以爱数全生命周期管理方案为例进行说明。分类使用归档标签摘要智 能 内 容元
26、数 据 分 析 及 检 索识别搜索统一管理规范团队协作空间个人办公空间 文档库归档库业 务 导 向加持加持文档外发安全协作移动办公业务系统调用非法内容管控文档电子化管理数据赋能业务运营延续/修订/废止/删除到 期可见 易用高效 协作安全 合规文档 不丢 失统一 存管扫描仪打印机其他终端获取电脑桌面MacWindowsLinux移动终端归档库项目资料归档库票据电子影像归档库音视频文件归档库企业文化资料Page 31文档管理:业务价值实现文档电子化,面向业务、组织部门的业务诉求形成不同的文档分类管理 和规范流程,提高运营效率针对行业合规要求,建立针对性合规管理体系,充分覆盖文档共享发布、 文档留存
27、及备份保护各个环节,建立安全设计体系,满足业务合规要求。基于业务体系建立文档管理体系,持续沉淀组织核心数据,赋能不同岗位、 不同业务领域,促进知识沉淀和复用。提升生产力业务合规沉淀核心数据制造业/新能源提升效率:研发及办公协同效率合规:为ISO27001中文档管理打好合规基础Page 32例:某新材料集团股份有限公司基于爱数非结构 化数据中台实现的业务价值文档管理:某化工勘察设计企业案例业务挑战:该企业是国家级化工勘察设计单位,主要业务包含技术研发、工程总承包、实业运营、国际贸易和投融资等。企业现采用传 统文件管理系统进行工程项目文件管理,随着文件持续累积,传统文件管理系统面临挑战。文档数据采
28、集量不足10%文档系统速度慢,用户体验差,文档安全合规管理混乱; 不支持云计算架构和海量数据存储;无标准API接口,无法对接新业务系统;对非文档数据认识不足文档数据采集挑战文件检索效率低权限规则不灵活,颗粒度不细; 缺少复杂搜索的能力;知识能力薄弱缺少自动化的内容理解能力,全靠人力整理; 知识交付能力薄弱;无法满足客户需求境外项目调用文件的速度和合规要求无法满足; 多通过国外网盘管理文件。文档数据使用挑战Page 33文档管理:某化工勘察设计企业案例解决方案:非结构化数据中台AnyShare采集结果型文件、过程型文件以及关键业务系统数据,基于内容数据湖、内容集成开放框架等 实现海量非结构化数据
29、存储、智能内容搜索以及内容安全合规。收益:文件的跨系统调用时间缩短至原来 的十分之一;将数TB图纸、报告、说明等非结构 化数据统一管理,实现文档全生命周期的保护,满足合规性要求;提供强大的全平台搜索能力和在线 预览服务,海量文件随用随搜,搜索结果随时预览;促进知识积累、留存、复用,为实 现知识运营筑基,赋能业务。结果型文件论文 入库图纸归档文件100G每年产生量15万张300篇数据汇聚过程型文件需求说明概要设计施工进度报告数据汇聚在线编辑和预览服务内容集成开放框架内容分析及检索服务内容数据湖非结构化数据中台OADPMPMS4.0DMS知 识 运 营API集成数据调用关键业务系统办公文档和业务文
30、档知识化海量知识沉淀项目资料自动、合规流转员工/合作伙伴培训赋能智能知识查找智能知识推荐Page 34内容赋能:业务挑战内容赋能核心在于智能识别提取业务系统内容,实现业务流程的自动化。内容赋能业务聚焦于聚焦于业务系统整合与治理、业务流程自动化、 业务应用开发三个方面,面临数字化服务能力、IT管理、使用者体验、一致性风险以及业务合规等挑战。数字化服务能力大量的内容受困于孤立的业务应用中,缺失 内容服务能力,无法适应多样化的业务发展 和用户使用要求,内容价值无法体现。业务合规面对国内外日益严格的合规要求 (GDPR,个人隐私安全法),各个业 务系统中碎片化存在的内容,蕴含着 大量合规风险无法有效识
31、别。IT管理业务系统与文档脱离,系统间接口过于复杂, 易形成内容蜘蛛网,维护难度巨大,缺少标 准化内容管理规范进行统一管理。一致性风险内容在不同业务系统中流转,需要人工覆盖 割裂的环节,带来内容一致性的风险。使用者体验内容在不同的业务系统中碎片化存在,形成 孤岛,无法实现跨业务的统一使用统一检索 的体验。Page 35内容赋能:解决方案非关键业务系统项目管理扫描打印机终端关键业务系统OAERPWindowsMac内容采集内容赋能表格数据文档的文本影像数据内容提取数据转换OCR图谱标签内容分析数据内容数据内容元数据内容管理体系架构内容总线内容数据湖内容提取数据转换OCR图谱标签流程自动化 业务数
32、据贯通 电子档案管理 合同管理 SAP内容管理流程自动化业务数据贯通内容处理服务电子档案管理 合同管理拓维合同管理方案SAP智能内容管理内容生态应用网智电子档案管理OCR内容识别方案非结构化数据中台Page 36基于非结构化数据中台能力,集成OCR等第三方生态应用,实现内容赋能业务运营。内容赋能:业务价值内容与业务结合,提高业务运营效率。内容数据结构化,自动化流转,降低人力投入。充分利用内容价值,实现数据资产化,赋能更 多业务场景。提升生产力统一内容服务能力赋能给各业务系统,避免 重复造轮子。内容总线架构,显著降低业务集成复杂度, 敏捷式构建统一内容管理。降低TCO内容基于业务自动流转,避免人
33、工参与带来 的合规风险。统一内容管理,解决各业务系统在非结构化 数据管理方面的短板,实现内容安全管理、高性能备份、归档等合规要求。业务合规某保险集团:“业务+数据”双中台实现7个主要业务系统的线上数据整合,设计面向业务自主分析的6大主题数据集,报表 查询效率由原先数分钟提升至秒级;实现线下5T文件资料的文档云集中管理,探索线下数据价值应用连接业务中台,业务文档全流程打通,自动流转,合规且高效预览、属性查询等服务直接调用,告别重复造“轮子”理赔在线体系Page 37集团项目管理系统承保在线系统账单与结算在线系统合同管理场景:某制造业企业案例业务挑战:某制造业企业的市场部负责合同的录入以及合 同筛
34、选支撑销售招投标,业务人员较少但合同 数量持续增长,合同管理面临挑战。人工录入合同,效率低,人工成本高;制造业合同包含大量非结构化数据,无法 直接检索需要人工逐一识别,处理效率低;合同内容与ERP系统供应明细存在不一致现 象,需要人工对合同内容逐一审查。收益:录入合同、辅助销售找寻对应合同人力投入下降50%,且人力主要用于合同关键信息的校正确认,查找投标用的合同证明完全基于中台实现;保留下来的合同电子件及其内容元数据信息,还可用于更多业务场景,比如大量的合同内容需要进行内容合规和风险审查,也可以基于一个基础平台进行 拓展。CRM系统合同扫描件PDF合同编号及链接合同管理系统合同各类关键信息An
35、yShare Family 7 智能内容云合同扫描件A合同扫描件B合同扫描件C图片自动标签巊图片OCR识别合同中供应明细鲶图片摘要荈叻霆僈 兰腊唬程投标文件电子版PDFPage 38合同管理场景:某运营商案例业务挑战:某运营商合同管理系统的用户规模超40万,年新增合同100万份+,合同合规面临巨大挑战:合同拆分逃避审批难察觉,合 同审批比对费时费力(电子合同、合同数据、打印合同),海量合同履约风险,基于合同的关键条款识别与任务匹配难。解决方案:基于AnyDATA构建合同知识网络,识别合同内容条款知识以及合同关联公司、项目对象,与合同法律法规内容进行匹配, 识别合规风险,主要用于合同及合同方关系
36、分析及风险管理、合同条款内容合规性及风险发现。知识提取:合同结构化内容数据湖内容文本文本标签、分 类、摘要内容分 析服务合同分类甲方:xx乙方:yy标的物:zz金额:M定金:N签订日期:DD免责条款:无合同管理系统数据一致性检查;条款完备性检查;条款准确性检查;履约合规性检查;关联公司异动风险检查;合同起草合同审批合同上传合同定稿合同履约激活业务人员审批人员OCR识别与自动录入元数据同步履约风险提醒监管人员业务人员合同知识网络合规性检测服务于审批、履约管理风险分析与评估知识创新:业务挑战例:某集团企业原有知识管理现状与痛点积累几TB的文件,大量的标签,全文检索异 常慢,文档稍微大一些就需要下载
37、查看,用 户体验极差。每个部门设置知识管理员,定期收集业务知 识文档,繁琐、低效、业务骨干繁忙配合不 够,每次领导发话推动的运动式收集稍有成 效。每次收集文档打标签、上传到分类编目非常 麻烦,知识标签库维护异常纠结;用户活跃度低,经常反馈需要的找不到想要的知识和文档,看到的版面千篇一律;对于数据驱动型组织而言,数据知识化可以推动学习型组织建设,赋能业务运营,更进一步以知识网络为核心挖掘数据价值,驱动业务创 新,支撑战略决策。知识创新场景之下,实现数据知识化面临知识层面的多项挑战。科技企业海量知识的管理、拓展、安全性挑战传统系统架构侧重应用逻辑,难以应付海量 文档管理、拓展和安全性挑战。用户和场
38、景导向的个性化推荐挑战针对知识的关联和个性化推荐需求迫切,建 立精确有效的知识网络支持业务赋能面临挑 战。知识收集、整理依赖人工桌面文档知识完全依靠定期收集、整理、大 量业务过程的桌面文档知识完全依靠人工收 集、整理,员工不胜其烦,难以持续;传统知识分类、标签主要依靠人工整理和编 辑,工作量大,成效堪忧;Page 40智能化知识搜索挑战传统知识搜索不支持细粒度知识抽取、管理、 分析;也无法支持用户搜索意图理解,难以 快速、精准找到需要的知识。知识创新:解决方案智能知识运营方案助力知识创新体系建设。以爱数案例为例,通过AnyShare实现海量内容数据的汇聚,并利用自然语言处理和知识图谱等 人工智
39、能技术,由AnyDATA构建企业私域数据知识网络,形成一个千人千面、个性化、智能化的知识中心,并通过智能知识整合场景赋能 业务系统和流程。第三方业务/培训系统:内嵌知识应用概念 知识智能 搜索个性 推荐自动 标签非法内 容管控隐私数 据识别支撑支撑支撑内容平台提炼团队内容协作文档管理内容管理知识库A知识库知识库B知识库N知识网络意图理解能力用户画像 知识抽取服务知识搜索能力知识图谱文档对象模型训练服务概念对象个性推荐能力业务对象 知识标注服务企业知识中心 Knowledge Center主题知识卡片知识文档卡片个性推荐知识社区文档知识化 智能分析推荐OfficePDF智能表格文档库A文档库NP
40、age 41构建企业私域数据知识网络,打造企业知识大脑企业私域数据知识网络知识网络项目图谱客户图谱情报图谱关 系 A 项 目2关 系 A 客 户2关系 A 友商2项目1客户3友商3关系 B关系 D关系 D关系 D关系 C项目4关系 C关 系 B 客 户1关系 C关系 B 友商1 项目3客户4友商4合同规则知识库结构专业图谱关 系 A 条 款2关系 A 结构2条款1结构1关系 D关系 D关系 B关系 C条款4关系 C关 系 B 结 构 4条款3结构3找客户 找项目 找友商知识服务精准知识搜索与智能推荐内部市场文档内部项目资料 内部竞争分析外部市场文档 外部相关项目 外部情报信息客户系统/项目管理
41、系统/服务系统业务关系模型知识主题/标签文档知识模型文档知识库知识主题、知识文档Page 42知识创新:业务价值缩短工作交 接时间缩短工作培训 时间节省培训费 用知识复用提 高效率、节 省成本问题重复发 生率降低节 省成本隐私保护业务 合规提高工作效 率现有员工1000余人,约500人使用知识管理系统,在知识搜索、工作 交接、新岗培训层面,大约可节约40000工时/年;公司全员培训费用为每人约3500元/年,通过知识管理系统进行共享 学习和经验交流,可以提高培训效果以及减少外出,保守估计可降低 25%的培训支出;技术中心研发类报告编制时,知识复用程度大幅提高,在同等工作强 度下,知识产生的数量
42、较往年有37%增加,质量未受到影响;通过问题事后学习,事前预防,有效规避研发制造过程中出错的概率,较以往节约研发和测试成本1.4亿/年;科技企业例:某高科技公司基于爱数非结构化数据中台实现知识运营的业务价值 定量衡量Page 43业务挑战:该企业从事建筑方案设计、施工图设计,属于知识密集型企业,基于知识沉淀实现知识运营是落地数据驱动型组织的关键。该企业知识管理面临的 问题主要有:如何快速准确找到设计参考资料包括设计图片、如何减少知识整理的手工工作量、设计新人学习,如何让知识找人。解决方案:知识运营整体方案包含AnyShare Enterprise内容平台、AnyDATA知识网络、AnyShar
43、e Knowledge Center知识中心应用三大产品组合形成,分 别对应内容管理平台、知识网络以及知识运营中心,形成一个现代化、智能化的知识创新体系。知识创新:某建筑设计企业的项目知识运营大量内外部设计参考资料,设计过程资料,特别是设计效果图,如何 快速服务于新的设计项目,需要精准知识搜索、图片搜索。精准知识与图片搜索不能接受维护标签库、打标签大量的人肉运营工作,必须自动化。简化运营复杂性,设计师繁忙,重点围绕专业主题/知识交流互动,简化知识整理和运营互动避免千篇一律的知识门户,希望根据用户角色、岗位、爱好,实现个 性化的知识推荐。让知识主动找人AnyShare Knowledge Cen
44、terAnyShare EnterpriseAnyDATA知识中心内容管理平台文档统一生命周期管理、数字资产安全;文档过程共享协作与知识自动归集;统一文档知识库;文档智能检索、图片智能检索;Page 44知识网络基于业务标签的知识主题自动生成文档与知识主题自动归集;基于标签的知识主题与知识文档推荐基于用户画像的知识主题与知识文档推荐知识卡片:知识主题、知识文件;知识运营:社区式分享、激励、 互动问答解决方案文档知识化 智能分析推荐知识创新案例:智能的知识与图片搜索经过业务知识关系优化的知识精准搜索推荐;经过机器学习训练的建筑设计图片智能检索;基于知识网络的精准知识搜索推荐(搜索意图匹配:搜索关
45、键词与知识标签直接及间接匹配度越高,越接近用户搜索意图,推荐越精准)面向建筑设计行业的图谱智能检索(经过大量机器学习,搜索图片内相关建筑样式、风格,实现以图搜图、以文搜图)知识创新案例:千人千面的知识中心千人千面的知识主题、知识文件推荐(用户画像、知识主题与标签:来自知识网络)知识主题自动发现、文档自动关联、专家互动(主题发现、自动关联:来自知识网络)知识主题发现和描述生成,减少主题编辑工作量;知识主题与AnyShare知识文件自动关联,减少上传归集工作量;知识主题、知识文件基于用户画像自动推荐;知识创新案例:社区式知识圈知识专家交流互动:知识问答本知识文件所在知识 主题下其他知识文件(相关文
46、档推荐)知识评论互动包含本知识文件的 其他知识主题(主 题标签的相关推荐)社区式知识圈:知识主题互动、知识文档互动、知识专家互动;无处不在的关联推荐、个性化推荐;04非结构化数据中台的建设指南中国非结构化数据中台 实践白皮书V2非结构化数据中台建设方法论非结构化数据中台的具体建设路径非结构化数据中台建设方法论战略技术数据服务运营 体系体系体系体系体系 规划需求调研 蓝图绘制开发 交付持续运营非结构化数据中台是企业数据创新运营的体系,需要从战略、组织架构、建设内容等方面进行考虑,并需要一套完整的实施交付方法论实现 战略到业务的落地。战略非结构化数据中台需要定位于企业级战略。组织运营组织运营非结构
47、化数据中台需要企业组织运营架构提供必要保障支撑。内容非结构化数据中台的建设主要包括技术体系、数据体系、服务体系 和运营体系等内容。交付方法论包括体系规划、需求调研与蓝图绘制、开发与交付、持续运营。Page 49中台战略中台建设是一个战略项目,是一个变革项目,需要从顶层规划开始,自上而下推动。制定中台战略,业务战略、数据战略以及战略落地 保障是三个重要考量维度。战略落地保障数据中台战略落地需要有相应的文化、 制度、流程、资源的保障。数据文化是重视、实践、鼓励使用数据 来改善决策的集体信念和行为,比如分享和社区的建立。制度、流程层面,主要在于优化,以适 应数据中台引入的新业务模型。资源层面,包括基
48、础设施资源、技术储备、人才资源等。从业务战略切入数据中台建设始终围绕业务价值,而中 台战略的制定也需从业务战略切入。明确数据中台的价值。基于业务战略规 划,明确数据中台在业务战略实现过程中的价值,制定数据中台项目落地评价 指标。设定用例规划。基于业务战略规划开发 场景的优先顺序,挖掘对客户和企业最具价值的领域以及核心应用场景。制定数据战略数据是企业的战略资产,结合业务梳理 制定全面清晰的数据战略,是数字化转 型的基础。梳理企业数据流全貌,包括系统类型, 存储方式,访问频率,价值高低等,指 导企业数据规划:价值识别、采集存储、 处理加工、分析挖掘、交易使用建立数据治理体系,数据治理包括战略层的标
49、准和流程制定、数据基础架构技 术战略管理、统一的集成交换技术标准 等。Page 50组织运营架构建设数据中台企业高层 支持推进建设团队维护团队运营团队产品团队业务团队数字化正在重塑人们的工作形态,非结构化数据中台所包含的技术、组织、方法论的革新衍生出全新组织运营架构需求。重塑组织运营架构, 主要需要思考数据中台由谁来建、谁来维护、谁来经营、业务需求如何承接、效果怎样衡量等问题。中台的建设、维护、运营以及业务的承 接、中台服务的推广等,需要建立数据中台团队支撑;同时,业务、后台、管理等团队需要有对应的组织人员与中台团队对接,以适应企业 中台运转模式。中台组织运营架构后台团队管理团队业务团队Pag
50、e 51数据中台的内容Page 52数据中台建设的核心是内容建设,是可呈现的产出物,也是数据中台的价值所在。数据中台的建设内容包含技术体系、数据体系、服务 体系、运营体系四大体系。技术体系主要是指数据基础架构,为企业数据治理与服务提 供技术平台和能力。分为两个层面,大数据存储计算技术与 数据中台工具技术组件,工具技术组件是核心关注点。数据体系是数据中台建设、管理、使用的核心要素。数据中 台始终围绕数据体系的建设和使用,针对不同企业的不同业 务,建设不同的数据体系。技术体系数据体系服务体系是通过数据中台的服务组件能力,把数据变成一种 服务能力,让数据能够方便地参与到业务中并为业务带去价 值。运营
51、体系包括平台流程规范执行监督、平台资源占用的监管 及优化推动、数据质量的监督及改进推动等,是数据中台得 以健康、持续运转的基础。服务体系运营体系TPA交付方法论T(Think)-P(Plan)-A(Action),是从企业的数据驱动战略以及业务模式出发,为企业提供专业的端到端的咨询、开发和交付的服务 方案,并通过大数据基础设施进行有效落地,帮助客户实现数据驱动战略,带来实质性的投资回报。开发与交付需求调研与蓝图绘制体系规划持续运营企业愿景与数据战略评估非机构化数据管理现状规划目标蓝图设计演进路线问题定义/范围应用场景需求非结构化数据中台方案蓝图数据资产化数据服务化数字资产安全机制数据资产与服务
52、设计数字资产安全设计业务持续支持新业务探索应用场景支持迭代回顾与增强系统持续支持检视与调优基于业务诉求、愿景目标和战略 规划,规划整体方案体系、交付 路径等。业务、产品、技术之间协作,打 通端到端的业务价值流。持续技术深化,打造非结构数据 中台,交付有效业务价值。适应应用场景/应用需求变化, 持续交付有效价值。ThinkPlanActionPage 53TPA方法论的敏捷交付理念本质而言,敏捷交付不仅是一种能力,更是一种理念。基于TPA方法论,在体系规划与蓝图绘制阶段采用分阶段建设思路,配合持续运营模 式,实现持续、高质量地交付非结构化数据中台有效价值。对于数据驱动型组织而言,非结构化数据从治
53、理到洞察,从数据价值 挖掘到数字资产安全,是一项战略层面的规划,但对于一个企业而言, 更期待持续交付可衡量的有效价值。分阶段建设思路是指,在体系规划与蓝图绘制阶段分析项目难度,根 据项目难度分阶段部署落地,持续高质量交付非结构化数据中台价值, 包括从部门到部门、从场景到场景、从业务主题到业务主题的分阶段 交付。持续运营,一是针对已交付产品,根据客户需求的变动以及技术推动, 持续优化产品价值;二是针对蓝图规划中的不同阶段,基于TPA方法论 持续交付;三是针对持续涌现的新应用场景,快速响应,实现有效价 值交付。分阶段建设思路持续运营知识创新业务赋能文档管理阶段 3阶段 2阶段1业务设计产品设计产品
54、交付业务验证业务反馈和调整Page 54敏捷交付案例:助力某建筑设计公司实现知识运营项目背景:某建筑设计公司,从事建筑方案设计、施工图设计,包括规划、建筑、结构、室内、绿建等各专业。作为知识密集型企业,如何 将内部设计结果、经验转化为企业知识,实现知识运营,对于落地数据驱动型组织至关重要。项目三期项目二期项目一期主要为理正协同设计平台做底层开发及企业 内部体系梳理。筑森所有的应用系统数据都会迁移到 AnyShare Family7中,并应用知识图谱技 术,实现以文搜图、以图搜文的功能。根据筑森的实际需求构建企业内部的数据 湖,实现针对于非结构化数据的数据洞察。内容基础架构01海量、分散带来的安
55、全、合规风险;业务独立性、可检索性、内容合规 性。文档管理02文档管理体系是知识管理的基 础业务内容管理03设计流程中的大量内容存储压力、 可管理压力、检索能力。知识管理04知识分类组织及建设;知识数字化运营及激励;知识的多样性呈现及运营需求剖析敏捷交付Page 55非结构化数据中台建设路径文档管理体系建设阶段 2有序的电子文档管理文档管理体系规划及目标需求调研与蓝图规划系统建设与初始化系统上线及运营基于业务构建文档分类、文档 组织、文档流转等体系制度, 开展全面的文档生命周期管理。内容赋能体系建设阶段 3全面的内容管理及赋能内容赋能体系规划及目标内容赋能场景调研及蓝图内容赋能应用开发及上线将
56、内容通过业务集成、内容应 用、流程自动化等方式融入业 务场景中,打通业务与内容, 实现业务赋能。非结构化数据中台基于业务主题分阶段建设,整体建设路径主要分为四个阶段,分别是评估与规划、文档管理体系建设、内容赋能体系建 设、知识创新体系建设。文档管理体系内容赋能体系知识创新体系知识创新体系建设阶段 4知识创新与运营知识创新体系规划及目标知识库、知识网络、知识中心 建设智能知识应用规划设计知识运营机制建立基于内容飞轮架构,智能知识 运营方案助力知识创新体系建 设,实现知识赋能,构建数据 驱动型组织。阶 段 1 现状、起步评估、规划数字化战略规划;项目目标设定;演进路线规划;Page 56文档管理体
57、系建设文档管理体系的建设流程主要有:文档管理体系规划及目标,需求调研与蓝图规划,系统建设与初始化,系统上线及运营。Step TwoStep OneStep ThreeStep Four基于数字资产管理与安全维度 的需求调研,制定业务蓝图。平台开发交付与运营体系规划及目标评估非结构化数据管理现状规划目标蓝图设计演进路线需求调研与蓝图规划企业级文档分类体系元数据体系权限体系文件夹结构用户组织与角色文件工作流数字资产安全体系文档管理制度定义系统建设与初始化初始化用户信息初始化文件夹、权限、元数 据等相关设置文档数据迁移运营体系建设审计体系建设系统上线及运营用户培训及UAT生产系统切换系统试运行系统持
58、续运营系统推广业务价值指标体系建设根据非结构化数据管理现状, 确定整体建设规划及演进路线。ThinkPlanActionPage 57内容赋能体系建设内容赋能体系的建设流程主要有:内容赋能体系规划,内容赋能场景调研与蓝图,内容赋能应用开发及上线。对于内容赋能体系,除单一 业务场景体系建设之外,同时涉及新增业务场景的持续交付。根据内容赋能体系成熟度现状,确 定整体建设规划。基于业务场景的赋能、合规需求调 研,制定内容赋能场景蓝图。开发、交付与持续运营Step One内容赋能体系规划内容赋能体系成熟度评估内容赋能场景价值评定内容赋能体系目标制定新增业务场景Step Two内容赋能场景调研及蓝图业务
59、系统核心流程梳理业务系统内容服务集成现状梳理业务系统内容高服务缺失识别业务系统公共服务能力归纳内容赋能场景蓝图Step Three内容赋能应用开发及上线业务系统集成整合业务流程集成对接内容应用开发及测试内容应用联调及演练内容应用上线实施内容应用运维保障ActionPlanThinkPage 58知识创新体系建设知识创新体系的建设流程主要有:建设内容平台、构建知识网络、打造知识中心、创新知识应用。建设内容平台利用内容总线、内容数据湖 实现端到端知识库体系:业务活动的知识自动归集、 自动标签(桌面和业务流程);知识分类及知识库建立汇聚构建知识网络利用人工智能、知识图谱技术 实现知识自动抽取和关联:基于文档知识模型,抽取业 务知识和关系,构建知识网络;基于知识网络,实现文档与知识主题自动关联、精准知 识搜索、个性化推荐洞察打造知识中心利用企业知识中心实现社区 化知识运营:知识卡片:知识主题、知识 文件知识运营:分享、激励、互 动组织创新知识应用Page 59通过实时的内容平台和知识网 络实现赋能业务场景:赋能业务流程的智能化知识应用(知识应用无处不在): 精准知识搜索、场景知识自 动关联、用户个性化推荐赋能基于TPA交付方法推进知识创新体系建设05非结构化数据中台的未来趋势中国非
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024工程监理委托合同
- 2024年网络密码机项目评估分析报告
- 2024至2030年中国野生苦瓜茶行业投资前景及策略咨询研究报告
- 2023年安神补脑类药物项目评价分析报告
- 2024年红外线气体分析仪项目评估分析报告
- 2024至2030年中国液-液转盘萃取塔数据监测研究报告
- 2024至2030年中国挂臂式牙钻行业投资前景及策略咨询研究报告
- 2024至2030年中国大型模具用气弹簧数据监测研究报告
- 18项医疗核心制度要点
- 内蒙古呼和浩特市(2024年-2025年小学五年级语文)统编版期末考试(下学期)试卷及答案
- 压力管道竣工资料
- 无张力疝修补术后补片感染的临床分析
- 预制钢筋混凝土盾构管片质量验收标准
- 六年级科学上学期期中质量分析
- 油漆用量计算公式表
- 船舶结构与设备 第5章 舵设备
- 桩承台基础与桩筏基础对比成本
- 日事日毕-日清日高PPT
- 厂区内雨水排放管理制度(共1页)
- 部分主板集成LSI1068E芯片的SASRAID设置解析
- 海尔公司网点备件系统操作流程指导
评论
0/150
提交评论