商务智能概述及发展趋势_第1页
商务智能概述及发展趋势_第2页
商务智能概述及发展趋势_第3页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

商务智能概述及发展趋势

一商务智能的定义及分析

1.商务智能是什么

商务智能的定义不说多如牛毛,也是众说纷纭。人们对商务智能的理解如同那七个印度盲人对大象的理解:有人认为它是高级管理人员信息系统,有人认为它是管理信息系统,有人认为它是决策支持系统;也有人说它是数据库技术,数据仓库或者数据集市……

其实,商务智能真正的含义应该是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升各方面商务绩效,增强综合竞争力的智慧和能力。当然,这种说法也许过于笼统,也太过抽象,那就让我们分成几个方面来一一分析。

1.企业——这里用“组织机构”或“实体”会显得更完整,因为所有的组织机构和实体(不只是企业)都可以而且应该利用商务智能;之所以仍用“企业”是为保持与“商务”的一致性。各行各业,包括非企业性机构,比如政府部门、教育机构、医疗机构和公用事业等,都应该而且能够利用商务智能。

2.利用现代信息技术——这是这一定义中的关键之一,现代信息技术的发展产生了信息经济和信息社会,在这一新型的经济和社会形态中,信息的爆炸式激增又产生了对能够处理和控制信息的新技术的强烈需求;商务智能就是新的信息技术在商务分析中的有效利用。商务智能过程中所涉及的信息技术主要有:从不同的数据源(交易系统或其他内容储存系统)收集的数据中提取有用的数据,对数据进行清理以保证数据的质量,将数据经转换、重构后存入数据仓库或数据集市(这时数据变为信息),然后寻找合适的查询、报告和分析工具和数据挖掘工具对信息进行处理(这时信息变为辅助决策的知识),最后将知识呈现于用户面前,转变为决策。

3.收集——收集数据是管理和分析数据的前提,数据收集工作是十分重要的,必须引起企业的充分重视,在这方面中国企业与世界上发达国家中的先进企业之间的差距非常大,这是商务智能在中国还不能很快成熟起来的重要原因之一,这应了中国的一句俗话:“巧妇难为无米之炊”。数据和信息的收集主要是通过各种交易系统进行的,比如企业资源规划(ERP)、客户关系管理(CRM)、供应链管理(SCM)和电子商务等系统。随着中国企业在这些方面的进步,数据和信息的数量会快速增长的。另外,信息,特别是非结构化的信息,来自公司各个部门和各个员工创造和收集的、没有放在上述交易系统中的内容。第三方也是企业收集数据和信息的一个重要来源,这样的外部数据和信息包括市场调研报告、人口统计报告、顾客信用报告等。

4.管理——这里的“管理”主要是指对数据的储存、提取、清洗、转换、装载、整合等工作,其目的主要是为了提高数据的质量和安全性。

5.分析——“分析”是一个广泛的概念,这里包括数据查询、数据报告、多维分析、数据挖掘、高级统计分析等。大多数人理解的商务智能都集中在这些分析工具上。

6.结构化——结构化的数据主要是指储存于各个交易系统背后的关系型数据库中的数据,通常都是以表格的形式存在和展现的。传统的商务智能概念只包括这种结构化的、可定量的数据。

7.和非结构化的——非结构化的数据和信息主要是上面的提到的各个部门和各个员工创造和收集的、没有放在各种交易系统中的内容,通常是以零散的文件形式存在和展现的;新的商务智能概念纳入了非结构化内容的分析,但是非机构化的内容的管理仍然主要是通过文件管理和内容管理(DocumentManagement&ContentManagement)软件来进行的。

8.商务数据和信息——商务数据和信息并不能加以狭隘的理解,这里所致的商务数据和信息包括一切可能对商务产生影响的、直接和间接的数据和信息,往小里说包括顾客的名字、地址和电话号码等,往大里说包括过国际上的政治、经济、文化和军事情况等。

9.创造和累计商务知识和见解——这是商务智能的第一层的目的和功能,也是最直接的目的和功能;“知识和见解”正是“智能”得名的由来。

10.改善商务决策水平——这是商务智能的更高一层的目的和功能,企业能否利用好这一功能、实现这一目的在很大程度上取决于领导者的意识和胸襟以及企业文化中决策科学化和民主化的成分。

11.采取有效的商务行动——采取有效的商务行动是创造和累计商务知识和见解、改善商务决策水平的目的和动力。商务智能是能够指导实战的高明兵法,而不是“无所不知、但无能为力”的“纸上谈兵”。

12.完善各种商务流程——残缺、散乱、僵化、低效的商务流程是企业的顽疾,商务智能能够为这一顽疾的诊断和治疗做出一定的贡献;优化后自动化(请注意先后顺序)的商务流程反过来也会促进商务智能的发展。

13.提升各方面商务绩效——这是商务智能在企业内部的最高目的和作用,有效的商务智能系统和技术能够帮助企业提升各个方面的绩效:财务的和非财务的,前台的和后台的,企业内的和供应链内的,组织的和个人的。企业绩效管理已成为热门的管理和技术概念,这既是因为各种软件厂商的推动又是因为企业所面临的绩效方面的压力的增大。

14.增强综合竞争力的——这是商务智能在企业中的最高目的和作用。商务智能事关企业的兴衰成败和生死存亡。如今以及未来企业之间的竞争是主要是综合智能上的竞争,不管是中国企业还是外国企业,不管是国营企业还是民营企业,不管是大企业还是小企业,都必须提高企业经营和竞争活动中的智能水平,争取成为优秀的智能企业,否则一定会落后于智能上高人一等、捷足先登的企业。

15.智慧和能力——把商务智能分为智慧和能力是因为真正的商务智能既有思想层面也有行动层面(而且“智能”本身可以一分为二、二合为一)。

关于商务智能的所有图示之中与笔者上述定义最接近的是美国数据仓库研究院2003年推出的题为“二十一世纪的聪明公司”的调查报告中把商务智能比作“数据炼油厂”的图示(见图1)。

图1作为数据炼油厂的商务智能

资料来源:美国数据仓库研究院()

2.商务智能不是什么

虽然这样的定义已经比较清楚、详尽,但是估计还是有许多读者不能完全理解什么是商务智能。这也不奇怪,因为商务智能作为一个分析型系统只有在与企业的交易系统(订单输入、库存和运送等功能)相比较才能显得更加明了。

商务智能与交易系统之间的差异主要体现在系统设计和数据类型上(见表1-1和表1-2)。交易系统把结构强加于商务之上,不管谁来进行一项交易活动,都会遵循同样的程序和规则,而且一旦一个交易系统设计出来以后,轻易不会改变。而商务智能则能适应商务,因为它是一个学习型系统,能不断适应商务不断变化的需求。在商务智能系统中,变化越多越好。如果商务智能不能变化以解决新的问题,就不能满足商务的需要。从技术的角度讲,商务智能系统中变化的是数据、数据模型、元数据、报告和应用软件。商务智能的真正挑战就在于设计和管理一个总在变化的系统,这好比是一个没有终点的旅行。

表1-1商务智能系统与交易系统在系统设计上的差异

交易系统

商务智能系统

流程自动化

决策支持

设计目标为效率

设计目标为效果

为商务设定结构

适应商务变化

对事件做出反应

预测事件

创造最优化的交易环境

创造最优化的查询和分析环境

资料来源:美国数据仓库研究院

交易系统和商务智能的区别还在于各自所管理的数据的类型不同。交易系统跟踪的是最近的交易情况,保留极有限的历史情况(通常只有60到90天)。而商务智能系统维持来自多个交易系统的、好多年的交易情况,因而许多企业都保有几十甚至上百个Terabytes的数据(美国的希尔斯商店70个Terabytes的数据,第二大折价连锁店凯玛特有90个Terabytes的数据,第一大折价连锁店沃尔玛到2002年底就有284个Terabytes的数据,联合利华单独北美公司就有106个Terabytes的数据)。商务智能系统通过总结和计算建立需要跟踪的商务指标。商务智能之所以要从交易系统中独立出来,是因为二者放在一起会互相影响、两败俱伤,后者不能保证查询、分析和报告所需要的速度,前者影响后者的正常运行。

表1-2商务智能系统与交易系统在数据类型上的差异

交易系统

商务智能系统

当下

历史

不断更新

定期更新

因来源不同而不同

整合的

以应用软件导向的

以主题为导向的

只有细节层面的

细节的、总结过的和衍生的均有

3.关于商务智能的哲学思索

当前BI的发展一定程度上受制于用户和开发者双方对于BI的认识偏差进而导致的不如意的实施结果现状。以下列举了实际BI项目的常见问题,这些问题在当前的BI体系并不能解决。

对于用户而言,存在的问题是:BI实质是什么,应该如何理解BI?面对众多的BI产品及其不同功能的版本,我们应该选择什么样的BI产品才能适合本企业?BI建设应该做成什么样?对于本企业的BI如何评估难度和深度并据此考虑经费、周期等问题?未来本企业做BI还应是怎样?

开发者则应该思考:如何能将我们的概念融入用户的意识?怎么样向其介绍BI才能相互和谐?如何和用户共同发掘需求并顺利推荐相应的产品及其功能?如何让客户理解本次BI项目的难度而不致于对支出“讨价还价”?

上述问题广泛存于各种BI项目中,原因主要是BI体系不完整和BI厂商和代理商的宣传诱导。

(一)当前BI体系的不完整性和片面性导致人们认知偏差

与BI的定义相比,当前对BI体系的讨论相对较少。以下介绍部分著名国际厂商的BI体系,从中可知当前BI体系在认知上偏重于技术,“盲人摸象”必然导致一些方向性的错误。

微软的BI体系

图2是微软的BI体系。由三个圈层组成,最里是数据库,最外是应用功能。共列举了七项应用,如BI共同作业、可视化、地理空间分析、点击流向分析、零售与营销分析、项目管理、资料分析。可见该体系核心意思是根据数据库中的数据实现各种应用,体现的是BI的一般思路。

图2微软的商业智能体系

IBM的BI体系

图3是IBM的BI体系,底层是软、硬件平台、中间件、安全和元数据管理等。其上反映了BI中的工作流和数据流,从右到左是数据源、数据整合、分析以及接口。IBM的BI体系较详细描述数据的转变和应用过程以及实现数据转变和应用的保证过程,核心是解决数据如何用和数据准确性问题,显然是技术思维。

图3IBM的商业智能体系

国内研究者的BI体系

国内研究者杨林认为BI的系统框架由四个层面组成,如图4所示。该四个层面构成金字塔形式,最底层是信息系统层面、其上是数据分析层面,再上是知识发现层面,顶层是战略层面。该框架注重了管理层面,但是应用性显得不够。

图4BI框架

上述体系,侧重于技术角度以详略不等的程度体现BI从数据到应用的过程。IBM增加了该过程的管控和安全。美国数据仓库研究院展示了BI的结果对策略和行动的关联和影响。这些BI体系全面性和贴近应用性有所不足,或者用户不能深入理解,只简单的仅将BI当作利用数据的过程;或者开发者只知BI实现过程而难以明白实现结果以及原因,以致无法达到用户和开发者之间的顺畅交流。

(二)BI厂商及其代理商的宣传侧重或诱导加大了人们的认知偏差

BI产品按功能分为:数据仓库、OLAP报表工具、ETL工具、数据挖掘工具等。

当前还没有实现整个BI过程的产品,各厂商只拥有过程之中的某一类或几类产品。如SPSS的产品侧重于分析和挖掘,BO公司产品侧重于OLAP分析和报表展示(BusinessObjects;CrystalReports),Cognos有分析和展现工具。另一方面,即使是同一BI过程的产品,不同公司也有其差异。因此,在泊来词“BI”面前不了解BI的用户身处各厂家的宣传中必然迷失方向。

可见,由于BI用户的“无知”,各BI厂商的差异化策略形成了“差异化基础上的差异化”,而不是“标准化基础上的差异化”。由此导致了用户和开发者之间的沟通交流受阻,甚至是单方面的诱导用户的沟通,这显然不利于BI行业的发展。

因此,以哲学思维构建体系是解决当前BI体系问题的根本途径。

当前BI体系仅侧重于技术上如何做BI,显然这种仅在“墙上完善一个洞”的方式,无论在这个洞上如何精细完善,都难以达到用户和开发者对完整认识的统一,难以共同促进产业发展。这种形势需要借鉴“现有的洞”然后在“墙上另打一个洞”并与“现有的洞”相连接,形成一种新的利于用户和开发者交流的BI体系并解释、描述和操作,以达成共同的理解和认识。这既方便于用户判别各厂家的宣传侧重和诱导,也能让开发者更能了解用户对BI的正确认知结构从而便于沟通和交易,最终实现“标准化之上的差异化”,减少沟通成本。

《辞海》对体系的解释是若干有关事物互相联系互相制约而构成的一个整体。据此定义,BI体系即是关于BI的有关事物互相联系且相互制约而形成的整体。

如何构建BI涉及有关事物互相联系且互相制约而形成的体系?笔者认为以哲学思维切入,从本体论和方法论的角度阐释并构建本体论和方法论统一的体系,才能将BI有关事物及其关系描述清晰;同时哲学思维的回归,使不同经历、不同知识和实践水平的用户和开发者可以基于同一认识起点,共同交流和探讨BI,从而消除BI的认识偏差、减少BI的交易成本,促进BI产业的发展。

哲学不仅是理论化、系统化的世界观,而且是观察、分析和处理问题的方法论。所谓世界观,是一个人对整个世界的根本看法,也指关于存在及其本质和规律的学说,是对存在本身的高度抽象,称为本体论;本体论的英文为ontology,基本含义是“是”和“存在”。本体论解决事物是什么和为什么的问题,它是方法论、认识论的物质客体。

方法论是对物质客体存在性状、属性、功能、作用、形式、方式,如绝对相对两重性和对立统一性、运动、结构、机能、形态、变化、转化、发展、普遍联系、质量互变、否定之否定等的描述、解释、说明,是人们用来认识世界和改造世界的一般方法的学说或理论体系,或者说,是人们用来观察、分析和处理各种问题的基本原则和哲学根据。

方法论解决了事物是如何运动以及运动的结果问题。哲学是本体论和方法论的统一。一般说来,有什么样的本体论,也就有什么样的方法论。本体论是方法论的理论基础、哲学根据;方法论是世界观的具体运用和体现。

因此,从哲学入手构建BI体系,需要做到本体论和方法论的统一。以主体切入,BI体系要解决用户和开发者(本文主要指二次开发者、集成商)对BI的认识问题,即要理清BI是什么(包括为什么要这样认识BI),BI如何用,BI如何实现等相互联系和相互制约关系。

此外,要为用户和从事BI领域各项研究和实践的开发者,提供共同的基础与交流的平台。图1的BI体系是要构成一种“体、用”关系。“体”充分体现本体论,适用于用户和开发者共同认识和交流;“用”包括做成什么样和如何做,前者适于用户和开发者共同探讨项目成果,后者主要适于开发者。当然用户既熟知BI项目的结果又能了解开发BI的方法和过程,利于知晓项目的难度和时间长度,便于经费预算。

比较哲学思维构建的BI体系和当前BI体系后可知,当前的BI体系仅解决一个方面的问题,即如何做BI,这仅是体用关系中“用”的其中一部分。可见当前BI体系的不完整和片面性,以至于它难以解决用户期望的BI是什么和为什么,以及BI有什么类型,BI要做成什么样?BI后期如何提升等问题,因而无法顺畅实现开发者和用户的沟通。

BI的“体用”框架

根据上述体用关系,笔者建立了BI的“体用”框架体系。“体用”框架是指BI体系由“三维构架”、“三种运作模式”、“四步开发论”三个部分构成,简称为“334”体系。如图1所示,BI三维构架是基础,是“体”;BI的三种运作模式和四步开发论构建于基础之上,是“用”;这两大部分三个内容构造了BI体系的“体、用”关系。三者组成的BI体系完整地阐明了“BI是什么,为什么,要做成什么样以及怎么做等”相互联系和相互制约关系。此体系能够为用户和从事BI领域各项研究和实践的开发者,提供共同的基础与交流的平台。

(一)三维构架理清BI定义,解决是什么?

商业智能作为概念,最早由GartnerGroup提出,但至今仍无一个公认的定义。当前提出的定义中包含了BI是技术、BI是工具、BI是一种联结软件的概念和方法,以及BI是自动化管理过程等诸多观点(参见后续文章商业智能(BI)的三维构架—商业智能的“操作性和提升性”转换)。笔者认为上述观点缺乏明确的实施方案和方法论的体系化思考和揭示,既不能让用户理解,亦不便于指导开发者实现操作。

笔者借助“三维构架”试图系统全面地理解BI。BI三维构架由“三维模式”和“三层漏斗”构成。三维模式以认识论为基本原理从主体、客体和工具三个方面展开,通过对角色维、内容维和工具维的详细且全面的阐释,理清了BI的一般原理。三层漏斗描述了BI一般原理在处于不同产业、不同价值环节、不同发展阶段的盈利性组织合理物色BI的筛选过程。同时,实践的结果反过来会提升三维模式,实现BI一般原理的完善。图5是BI的三维构架。

图5商业智能的“三维构架”

总结起来,商业智能(BI)是以认识论和组织理论(主要用于对角色维的分类)为基本原理,采取相适宜的“工具”,旨在帮助“相关角色”对职责范围内的“有关内容”做出最佳决定。它由“三维模式”和“三层漏斗”组成,是整个企业集理念,组织,流程,技术为一体的整体辅助决策支持方案。

上述BI定义以三维模式和三层漏斗作构架,既阐述了BI由角色维、工具维和内容维构成的一般原理,又从产业/行业、价值环节和发展阶段对BI的应用范围做筛选从而归结到实践。可见该定义不仅方便不太熟悉技术的用户了解BI内涵,而且用户和开发者都可以据此大致确定当前以及未来一段时间采用BI所要满足的需求深度和广度。因此BI定义及其三维构架,建立了用户和开发者共同讨论BI和开发、使用BI的沟通平台。

(二)三种运作模式明晰BI的结果分类:解决BI要做成什么样

不同企业在不同阶段存有不同的经营管理需求,可以采用不同的BI模式予以满足。BI针对业务和针对技术各有三种不同的运作模式。

立足于业务,依据有关用户对职责范围内所做决定的难度和所需的时间程度,BI有三种运作模式:流程型模式、结果型模式和综合型模式。

流程型模式作用于操作型信息系统,在有关用户操作过程中引入智能,提供及时反馈并立即作用于工作流程,辅助用户针对日常工作做出最佳决定,提高工作效果。

结果型模式综合各个操作型信息系统引入智能,产生在不同层度辅助有关用户做出“职责范围内事项”最佳决定的各种展示结果,如普通报表、仪表盘、BCG矩阵、营销计划书等。综合型模式是一种转变模式或临界模式。转变模式是指流程型模式向结果型模式转变,或结果型模式向流程型模式转变;临界模式指既适合结果型,又适合流程型的情况。

综合型模式适宜于“决定难度适宜和作决定所耗时间适宜的经营管理问题。基于业务的BI三种模式如图6所示。

图6BI三种运作模式——针对业务

立足于技术,依据数据整合程度BI有三种运作模式:数据仓库模式、数据集市模式和平行模式。数据集市模式和数据仓库模式根本的区别正是自上而下和自下而上两种建设理念的产物,也就是Inmon和Kimball两派在产品应用中的具体体现。平行模式则是上述二者的折中。数据集市模式反映了“急用先行”的BI运作思路,可以更好地满足业务用户的需求。数据仓库模式重在规划,要求企业级数据的一致性,更强调数据质量问题。

针对业务的BI三种运作模式较适合于用户理解,犹其适合业务类用户。它解决BI以何种方式帮助用户在职责范围内做出最佳决定的问题,比如是员工在系统操作过程中对BI结果的连续应用,还是看到分析结果然后在其它诸如文件、讲话等非信息系统场合的应用等;包括用户在内的技术类人员较为适合数据集市模式、数据仓库模式和平行模式这三种针对技术的运作模式。

结合针对技术和针对应用的三种运作模式,可以回答用户和开发者关于建设什么样BI的实际问题。用户和开发者可以针对某个企业的实际情况建设为流程型+数据集市的BI。

(三)四步开发论实现了开发工作的有序:解决BI如何开发?

笔者从BI任务的详细分解出发,总结出四步开发方法论(见图7)。4个主要环节分别是:1、模型设计与技术评估;2、数据采集与数据一致化;3、前端展示;4、确定数据标准和元数据管理。

图7四步开发方法论

商务智能系统实现数据管理的关键技术

无论是商业企业、科研机构或者政府部门,在过去若干年的时间里都积累了海量的、以不同形式存储的数据资料。但当面对越来越多迅速膨胀的超级数据库时,人们却无从着手去理解数据中包含的信息,更难以获得有价值的知识。然而这些信息数据记载着企业的生命轨迹,蕴含着企业的发展方向,由于采用普通的联机事物处理技术(OLTP)的信息系统无法同时满足高效作业和决策支持的两项需求,造成了海量数据与信息“孤岛”的并存。好在人们已经感受到了危险的降临,商务智能软件已悄然而生并越来越受到世人的重视。

1.商务智能的定义

商务智能(BusinessIntelligence)的定义众说纷纭,GartnerGroup认为“商务智能是将数据转换成信息的过程,然后通过发现将信息转化为知识”;商务智能大师利奥托德认为“商务智能是将存储于各种商业信息系统中的数据转换成有用信息的技术,它允许用户查询和分析数据库,可以得出影响商业活动的关键因素,最终帮助用户做出更好更合理的决策”。

笔者在总结了商务智能的相关定义之后,将商务智能定义为:商务智能是指利用现代信息技术收集、管理和分析存储于各种商业信息系统中的数据,使之转换成有用信息,并以可视化的形式加以表现,使企业的各级决策者获得知识和洞察力,促使他们做出对企业更有利的决策的技术。

目前,各个行业都面对着激烈的竞争,及时、准确的决策已成为企业生存与发展的生命线。随着信息技术在企业中的普遍应用,企业产生了大量富有价值的电子数据。但这些数据大都存储于不同的系统中,数据的定义和格式也不统一,商务智能系统能从不同的数据源搜集的数据中提取有用的数据,并对这些数据进行清洗,以确保数据的正确性,在对数据进行转换、重构等操作后,将其存入数据仓库或数据集市中;再运用适合的查询分析工具、数据挖掘工具、OLAP工具等管理分析工具对信息进行处理,使信息变为辅助决策的知识,并将知识以适当的方式展示在决策者面前,供决策者运筹帷幄。

2.商务智能系统的基本架构

美国数据仓库研究院把商务智能比作“数据炼油厂”,它将商务智能的应用过程描述为“数据一信息一知识一计划一行动”的过程。

根据对商务智能的理解,借鉴美国数据仓库研究院的“数据炼油厂”,给出商务智能系统的架构,如图8所示:

图8商务智能系统架构

1)数据源层——商务智能系统的数据来源,它存储着系统所需的最原始的数据以及数据之间的关系,保持着历史的真实性。

2)数据整合层——商务智能系统的根本要求,它将来自不同数据源的信息合并为相同的信息结构,消除重复、无效和界外的数据,提取、净化和传递数据到为数据仓库设立的文件中。

3)数据仓库层——商务智能系统的基础,是数据分析的源数据,保存着大量的、面向主题的、集成的数据。

4)数据分析层——体现系统智能的关键,它一般采用OLAP技术和数据挖掘技术对数据进行分析和处理。

5)数据展现层——它向商务智能环境的收益者提供实际的分析结果,同时保证系统分析结果的可视化,形式有报表、图表、数据表等。

3.商务智能系统的关键技术

对商务智能系统的架构进行分析可以看出,商务智能系统对数据实行分析管理的关键技术如下:

3.1数据仓库技术

数据仓库之父w.H.Inmon博士对数据仓库的定义得到了大多数学者和工程人员的接受:“数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,它用以支持经营管理中的决策制定过程。”由此定义可以看出,数据仓库具有如下特性:

(1)面向主题性

面向主题性是数据仓库中数据组织的基本原则,数据仓库中的所有数据都是围绕着某一主题组织和展开的,每个主题对应一个客观分析领域。

(2)数据集成性

数据仓库的集成性是指根据决策分析的要求,将分散于各处的源数据进行抽取、筛选、清理、综合等,使数据仓库中的数据具有集成性。

(3)数据的稳定性

数据的稳定性说明数据仓库中的数据不会像业务处理系统中的数据库那样进行日常的添加、修改、删除等操作,而是很少发生更新处理,表现出相当程度的稳定性。

(4)数据的时变性

数据仓库的时变性,即数据仓库中的数据应该随着时间的推移而发生变化。数据仓库要能够捕捉业务系统中的数据变化,定期将变化的数据追加到数据仓库中来,还要将达到一定年限或规定时间的历史数据进行删除。

(5)数据的集合性

数据的集合性是指数据仓库必须以某种数据集合的形式存储起来,数据仓库采用的数据集合方式主要有以多维数据库方式存储的多维模式、以关系数据库方式存储的关系模式,以及多维模式和关系模式混合的模式。

(6)决策支持作用

决策支持作用是数据仓库一个核心的应用,建立数据仓库的目的是将企业多年来收集到的数据按照一个统一的规则组织存储,然后通过对海量的数据进行分析提供决策支持,帮助企业及时、准确地把握机会,以在激烈的市场竞争中取得最大的利润。

数据仓库技术是信息技术飞速发展的结果,它与传统的面向操作的数据库技术相比有很大的不同,从结构上看,数据仓库主要包括:数据源、数据准备区、数据仓库数据库、数据集市或知识挖掘库、管理工具和应用工具等部分。如图9所示:

图9数据仓库的系统结构

数据源——数据仓库的数据来源。

数据准备区——数据源中的数据经抽取、转换最终成为数据仓库所需要的数据。

数据仓库数据库——负责存储用于分析、决策的数据,包含对元数据的管理。

数据集市/知识挖掘库——局部数据仓库或部门数据仓库,为指定的应用提供数据。

管理工具和应用工具——包括各种对数据仓库的数据分析和数据访问,如利用OLAP进行数据分析,数据仓库应用程序等。

3.2OLAP分析技术

OLAP是独立于数据仓库的一种技术概念,其基本思想是使得企业的管理决策人员能够灵活地操纵企业的数据,以多维的形式从多方面和多角度观察企业的状态和变化趋势。

OLAP最早是由E.F.Codd于1993年提出的,当时,Codd认为联机事务处理(OLTP)已经不能满足终端用户对数据库查询分析的需要,SQL对大数据库进行的简单查询也不能满足用户分析的需求。用户的决策分析需要对关系数据库进行大量计算才能得到结果,而查询的结果并不能满足决策者提出的需求。因此Codd提出了多维数据库和多维分析的概念,即OLAP。它是针对特定问题的联机数据访问和分析。通过对多维数据的多种可能的观察形式进行快速、稳定、一致和交互性的存取,允许管理决策人员对数据进行深入观察。

OLAP的多维分析是指对多维数据集中的数据用切片(二维)、切块(三维)、钻取(向下钻取和向上钻取,钻取的深度与维所划分的层次相对应)、旋转(通过旋转可以得到不同视角的数据)等方式分析数据,使用户从多个角度、多个侧面去观察数据仓库中的数据。通过这种方法能够使分析人员深入的了解数据仓库中数据所蕴含的信息,从而挖掘隐藏在数据背后的商业模式。

在BI的建设过程中,数据仓库和数据集市都是数据的存储区域。都在为数据的在线分析和挖掘提供数据源。数据仓库和数据集市主要是范围的不同。数据仓库面向企业的所有部门,所以它的需求是全企业范围的,一般情况下,它的数据按照第三范式组织。数据集市是面向企业的某一个部门的,需求比较集中,以多维方式的形式管理数据。

3.3数据挖掘技术

W.J.Frawley,G.PiatetskyShapiro等人指出,数据挖掘就是从大型数据库的数据中提取人们感兴趣的知识,这螳知识是隐含的、事先未知的、潜在有用的信息,提取的知识可表示为概念、规则、规律、模式等形式。

3.3.1数据挖掘研究的主要内容

数据挖掘所发现的知识最常见的有以下四类。

(1)广义知识

广义知识指类别特征为概括性描述的知识,是根据数据的微观特性发现其表征的、带有普遍性的、较高层次概念的、中观和宏观的知识,反映同类事物共同性质,是对数据的概括、精炼和抽象。广义知识的发现方法和实现技术有很多,如数据立方体、面向属性的归约等。

(2)关联知识

关联知识是指反映一个事件和其他事件之间信赖或关联的知识。如果两项或多项属性之间存在关联,那么其中一项的属性值就可以依据其他属性值进行预测。最为著名的关联规则发现方法是R.Agrawal提出来的Apriori算法。

(3)分类知识

分类知识是反映同类事物共同性质的特征型和不同事物之间的差异特征型知识。最为典型的分类方法是基于决策树的分类方法,还有统计、粗糙集(RoughSet)、神经网络等方法。

(4)预测型知识

预测型知识根据时间序列型数据,由历史的和当前的数据去推测未来的数据,也可以认为它是以时间为关键属性的关联知识。目前,时问序列预测方法有经典的统计方法、神经网络和机器学习等。

此外,还可以发现其他类型的知识,如偏差型知识,它是对差异和极端特例的描述,揭示事物偏离常规的异常现象,如标准类外的特例,数据聚类外的离群值等。所有这些知识都可以在不同的概念层次上被发现,并随着概念层次的提升,从微观到中观、到宏观,以满足不同用户不同层次决策的需要。

3.3.2数据挖掘的常用技术

(1)神经网络:它从结构上模仿生物神经元结构,是一种通过训练来学习的非线性预测模型,可以完成分类、聚类、特征采掘等多种挖掘任务。

(2)决策树:代表着决策集的树形结构。

(3)规则推导:从统计意义上对数据中的“如果-那么”规则进行寻找和推导。

(4)遗传算法:基于进化理论,并采用遗传结合、遗传变异以及自然选择等设计方法的优化技术。

(5)近邻算法:将数据集合中每一记录进行分类的方法。这种技术通过K个与之最相近的历史记录的组合来辨别新的记录。

3.4数据仓库和OLAP与数据挖掘的关系

数据挖掘不是必须基于数据仓库的,数据挖掘能够通过数据抽取、数据预处理和转换等操作自己完成数据挖掘前的准备工作,继而进行数据挖掘。然而这部分的工作需要耗费大量的时间和精力,而进行数据挖掘又无法避开这些操作,因此将数据挖掘工作基于数据仓库技术来进行,能够省去数据的前期准备等工作,大大提高数据挖掘效率。因为数据仓库在建立的时候,已经完成了数据的抽取、转换和加载等操作。

OLAP作为数据仓库中的关键技术,其可以在使用多维数据模型的数据仓库或数据集市上进行,充分发挥OLAP的联机分析的功能和特性。将OLAP与数据挖掘进行结合,能够为数据挖掘提供基础数据支持,提高数据挖掘的效率,而且还可以实现联机分析数据挖掘的功能。用户常常希望穿越数据库,选择相关数据,在不同的粒度上进行分析,并以不同的形式显示结果。联机分析数据挖掘提供了在不同的数据子集和不同的抽象层上进行数据挖掘的工具,在数据立方体和挖掘的中间结果数据上进行下钻、上卷、旋转、切片、切块等操作,提高数据挖掘探测性的数据分析的能力和灵活性。

采用数据挖掘与数据仓库和OLAP技术有机结合的方式,可以使数据挖掘具有更高的实用性和高效性。

4.结语

随着市场竞争的日益加剧,国内外众多商务智能软件公司开发了数据分析和数据挖掘软件来分析海量数据,帮助管理者穿越数据迷雾,赋予数据第二次生命,相信在不久的将来,人们在面对大量的数据时不再感到迷茫,而是能够以用户需要的方式重新组织这些数据,并通过对这些数据的分析,挖掘出潜在的模式,有效地预测市场的行为,做出正确的决策。

商务智能外网优势与发展趋势

也许对普通老百姓而言,商务智能可能与他们的生活没有太大的联系,所以一般不会去做太多的了解。但是,在一些专业人士看来,商业智能具有更美好的发展前景。

1.总体发展趋势

信息技术作为革命性的技术,为人类社会的发展提供了崭新的动力。在当今日益激烈的市场竞争环境中,企业非常希望能够从浩瀚的商务数据以及其它相关的数据中发现能够带来巨额利润的商机。根据IBM公司的估计,全球每天在线的数据为1EB,而在脱机的媒体中的数据则是在线的20倍之多。面对如此庞大的数据只有那些采用先进的信息技术成功地采集、分析信息并依据信息进行决策的企业才能获得竞争优势,成为市场的赢家。因此,越来越多的管理者开始借助商务智能(BusinessIntelligence,简称BI)技术来发现商务运营过程中存在的问题,找到有利的解决方案。而在商务智能的实施中商务智能外网作为企业与客户沟通的桥梁无疑发挥着举足轻重的作用。

2.商务智能中的外网

商务智能是综合了数据仓库、数据挖掘和联机分析处理等技术,将企业运作中涉及到的数据有效地转化为信息和知识,通过适当的方式展现给决策者,以帮助企业提高决策能力和运营能力,增强核心竞争力,创造更多盈利的一种平台和综合解决方案,这里的数据包括来自企业内部业务系统的订单、库存、交易账目、客户和供应商资料等,此外还包括来自竞争对手的数据以及来自企业所依赖的外部环境中的各种数据。显然,BI涉及到了很宽的领域,是集收集、合并、分析和提供信息存取功能为一体的解奂方案。

商务智能方案分为对内信息共享(内网)和对外信息共享(外两)两部分。通过内网企业把信息传送给员工,并从中获得最佳的回报,但是,企业从信息中可以得到的并不仅限于此。通过外网把信息与外部客户共享,该信息会给企业带来更多的价值。

通过建立商务智能外网,企业能够向客户提供他们的历史交易情况,使客户拥有最新的购买情况、帐户状态等信息,此外企业还可以与客户共享客户支持信息。这样客户就能够在网上看到自己的支持请求、技术问题的记录以及同题处理进展情况等。

3.商务智能外网的优势

建立商务智能外网能够真正实现企业和客户之间的互惠互利,使企业和客户的关系更加融洽,使双方从商务智能外周的应用中获得益处。

从企业角度讲,商务智能外网的好处主要体现在:争取新客户;增加顾客满意度;新的利润增长点;降低成本。

争取新客户,优良服务是获得客户认同的关键。创造一个互动的交流环境,与客户的关系透明化,对任何一个行业来说都是很重要的。通过商务智能外网的实施,企业在原有服务的基础上增加了新的服务内容,使其在争取并赢得新客户方面增添了新的能量。比如两家企业提供同样的产品,其中一家能够提供全面的客户信息咨询系统作为附加服务的一部分,它的产品必将成为客户的首选。

增加顾客满意度,与客户共享信息创造了与客户的伙伴关系,超越了简单的供应商/客户关系,从而增加顾客满意度。如果客户与供应商有“透明”制度的话,所有的B2B关系都时不时会遇到一定程度的矛盾和摩擦。客户需要确信双方都能够完全看到过去都曾发生些什么,什么时候发生,为什么会发生。外网的共同基石是真实的事实,使得各方有充分的选择信息,扩大作决策的余地,不再为合同中有关服务水平的条款而争执不休。

新的利润增长点,通过电子商务智能,企业能够超越传统的商业模式。把数据市场化,并且销售给全新的客户群体。如网站就可以把消费者的网上购买情况的相关信息通过集成出售给市场调研公司。同样,如果外网对用户的价值非常大的话,还可以

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论