商务智能发展背景概述_第1页
商务智能发展背景概述_第2页
商务智能发展背景概述_第3页
商务智能发展背景概述_第4页
商务智能发展背景概述_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

商务智能发展背景伴随着以电子商务为特征的新经济逐步走向成熟,企业需要处理的数据量越来越多,数据库应用的规模、范围和深度不断扩大,已经从点(单台机器),线(局域网)发展到面(网络),甚至到因特网全球信息系统。近年来商业条码的推广,企业和政府交易的管理,以及数据采集工具的发展,都提供了巨大规模的数据,在商业管理,政府部门和工业数据处理等领域中应用了数以百万计的数据库。对于企业来说,这些数据一方面来自与客户间的交易记录,另外,还可能来自企业内部的管理或生产系统,以及从其他途径搜集到的市场信息、协作伙伴和竞争对手的信息等。企业急切地希望通过快速处理这些数据获得有利于企业进一步发展的决策依据,而是否能够最大限度地使用信息资源来管理和影响企业决策流程,将决定企业是否能拥有最大程度的竞争优势。我国加入世界贸易组织后,企业不仅要市场扩大到了全球,同时也要面对来自全球的更多更强的竞争对手,企业必须采用快速的智能分析手段来实现对市场的定位、细分,对客户的更深层次的研究,以更强的姿态迎接挑战。基本教学内容本课程主要介绍商务智能的基本概念,基本理论及其应用,同时重点介绍了相关技术,以及在商务决策中的应用。具体的内容包括数据仓库系统简介、联机分析处理(OLAP),数据预处理技术(包括数据清理、数据集成和转换等),数据挖掘技术(包括分类、预测、关联和聚类等)以及数据挖掘方法(包括决策树方法、统计方法、关联规则挖掘、神经网络和基于案例推理等),并结合案例分析上述方法和技术在商务智能中的应用。

基本要求目的主要是掌握商务智能的核心技术基础-数据仓库、OLAP和数据挖掘的基本概念、技术和方法,并在此基础上应用于相关领域。熟悉数据库、数据仓库构建及多维数据的查看,掌握基本数据挖掘算法的应用。教学纲要商务智能概述数据库数据仓库在线分析处理OLAP技术数据挖掘技术和方法商务智能应用*教学方式课堂讲解为主,辅以上机实验和课堂讨论。商务智能案例分析教材与参考书[1]赵卫东.商务智能(第三版).北京:清华大学出版社,2013[2]赵卫东.流程智能.北京:清华大学出版社,2012[3]赵卫东.客户智能.北京:清华大学出版社,2013数据DATA数据是可以记录、通信和能识别的符号,它通过有意义的组合来表达现实世界中的某种实体(具体对象、事件、状态或活动)的特征。例如:38.2218信息INFORMATION信息是经过某种加工处理后的数据,是反映客观事物规律的一些数据。信息是对数据的解释,数据是信息的载体。例如:价格:38.2元,

气温:21摄氏度,

长度:8厘米知识识KNOWLEDGE知识识是是对对信信息息内内容容进进行行提提炼炼、、比比较较、、挖挖掘掘、、分分析析、、概概括括、、判判断断和和推推论论。。事实实性性知知识识和和经经验验知知识识((隐隐性性和和显显性性))。。例如如::商商品品价价格格38.2元很很贵贵8月的的天天气气是是21摄氏氏度度很很凉凉快快零件件的的长长度度是是8厘米米很很短短数据据-信息息-知识识SenderReceiver处理数据信息知识一个个人人的的垃垃圾圾((数数据据))是是另另一一个个人人的的财财富富((信信息息))案例例什什么么是是数数据据信信息息和和知知识识数据据::37.5通过过这这个个你你能能看看出出什什么么吗吗??估估计计很很难难??信息息::姓名名::陈陈浩浩年龄龄::5岁时间间::2014年6月8日13点20分腋下下体体温温::37.5度环境境::孩孩子子在在楼楼下下玩玩,,回回来来后后看看到到脸脸特特别别红红,,测测量量体体温温为为37.5度这个个时时候候,,这这个个37.5有意意义义了了,,一一个个小小孩孩在在夏夏天天午午后后玩玩了了后后测测试试的的体体温温。。在在这这样样的的背背景景下下,,37.5成为为了了有有意意义义的的信信息息中中的的一一个个关关键键指指标标。。知识识如果果体体温温在在36.9℃℃~37.5℃℃之间间,,则则正正常常,,称称为为基基础础体体温温。。如果果体体温温超超过过基基础础体体温温1℃℃以上上时时,,则则为为发发热热。。如果果体体温温波波动动于于38℃℃左右右,,则则为为低低热热。。如果果体体温温在在39℃℃以上上,,则则为为高高热热。。如果果连连续续发发热热两两个个星星期期以以上上,,则则为为长长期期发发热热。。判断断(知识识应应用用):是不不是是孩孩子子在在下下面面玩玩的的比比较较热热,,穿穿的的比比较较多多??是否否可可以以先先脱脱点点衣衣服服观观察察一一小小时时后后再再测测量量??决策策::1个小小时时后后,,再再测测量量。。结果果:体温温回回落落到到36.8度,,正正常常范范围围,,不不用用去去医医院院。。数据据信信息息知知识识总总结结数据:单纯的数据没有意义,不能直接帮助决策。信息:信息是赋予了数据一环境。

知识:从信息中得到,经过实践证明的、可以用来辅助决

策和行动。这个例子中只包含了显性知识,如果小孩的发烧在经过各种检查后仍然找不到原因,则需要专家会诊,要看既往的病史、家族的病史加上医生的综合判断,就要使用医生的隐性知识。数据据数据据可可以以记记录录历历史史资资料料,,可可以以记记录录事事件件过过程程,,可可以以表表示示事事物物特特征征。。对对于于人人类类生生存存、、发发展展、、创创新新有有着着至至关关重重要要的的作作用用。。体检检指指标标,,商商品品价价格格,,股股票票价价格格,,财财务务数数据据,,GDP等等等都都属属于于数数据据。。对于于企企业业而而言言数数据据就就是是生生产产,,经经营营,,战战略略,,几几乎乎所所有有的的经经营营活活动动都都依依赖赖数数据据,,不不可可或或缺缺。。对于于政政府府而而言言,,数数据据就就是是社社会会各各类类经经济济社社会会活活动动的的表表现现。。有了了数数据据的的记记录录与与使使用用,,才才有有了了社社会会的的发发展展。。信息息时时代代数数据据的的表表现现形形式式数据据的的潜潜在在价价值值数据据的的真真实实价价值值就就像像漂漂浮浮在在海海洋洋中中的的冰冰山山,,第第一一眼眼只只能能看看到到冰冰山山一一角角,,而而绝绝大大部部分分则则隐隐藏藏在在表表面面之之下下如何何使使用用数数据据数据据再再利利用用数据据再再利利用用是是指指企企业业对对历历史史数数据据进进行行重重新新的的整整理理分分析析,,为为今今后后的的业业务务提提供供决决策策支支持持。。有些些公公司司由由于于业业务务开开展展时时间间较较长长,,会会收收集集到到大大量量的的数数据据,,但但是是如如果果他他们们并并不不急急需需使使用用,,或或并并不不擅擅长长再再次次利利用用这这些些数数据据,,就就会会使使这这些些数数据据长长期期的的挤挤压压起起来来,,直直到到业业务务环环境境彻彻底底变变化化,,而而失失去去可可利利用用的的价价值值。。保保存存旧旧信信息息的的计计算算机机就就是是““数数据据坟坟墓墓””。。数据再利用适适合于控制着着大型数据集集运作的传统统企业。比如如移动电话运运营商收集用用户的位置信信息来传输电电话信号。对对于移动电话话运营商来讲讲,这些数据据的任务已经经完成,但是是对于一些广广告公司来说说,这些数据据非常有价值值,可以用于于发布位置广广告进行促销销活动。付费通数据再再利用案例数据的重组数据重组是将将两组和多组组不同内容数数据集结合起起来进行分析析。统计学中的关关联分析,回回归分析,就就可以用于对对不同数据集集的结合分析析。比如丹麦拥有有1990-2007年间所有手机机用户的相关关信息,共涉涉及358403人。同时记录录了该期间10729名中枢神经系系统疾病患者者相关信息。。研究人员试试图通过对这这两个数据集集的关联分析析来推断:手机用户是否否比非手机用用户显示出较较高的中枢神神经系统疾病病发病率?使用手机时间间较长的用户户是否比时间间较短的用户户更容易患病病?两个数据集都都采用了严格格的质量标准准,几乎包括括了几乎所有有移动用户和和病患的相关关信息,属于于全样本分析析,分析结果果较抽样分析析更加准确。。央行支付数据据与区域经济济关系分析案案例可扩展的数据据扩展数据是指指一些具有基基本用途的数数据,还可以以进行扩展,,二次使用。。如果以某种种方式收集的的单一数据集集有多种不同同的用途,它它就具有双重重功能。收集多个数据据流或每个数数据流中更多多数据点的额额外成本往往往较低,因此此,收集尽可可能多的数据据并在一开始始的时候就考考虑到各种潜潜在的二次用用途并使其具具有扩展性是是非常有意义义的。比如谷歌公司司的谷歌地图图不仅拍摄房房屋和街道的的照片,同时时还采集了GPS数据。不仅充充实了其地图图服务,而且且对交通导航航也有很大的的帮助。废弃数据再利利用废弃数据是指指在使用过程程中产生,但但是却对最终终结果没有价价值的数据。。但是这些数数据往往同最最终结果具有有一定的相关关性,能够反反映出使用者者的一些意图图。例如,人们经经常想搜索某某个内容,点点击进入后却却未能找到想想要的信息,,于是又返回回到搜索页面面继续搜索。。但是这个访访问痕迹却已已经被记录下下来。Google认为这些信息息是非常有价价值的。如果果许多用户都都点击这个链链接,就表明明这个尝试和和结果更加具具有相关性,,可以及时调调整,提高搜搜索的效率。。数据的分析目的让数据说话;;行动的向导;;杜绝浪费;提供决策的依依据。分类描述性数据分分析预测性数据分分析什么是数据分分析?数据分析是指指适当的统计分析方法对收集来来的大量数据据进行分析,,将它们加以以汇总、理解解并消化。以以求最大化地地开发数据的的功能,发挥挥数据的作用用。数据分析的目目的数据分析的目目的是把隐藏藏在一大批看看似杂乱无章章的数据背后后的信息集中中和提炼出来来,总结研究究对象的内在在规律。简单的数据分分析数据分析步骤骤:明确分析目的的和内容数据采集数据处理根据研究目标标和内容进行行分析分析出的结果果通过图表的的方式展现出出来撰写数据分析析报告数据分析中经经常用到的指指标或术语,,除掌握最基基本的平均数数、百分比等等概念以外,,还需要将容容易混淆的指指标进行明确确区分,避免免在以后阐述述分析结果时时出现错误。。常用指标或术术语平均数绝对数与相对对数百分比与百分分点频数与频率比例与比率倍数与番数同比与环比平均数绝对数与相对对数绝对数:是反映客观现现象总体在一一定时间、地地点条件下的的总规模、总总水平的综合指标。也是数据分分析中常用的的指标,如::GDP、总人口数等等。相对数:是指指两个有联系的的指标对比计计算而得到的的数值,用于于反映客观现现象之间数量量联系程度的的综合指标。。计算相对数数的基本公式式:比较数值(比比数)相相对数=───────────基础数值(基基数)分母是用做对对比标准的指指标数值,简简称基数;分分子是用做与与基数对比的的指标数值,,简称比数。。相对数一般般以倍数、成成数、百分数数等表示,它它反映了客观观现象之间数数量联系的程程度。使用相对数时时需要注意指指标的可比性性,同时要与与总量指标((绝对数)结结合使用。百分比与百分分点百分比是相对对数中的一种种,它表示一一个数是另一一个数的百分分之几,也称称百分率或百百分数。百分点是指不不同时期以百百分数的形式式表示的相对对指标的变动幅度,1个百分点=1%。例如,下图图某公司发言言人就混淆了了百分比与百百分点的概念念。表示构成的变变动幅度不宜宜用百分数,,而应该用百百分点。因此此,这位公司司发言人正确确的说法应该该是“公司今今年的利润是是45%,比去年的28%提高了17个百分点”。频数与频率频率是每组类类别次数与总总次数的比值值,它代表某某类别在总体体中出现的频频繁程度,一一般采用百分分数表示,所所有组的频率率加总等于100%。某校A班30个男同学在50个同学中出现现的频率为60%,即(30÷50)X100%;而20个女同学在50个同学中出现现的频率为40%,即(20÷50)X100%。频数也称次数数。在一组依依大小顺序排排列的测量值值中,当按一一定的组距将将其分组时,,出现在各组组内的测量值值的数目,即即为该组的频频数,频数与与总数的比为为频率。频数越大表明明该组标志值值对于总体水水平所起的作作用也越大,,反之,表明明该组标志值值对于总体水水平所起的作作用越小。在10次掷硬币中,,有4次正面朝上,,我们说这10次试验中‘正正面朝上’的的频数是4。累积频数就是是将各类别的的频数逐级累累加起来比例与比率比例是指在总总体中各部分分的数值占全全部数值的比比重,通常反反映总体的构构成和结构。。比如,A班共有学生50人,男生30人,女生20人,则男生的的比例是30/50

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论