版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、商务智能发展背景伴随着以电子商务为特征的新经济逐步走向成熟,企业需要处理的数据量越来越多,数据库应用的规模、范围和深度不断扩大,已经从点(单台机器),线(局域网)发展到面(网络),甚至到因特网全球信息系统。近年来商业条码的推广,企业和政府交易的管理,以及数据采集工具的发展,都提供了巨大规模的数据,在商业管理,政府部门和工业数据处理等领域中应用了数以百万计的数据库。对于企业来说,这些数据一方面来自与客户间的交易记录,另外,还可能来自企业内部的管理或生产系统,以及从其他途径搜集到的市场信息、协作伙伴和竞争对手的信息等。企业急切地希望通过快速处理这些数据获得有利于企业进一步发展的决策依据,而是否能够
2、最大限度地使用信息资源来管理和影响企业决策流程,将决定企业是否能拥有最大程度的竞争优势。我国加入世界贸易组织后,企业不仅要市场扩大到了全球,同时也要面对来自全球的更多更强的竞争对手,企业必须采用快速的智能分析手段来实现对市场的定位、细分,对客户的更深层次的研究,以更强的姿态迎接挑战。基本教学内容本课程主要介绍商务智能的基本概念,基本理论及其应用,同时重点介绍了相关技术,以及在商务决策中的应用。具体的内容包括数据仓库系统简介、联机分析处理(OLAP),数据预处理技术(包括数据清理、数据集成和转换等),数据挖掘技术(包括分类、预测、关联和聚类等)以及数据挖掘方法(包括决策树方法、统计方法、关联规则
3、挖掘、神经网络和基于案例推理等),并结合案例分析上述方法和技术在商务智能中的应用。 基本要求目的主要是掌握商务智能的核心技术基础数据仓库、OLAP和数据挖掘的基本概念、技术和方法,并在此基础上应用于相关领域。熟悉数据库、数据仓库构建及多维数据的查看,掌握基本数据挖掘算法的应用。教学纲要商务智能概述数据库数据仓库在线分析处理OLAP技术数据挖掘技术和方法商务智能应用*教学方式课堂讲解为主,辅以上机实验和课堂讨论。商务智能案例分析教材与参考书1赵卫东.商务智能(第三版). 北京:清华大学出版社,20132赵卫东. 流程智能.北京:清华大学出版社,20123赵卫东. 客户智能.北京:清华大学出版社,
4、2013数据DATA 数据是可以记录、通信和能识别的符号,它通过有意义的组合来表达现实世界中的某种实体(具体对象、事件、状态或活动)的特征。例如:38.2 21 8信息INFORMATION 信息是经过某种加工处理后的数据,是反映客观事物规律的一些数据。信息是对数据的解释,数据是信息的载体。 例如:价格:38.2元, 气温:21摄氏度, 长度:8厘米知识KNOWLEDGE知识是对信息内容进行提炼、比较、挖掘、分析、概括、判断和推论。事实性知识和经验知识(隐性和显性)。例如:商品价格38.2元很贵 8月的天气是21摄氏度很凉快 零件的长度是8厘米很短数据-信息-知识SenderReceiver处
5、理数据信息知识一个人的垃圾(数据)是另一个人的财富(信息)案例 什么是数据信息和知识数据:37.5通过这个你能看出什么吗?估计很难?信息:姓名:陈浩 年龄:5岁时间:2014年6月8日13点20分腋下体温:37.5度环境:孩子在楼下玩,回来后看到脸特别红,测量体温为37.5度 这个时候,这个37.5有意义了,一个小孩在夏天午后玩了后测试的体温。在这样的背景下,37.5成为了有意义的信息中的一个关键指标。知识如果体温在36.937.5之间,则正常,称为基础体温。如果体温超过基础体温1以上时,则为发热。如果体温波动于38左右,则为低热。如果体温在39以上,则为高热。如果连续发热两个星期以上,则为长
6、期发热。判断(知识应用):是不是孩子在下面玩的比较热,穿的比较多?是否可以先脱点衣服观察一小时后再测量?决策:1个小时后,再测量。结果:体温回落到36.8度,正常范围,不用去医院。数据信息知识总结数据:单纯的数据没有意义,不能直接帮助决策。信息:信息是赋予了数据一环境。知识:从信息中得到,经过实践证明的、可以用来辅助决 策和行动。这个例子中只包含了显性知识,如果小孩的发烧在经过各种检查后仍然找不到原因,则需要专家会诊,要看既往的病史、家族的病史加上医生的综合判断,就要使用医生的隐性知识。 数据数据可以记录历史资料,可以记录事件过程,可以表示事物特征。对于人类生存、发展、创新有着至关重要的作用。
7、体检指标,商品价格,股票价格,财务数据,GDP等等都属于数据。对于企业而言数据就是生产,经营,战略,几乎所有的经营活动都依赖数据,不可或缺。对于政府而言,数据就是社会各类经济社会活动的表现。有了数据的记录与使用,才有了社会的发展。信息时代数据的表现形式数据的潜在价值数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而绝大部分则隐藏在表面之下如何使用数据数据再利用数据再利用是指企业对历史数据进行重新的整理分析,为今后的业务提供决策支持。有些公司由于业务开展时间较长,会收集到大量的数据,但是如果他们并不急需使用,或并不擅长再次利用这些数据,就会使这些数据长期的挤压起来,直到业务环境彻底
8、变化,而失去可利用的价值。保存旧信息的计算机就是“数据坟墓”。数据再利用适合于控制着大型数据集运作的传统企业。比如移动电话运营商收集用户的位置信息来传输电话信号。对于移动电话运营商来讲,这些数据的任务已经完成,但是对于一些广告公司来说,这些数据非常有价值,可以用于发布位置广告进行促销活动。付费通数据再利用案例数据的重组数据重组是将两组和多组不同内容数据集结合起来进行分析。统计学中的关联分析,回归分析,就可以用于对不同数据集的结合分析。比如丹麦拥有1990-2007年间所有手机用户的相关信息,共涉及358403人。同时记录了该期间10729名中枢神经系统疾病患者相关信息。研究人员试图通过对这两个
9、数据集的关联分析来推断:手机用户是否比非手机用户显示出较高的中枢神经系统疾病发病率?使用手机时间较长的用户是否比时间较短的用户更容易患病?两个数据集都采用了严格的质量标准,几乎包括了几乎所有移动用户和病患的相关信息,属于全样本分析,分析结果较抽样分析更加准确。央行支付数据与区域经济关系分析案例可扩展的数据扩展数据是指一些具有基本用途的数据,还可以进行扩展,二次使用。如果以某种方式收集的单一数据集有多种不同的用途,它就具有双重功能。收集多个数据流或每个数据流中更多数据点的额外成本往往较低,因此,收集尽可能多的数据并在一开始的时候就考虑到各种潜在的二次用途并使其具有扩展性是非常有意义的。比如谷歌公
10、司的谷歌地图不仅拍摄房屋和街道的照片,同时还采集了GPS数据。不仅充实了其地图服务,而且对交通导航也有很大的帮助。废弃数据再利用废弃数据是指在使用过程中产生,但是却对最终结果没有价值的数据。但是这些数据往往同最终结果具有一定的相关性,能够反映出使用者的一些意图。例如,人们经常想搜索某个内容,点击进入后却未能找到想要的信息,于是又返回到搜索页面继续搜索。但是这个访问痕迹却已经被记录下来。Google认为这些信息是非常有价值的。如果许多用户都点击这个链接,就表明这个尝试和结果更加具有相关性,可以及时调整,提高搜索的效率。数据的分析目的让数据说话;行动的向导;杜绝浪费;提供决策的依据。分类描述性数据
11、分析预测性数据分析什么是数据分析? 数据分析是指适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总、理解并消化。以求最大化地开发数据的功能,发挥数据的作用。 数据分析的目的 数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结研究对象的内在规律。简单的数据分析数据分析步骤:明确分析目的和内容数据采集数据处理根据研究目标和内容进行分析分析出的结果通过图表的方式展现出来撰写数据分析报告数据分析中经常用到的指标或术语,除掌握最基本的平均数、百分比等概念以外,还需要将容易混淆的指标进行明确区分,避免在以后阐述分析结果时出现错误。常用指标或术语 平均数 绝对数与相对数
12、 百分比与百分点 频数与频率 比例与比率 倍数与番数 同比与环比平均数绝对数与相对数 绝对数:是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合指标。也是数据分析中常用的指标,如:GDP、总人口数等。 相对数:是指两个有联系的指标对比计算而得到的数值,用于反映客观现象之间数量联系程度的综合指标。计算相对数的基本公式: 比较数值(比数) 相对数= 基础数值(基数)分母是用做对比标准的指标数值,简称基数;分子是用做与基数对比的指标数值,简称比数。相对数一般以倍数、成数、百分数等表示,它反映了客观现象之间数量联系的程度。使用相对数时需要注意指标的可比性,同时要与总量指标(绝对数)结合使用
13、。百分比与百分点 百分比是相对数中的一种,它表示一个数是另一个数的百分之几,也称百分率或百分数。 百分点是指不同时期以百分数的形式表示的相对指标的变动幅度,1个百分点=1%。例如,下图某公司发言人就混淆了百分比与百分点的概念。 表示构成的变动幅度不宜用百分数,而应该用百分点。因此,这位公司发言人正确的说法应该是“公司今年的利润是45%,比去年的28%提高了17个百分点”。频数与频率 频率是每组类别次数与总次数的比值,它代表某类别在总体中出现的频繁程度,一般采用百分数表示,所有组的频率加总等于100%。某校A班30个男同学在50个同学中出现的频率为60%,即(3050)X100%;而20个女同学
14、在50个同学中出现的频率为40%,即(2050)X100%。 频数也称次数。在一组依大小顺序排列的测量值中,当按一定的组距将其分组时,出现在各组内的测量值的数目,即为该组的频数,频数与总数的比为频率。 频数越大表明该组标志值对于总体水平所起的作用也越大,反之,表明该组标志值对于总体水平所起的作用越小。 在10次掷硬币中,有4次正面朝上,我们说这10次试验中正面朝上的频数是4。 累积频数就是将各类别的频数逐级累加起来比例与比率 比例是指在总体中各部分的数值占全部数值的比重,通常反映总体的构成和结构。比如,A班共有学生50人,男生30人,女生20人,则男生的比例是30/50,女生的比例是20/50
15、。由此可以看出,比例的基数(也就是分母)都是全体学生人数,即为同一个基数。 比率是指不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关系。比如刚才的例子,男生30人,女生20人,则男生与女生的比率是30/20。这一指标经常会用在社会经济领域,比如我国的人口性别比就是用每100名女性数量相对的男性数量来表示的。倍数与番数 倍数与番数同样属于相对数,但使用时容易混淆。倍数是一个数除以另一个数所得的商。比如ABC,就是说A是B的C倍。需要注意的是,倍数一般是表示数量的增长或上升幅度,而不适用于表示数量的减少或下降。番数是指原来数量的2的N次方倍。比如翻一番为原来数量的
16、2倍( 21 ),翻两番为4倍( 22 )。正确的说法:公司产品销量翻一番(6.4=3.2X 21 ),从去年的3.2万件提高到今年的6.4万件。此外,我们成本控制也很好,由20万元下降了50%,今年成本为10万元同比与环比 同比是指与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况。例如2010年12月与2009年12月相比,如左图所示。 环比是指与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况。例如2010年12月与2010年11月相比,如右图所示。1、聪明的人有长的耳朵和短的舌头。 弗莱格 2、重复是学习之母。 狄慈根 3、当你还不能对自己说今天学
17、到了什么东西时,你就不要去睡觉。 利希顿堡 4、人天天都学到一点东西,而往往所学到的是发现昨日学到的是错的。 B.V 5、学到很多东西的诀窍,就是一下子不要学很多。 洛 克 6、学问是异常珍贵的东西,从任何源泉吸收都不可耻。 阿卜日法拉兹 7、学习是劳动,是充满思想的劳动。 乌申斯基 8、聪明出于勤奋,天才在于积累 华罗庚 9、好学而不勤问非真好学者。 10、书山有路勤为径,学海无涯苦作舟。 11、人的大脑和肢体一样,多用则灵,不用则废 茅以升 12、你想成为幸福的人吗?但愿你首先学会吃得起苦 屠格涅夫 13、成功艰苦劳动正确方法少说空话 爱因斯坦 14、不经历风雨,怎能见彩虹 真心英雄 15、只有登上山顶,才能看到那边的风光。 16只会幻想而不行动的人,永远也体会不到收获果实时的喜悦。 17、勤奋是你生命的密码,能译出你一部壮丽的史诗。 1 8成功,往往住在失败的隔壁!1 9 生命不是要超越别人,而是要超越自己2 0命运是那些懦弱和认命的人发明的!1人生最大的喜悦是每个人都说你做不到,你却完成它了!2世界上大部分的事情,都是觉得不太舒服的人做出来的3昨天是失效的支票,明天是未兑现的支票,今天才是现金4一直割舍不下一件事,永远成不了!5扫地,要连心地一起扫!6不为模糊不清的未来担忧,只为清清楚楚的现在努力7当你停止尝试时,就是失败的时候
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度展会现场医疗服务与安全保障协议2篇
- 多媒体技术与应用知到智慧树章节测试课后答案2024年秋浙江农林大学
- 2024食堂餐饮业务承接协议范本版B版
- 农村社区服务中心建设合同协议书
- 商业舞蹈馆建设合同
- 商铺租赁合同模板:创业基地
- 保险公司内勤聘用合同
- 国际旅游服务合同管理办法
- 2024版环保型编织袋买卖协议范本一
- 广播电视公司租赁合同
- 北京联合大学《数据挖掘B》2023-2024学年第一学期期末试卷
- 2024年中国大数据企业排行榜V9.0(大数据产业白皮书)-中国民营科技促进会
- 2025公司简单劳务合同书范本
- 东风集团新能源汽车培训
- 2024-2030年中国广电技术行业现状分析及未来发展趋势预测报告
- 广东省广州市天河区2023-2024学年高一上学期期末考试数学试卷(解析版)
- 钢构楼板合同范例
- 2024-2025学年人教版(2024)信息技术四年级上册 第11课 嘀嘀嗒嗒的秘密 说课稿
- 医疗组长竞聘
- 义务教育优质均衡发展区创建工作“路线图”和“时间表”
- 840D驱动优化与圆度测试
评论
0/150
提交评论