




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
-z.第一讲商务智能概述〔综合论述题〕学习本课程的原因:现代管理需要基于计算机的方法让决策更有有效性企业需要有智能A:在分析型商务智能软件的帮助下,用户可以建立统一的企业数据仓库平台,并收集,访问,分析每个商业领域的数据,同时,数据库技术的进步,效劳器性能的提升以及分析软件算法的优化,是的访问大型数据库处理海量信息变得更加容易便捷。B:商务智能可以提供个性化效劳,以满足不同用户的需求,智能搜索可以给决策者以很好的数据分析。与本专业的关联性:信息技术迅速开展的今天,电子商务已在国民经济中显现出极其重要的作用。伴随着效劳形态在全球扩,市场需求多样化,社会网络的广泛建立等社会经济巨大变革;数据量正以每年翻倍的速度扩增,然而数据源分散,异构数据库难以整合,数据接口复杂等问题严重,导致大量数据中真正能被利用来分析和运用的数据缺乏10%。如何将数据有效转化为决策者所需要的信息,提升电子商务整体应用水平,已经成为政府,企业界和软件开发界关注的一个研究方向。〔BI开展趋势:绩效管理,产品模块的集成,构造化和非构造化数据,数据质量,预测分析,客户定制化。〕根据商务智能的主要技术,以及电子商务的移动,虚拟性,个性化,社会性等新型特征,把商务智能同电子商务根底性规律结合起来,完善商务节点的数据挖掘,抽取,转化集成和应用。提升电子商务中的智能搜索,精度营销,比拟购物,供给链、配送优化等现实需求。描述商务智能融合技术在电子商务中的应用展望。商务智能在电子商务中的典型应用数据挖掘的应用:挖掘主要是挖掘出有潜力价值数据的信息拘束,主要应用在情报分析,数据库营销,识别用户消费行为,客户流失分析,划分客户群体等相关应用。〔沃尔玛超市尿布与啤酒的销售〕智能搜索的应用:人们运用关键词进展搜索返还的结果信息之间缺乏有效的关联,不仅增加了用户筛选结果信息的时间,而且也为用户查找有效信息增加了复杂的。更重要的是传统搜索系统基于信息共享平台设计,缺乏有效的权限管理策略和平安机制,无法有效的保证资讯信息合法使用。结合新兴电子商务的特征与精度营销,比拟购物,供给链、配送优化等现实需求,研究电子商务中的知识管理与智能搜索的理论和方法。主要容可包括:具有智能的商务知识表达与数据挖掘方法,非构造信息中的知识获取技术,网页数据有效提取与实时动态分析技术,个性化推荐技术的应用等问题。可视化技术的应用:基于有限的离散采样,三维数据比几何形态的信息更为丰富和完整,而且更适合于表达不规则的研究对象。知识管理的应用:随着知识管理在科研机构的应用,所有的科研成果和业最新信息都可以共享在知识库中,方便使用人员检索知识,参考经历,从而到达商务成果信息的有效利用。个性推荐技术的应用:个性化推荐必须能够对用户的喜好提供相关性强的准确的推荐,尽可能减少个性化用户的查找时间,推荐结果必须能够实时计算。商务智能在电子商务中的未来开展趋势(1)商务智能简易型趋势〔简便易用的交互界面;良好的适用性;实施与管理的便捷性;〕〔2〕商务智能平台化开展〔3〕商务智能嵌入化趋势〔4〕商务智能同群众决策互补开展第二讲商务智能导论1:BI的作用1.1商务智能与信息社会处在信息社会的一个重要标志性特征就是信息融合。由信息技术的进步和广泛应用驱动的技术融合不断深化,从两个方面对于人们的社会生活和经济活动产生影响。(一方面,企业中许多传统的业务决策问题逐渐变成信息决策问题.另一方面,信息产品及其应用随着技术创新呈现出越来越丰富的形态和特征)商务智能开展起来的四种推手:1:传统业务报告数据充分而知识匮乏;2:传统报告不能满足用户需求3:传统分析工具的整合能力有限〔用户被限定在数据对象中,而不能进一步分析和整合〕4:信息技术及应用的推广〔大容量数据存储,互联网,并行处理,云技术〕商务智能是信息社会繁荣的推动力—从传统的商业领域逐步拓展到政务领域、教育领域、医疗领域等其他各领域。1.2商务智能与企业管理商务智能对企业的战略决策也同样具有非常重要的影响,这种影响表达在3个方面:公司战略、业务战略和职能战略。(商务智能可以根据公司各战略业务单元的经营业绩和经营定位来选择合格的投资组合战略商务智能可以进展企业外部因素分析:外部环境分析、行业状况分析、竞争对手分析等商务智能可以在分析企业部因素(劳动力,本钱,技术,竞争等)的根底上为职能战略提供科学的决策依据)改善关系:提供有关业务状况的有用信息,提高企业知名度,改善全信息链的效率。理解业务:可以对各项业务进展准确的评估,帮助理解业务的驱动因素,识别对业务产生影响的关键因素,积极推动业务开展,培养良好开展态势。创造商业时机:掌握各种商务数据和信息的企业可以出手这些信息而获利。衡量绩效:从企业各个应用系统中提取各种根底绩效指标与关键绩效指标,对员工的工作绩效进展追踪、衡量和评价。商务智能是如何协助企业进展管理的呢?(基于目标的管理:能计算跨组织的绩效目标.基于异常的管理:检测实际指标与方案目标之间的偏差.基于事实的管理:将企业目标与事实结合.基于智能协同的管理:实现企业部与外部资源的协同)商务智能的商业价值主要有三个方面的表达:省钱,提高效率和提高竞争力。2.1BI的概念商务智能是企业利用现代信息技术收集、管理和分析构造化和非构造化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升各方面商务绩效,增强综合竞争力的智慧和能力。2.2BI的理解商务智能是通过对来自不同的数据源进展统一处理及管理,通过灵活的展现方法来帮助企业进展决策支持。2.3BI的四层面〔个数据分析层面;信息系统层面;知识发现层面;战略层面〕3商务智能的系统构成3.1四个阶段:数据收集→强大的分析工具→专业的分析知识→改善决策水平3.2关键技术:数据仓库,联机分析处理技术,数据挖掘,可视化技术。4商务智能的开发方法〔规划,需求分析,设计,实现。〕4.1商务智能系统成功的关键因素:培训,循序渐进,业务人员与IT人员合作,高层支持,业务驱动5商务智能的开展趋势•融合加强,演变成门户化•日趋“傻瓜〞,表达人性化•可视化数据和自助式BI•基于云计算的BI•移动BI•致力于搜索领域的BI第三讲数据仓库的概述不应该说数据库到数据仓库是技术的进步。数据仓库并不是对数据库的彻底抛弃。数据库与数据仓库的比拟:2数据集市数据集市(DataMart)又叫数据市场,是部门级的数据仓库,或者是为*种专门的用途开发的数据存储系统。数据集市:规模较小,本钱较低,针对性更强。数据仓库:数据来源于各个部门的不同应用系统,可保证数据的整合性。数据集市的两种根本形式A:附属的数据集市〔自上而下构建数据集市〕数据是从企业的数据仓库获得,可看作是数据仓库的一个子集。因此具有较好的数据整合性。假设需要的数据在数据集市中没有,则要先修改数据仓库的构造,使这种数据先进入数据仓库,再进入数据集市。这种数据集市适合用于对数据仓库的访问量比拟大的关键业务部门。B:独立的数据集市〔自下而上构建数据集市〕没有数据仓库作为它的数据来源,而是直接从各个应用系统取得数据,因此,本钱低,灵活性好,需要一种新的数据时不必修改企业级的数据仓库。可提供个别部门所需要的数据,整合性较差。第四讲数据仓库的分析1数据仓库的体系构造数据仓库是面向主题、面向分析和知识发现的一种数据处理技术,对数据仓库的使用没有固定的模式,因此数据仓库与操作型事务处理系统的构造有很大的不同。对于用户,数据仓库就是由数据源、数据仓库的数据存储、数据仓库的应用工具和可视化用户界面组成的。2粒度越是详细的数据,粒度级别越小;越是概括的数据,粒度级别越大。•双重粒度指轻度综合数据级和真实细节数据级(最低粒度级)。3确定粒度大小一般考虑的原则:•假设数据仓库的空间很有限,为节省存储空间,宜采用大粒度级表示数据;•假设追求数据仓库能够答复的问题类型的能力,要求能够答复非常具体的问题,则使用较小的数据粒度级别;•假设想要减轻处理器的负担,提高查询性能,则采用较大的数据粒度级别;•假设没有存储空间的限制,则可在一个数据仓库中采用多重粒度级别,既存储低粒度级别的数据,也存储高粒度级别的数据,以同时获得高的查询效率和查询能力。第五讲DW的设计与开发概念模型设计关键任务:分析和理解DW中的主题,确定主题的要素及描述属性。逻辑模型设计关键任务:粒度的划分、数据分割策略确实定、关系模式的定义、数据源及数据抽取模型等问题。物理模型设计关键任务:物理数据库表及其存储构造设计。2概念模型设计确定主题〔借助一些根本的方向性需求〕对每个主题的容进展描述〔描述容〕•需要做哪些类型的决策?•分析问题时所关心的事实;•决策者感兴趣的是什么问题?•分析问题时的各种观察角度;•这些问题需要什么样的信息•描述事实及观察角度的属性。•要得到这些信息需要包含哪些数据?3分析问题的维度市场经理:产品种类、时间、销售地区、销售渠道等。市场部部长:时间、地区、客户统计特征、分销机构、产品型号等。财务经理:预算、时间、地区4信息包图〔用户信息需求表〕*连锁旅馆入住情况〔核心问题是客房的使用量〕维度包括:客房类型,旅馆,时间关键指标:已占用客房,空房间,不可用房间,入住人数,收入等。对维度客房类型的分析:房间类型,房间大小,床位数,床位类型,最多容纳人数,套房家具,冰箱,厨房等。对维度旅馆的分析:分支机构代码,分支机构名称,国家,省份,地区,城市,建立年份,修缮年份等。对维度时间的分析:年份,季度,月份,星期几,日期,假日标准等。5数据仓库工程的开发过程:工程规划,需求分析,概念设计,ETL设计,逻辑和物理设计,实现与培训。第六讲OLAP1多维数据库〔MOLAP〕与关系数据库〔ROLAP〕在存储上的不同对关系数据库来说,任何数据集均用二维表来存放;对多维数据库也是用二维表来存放的,但其存放方式和效率不同。–假设增加汇总,存储空间的占用情况也不同。–假设增加一个时间维——季度,采用关系数据库存储时仍使用二维表,多维数据库则采用数据立方体这样的三维数组来存储。2MOLAP与ROLAP的特征一般情况,MOLAP和ROLAP的选择主要看应用的规模。假设要建立功能复杂、规模较大的企业级数据仓库,则一般选择ROLAP方式;假设是建立功能单一、小型的数据集市则更适合采用MOLAP方式。第七讲DM的概述1产生DM的原因:A:数据挖掘技术产生的动力:数据爆炸问题;数据过量而知识贫乏〔新理论、新材料、新工艺、新方法的不断出现,使知识老化的速度加快。〕B:从商业数据到商业信息的进化C:实施数据挖掘的目的:不再是单纯为了研究,更主要的是为商业决策提供真正有价值的信息,进而获得利润。所有企业面临的一个共同问题是:企业数据量非常大,而其中真正有价值的信息却很少,因此需要从大量的数据中经过深层分析,获得有利于商业运作、提高竞争力的信息,就像从矿石中淘金一样,数据挖掘也由此而得名。2数据挖掘与信息处理、知识发现–数据挖掘从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。与之相似的概念称为知识发现。–信息处理基于查询,可以发现有用的信息。但是这种查询答复反映的是直接存放在数据库中的信息。它们不反映复杂的模式,或隐藏在数据库中的规律。–知识发现(KnowledgeDiscoveryinDatabases)是用数据库管理系统来存储数据,用机器学习的方法来分析数据,挖掘大量数据背后隐藏的知识,称为数据库中的知识发现。3数据挖掘与数据仓库的区别联系–数据挖掘是数据仓库开展的必然结果。–数据仓库为数据挖掘提供给用根底:•大多数数据挖掘工具要在集成的、一致的、经过清理的数据上进展挖掘;•数据仓库构造过程中已组建了数据处理和数据分析的根底设施,数据挖掘可借此进展,不必重新组建根底设施;•数据仓库中的OLAP完全可为数据挖掘提供有关的数据操作支持;•在数据挖掘中,如果将数据挖掘与数据仓库进展有效地联结,将增加数据挖掘的联机挖掘功能。4数据挖掘与OLAP–OLAP分析过程在本质上是一个演绎推理的过程,是决策支持领域的一局部。传统的查询和报表工具是告诉你数据库中都有什么(whathappened),OLAP则更进一步告诉你下一步会怎么样(Whatne*t)和如果采取这样的措施又会怎么样(Whatif)。用户首先建立一个假设,然后用OLAP检索数据库来验证这个假设是否正确。–数据挖掘在本质上是一个归纳推理的过程,与OLAP不同的地方是,数据挖掘不是用于验证*个假定的模式(模型)的正确性,而是在数据库中自己寻找模型。–数据挖掘和OLAP具有一定的互补性。在利用数据挖掘出来的结论采取行动之前,OLAP工具能起辅助决策作用。而且在知识发现的早期阶段,OLAP工具用来探索数据,找到哪些是对一个问题比拟重要的变量,发现异常数据和互相影响的变量。这都有助于更好地理解数据,加快知识发现的过程。5数据挖掘的应用•银行–分析客户使用分销渠道的情况和分销渠道的容量;建立利润评测模型;客户关系优化;风险控制等•电子商务–网上商品推荐;个性化网页;自适应„•生物制药、基因研究–DNA序列查询和匹配;识别基因序列的共发生性„•电信–欺诈甄别;客户流失„•保险、零售……决策树•倾向性分析聚类分析•客户细分•市场细分关联分析•市场组合分析•套装产品分析•目录设计•穿插销售神经网络•倾向性分析•客户保存•目标市场•欺诈检测6DW解决的商业问题:推荐信息的生成,异常检测,客户流失分析,风险管理,客户细分,广告定位,预测。第八讲数据挖掘的过程1数据挖掘可以为公司提供哪些帮助,如何使用聚类、分类、关联规则挖掘和离群点检测等技术为企业效劳。(1)使用聚类发现互联网中的不同群体,用于网络社区发现;(2)使用分类对客户进展等级划分,从而实施不同的效劳;(3)使用关联规则发现大型数据集中间存在的关系,用于推荐搜索。如大局部搜索了“广外〞的人都会继续搜索“信息学院〞,则在搜索“广外〞后会提示是否进进一步搜索“信息学院〞。(4)使用离群点挖掘发现与大局部对象不同的对象,用于分析针对网络的秘密收集信息的攻击。CRISP-DM六阶段–商业理解:确定业务目标、评估商业环境、确定数据挖掘目标、提出工程方案–数据理解:收集原始数据、描述数据、探索数据、检查数据质量–数据准备:数据选择、数据清洗、数据创立、数据合并、数据格式化–建模:选择建模技术、测试方案设计–评估:结果评估、过程回忆、确定下一步工作–部署:部署方案、监控和维护方案、做出最终报告、工程回忆四层次:阶段划分、定义通用任务、定义专用任务、处理实例上两层独立于具体数据挖掘方法,是一般数据挖掘工程均需实施的步骤(这解决了“WHATTODO?〞的问题)。这两层的任务将结合具体数据挖掘工程的“上下文〞(CONTE*T)映射到下两层的具体任务和过程。下两层注重解决如何完成每个阶段所要完成的任务和任务的输出所要求的必要映射活动(这用于解决“HOWTODO〞的问题)。第九讲关联分析例1:通过统计用户主叫的业务使用情况,进展业务的关联分析。设有10项业务,记0—语音信箱,…,5—移动秘书,6—信息点播,…,9—呼叫转移,统计10个主叫及使用业务如下表所示。主叫使用业务类型主叫使用业务类型设A为业务5,B为业务6,T为事务总数(主叫统计数),则业务AB出现的支持度为P(A∪B)=AB出现次数/事务总数T=4/10=0.4对于具有支持度0.4的项集AB,规则A→B的可信度为P(B|A)=P(AB)/P(A)=(4/10)/(5/10)=0.4/0.5=0.8同理,规则B→A的可信度为P(A|B)=P(AB)/P(B)=0.4/0.6=0.67假设用户给出的最小可信度为0.3,最小支持度为0.3,则项集AB满足最小支持度,是二项频繁集,规则A→B,B→A两条规则满足最小可信度Apriori算法过程〔根本思想:频繁项集的任何子集也一定是频繁的。〕(1)制定最小支持度及最小置信度;(2)Apriori算法使用候选项集的概念,首先扫描数据库产生候选工程集,假设候选工程集的支持度≥最小支持度,则该候选项集合为频繁项集;(3)在Apriori算法的过程中,首先由数据库读入所有的事务数据,得出候选1_项集合C1及相应的支持度数据,通过将每个1_项集合的支持度与最小支持度比拟,得出频繁1_项集合L1,然后将这些频繁1_项集两两进展连接,产生候选2_项集合C2;(4)然后再次扫描数据库得到候选2_项集合C2的支持度,将2_项集的支持度与最小支持度比拟,确定频繁2_项集L2,类似地,利用这些频繁2_项集产生候选3_项集和确定频繁3_项集,以此类推;(5)反复扫描数据库与最小支持度比拟,产生更高项的频繁项集合,再结合产生下一级候选项集,直到不再结合产生出新的候选项集为止。例2:假定最小支持度是2,最小置信度为50%,求大项集。第十讲分类1熵〔Entropy〕:针对一个给定的属性(可预测属性)找出一个数学公式,来度量数据集的纯度。2ID3算法构建决策树Step1:建立相关性计数表Step2:选择一个属性,然后在根层次进展拆分。例:3从树中生成分类规则–用IF-THEN这种形式来表示规则–对从根到叶节点的每条路径创立一条规则–沿着一条路径的每个属性值对构成“并〞连接
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 唐山市2024-2025学年高一上学期期末考试地理试卷(含答案)
- 2025年电除颤的原理试题及答案
- 2025年宁波高校面试试题及答案
- 2025年地形图的判读试题及答案
- 家政学习资料练习试题及答案
- 2025年仪表分析仪试题集及答案
- 2025年中职生焊接考试题及答案
- 2025年高考数学复习易错题:不等式(新高考专用)含解析
- 2025年河北统编版中考历史一轮复习:中外近现代史上的改革与人物 学案(含答案)
- 2025年微软设计测试题及答案
- 财经纪律规范财务管理办法
- 第四章 学习心理导论
- 旅游政策与法规教案
- 科创板开户试题附答案
- 长输管道工序监理作业指导书
- 主主题三:医院感染控制标准执行案例
- 2023年高考物理一轮复习练习题:机械振动(含基础、提升两套)
- JJF 1914-2021金相显微镜校准规范
- 2023年江苏农林职业技术学院高职单招(语文)试题库含答案解析
- GB/T 25659.1-2010简式数控卧式车床第1部分:精度检验
- 11470国际劳务合作和海外就业第5章
评论
0/150
提交评论