数据挖掘基本概念解说(1)精编版_第1页
数据挖掘基本概念解说(1)精编版_第2页
数据挖掘基本概念解说(1)精编版_第3页
数据挖掘基本概念解说(1)精编版_第4页
数据挖掘基本概念解说(1)精编版_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、PPT模板下载: 行业PPT模板: 节日PPT模板: PPT素材下载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载: PPT课件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 数据挖掘技术概论2目 录数据挖掘的基本概念1数据挖掘方法分类2CONTENTS数据挖掘案例3PPT模板下载: 行业PPT模板: 节日PPT模板: PPT素材下载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载: PPT课件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 数据挖掘技术概论3一、一、数据挖掘的

2、基本概念PPT模板下载: 行业PPT模板: 节日PPT模板: PPT素材下载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载: PPT课件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 数据挖掘技术概论41.知识发现(Knowledge-Discovery in Databases,简称:KDD)u 知识发现知识发现(KDD:Knowledge Discovery in Database)是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。u 知识发现知识发现就是从数据源中抽取感兴趣的数据,并把这些数据组织成

3、符合挖掘的组织形式,然后利用相应的算法、模型生成想要的知识模式,最后对生成的知识模式进行评估,并把有价值的知识集成到应用系统当中。 一、一、数据挖掘的基本概念常用KDD过程模型 (KDD process model) Fayyad,Piatetsky-Shapiro 和 Smyth 在 1996年合作发布的论文中总结出了KDD包含的5个最基本步骤-+数据源选择目标数据预处理预处理数据转换转换后数据数据挖掘评估知识模式知识PPT模板下载: 行业PPT模板: 节日PPT模板: PPT素材下载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载: PPT课

4、件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 数据挖掘技术概论52.数据挖掘的概念u 数据挖掘数据挖掘,英文称为 Data mining,又称为资料探勘、数据采矿等等。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步骤。 u 数据挖掘数据挖掘是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程。u 数据挖掘数据挖掘是从大量的、不完全的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。一、一、数据挖掘的基本概念PPT模板下载: 行业PPT模板: 节日P

5、PT模板: PPT素材下载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载: PPT课件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 数据挖掘技术概论63.数据挖掘的发展历史一、一、数据挖掘的基本概念 1989年第11届国际人工智能联合会议。第一次提出KDD的概念。 1995年第一届知识发现和数据挖掘国际学术会议。首次提出数据挖掘的概念。 1995年底美国计算机年会。开始把数据挖掘认为是KDD过程中对数据真正应用算法抽取知识的一个基本步骤。 如今各种各样的数据挖掘软件和算法。PPT模板下载: 行业PPT模板: 节日PPT模板: PPT

6、素材下载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载: PPT课件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 数据挖掘技术概论74.数据挖掘基本流程一、一、数据挖掘的基本概念DataBusinessUnderstandingDataUnderstandingModelingEvaluationDeploymentDataPreparation跨行业数据挖掘标准流程PPT模板下载: 行业PPT模板: 节日PPT模板: PPT素材下载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载:

7、PPT课件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 数据挖掘技术概论84.数据挖掘基本流程一、一、数据挖掘的基本概念数据采集开始数据分析数据清洗采样特征提取缺失值计算定量特征二值化定性特征编码数据变换无量纲化特征选择降维训练预测评估结束模型选择PPT模板下载: 行业PPT模板: 节日PPT模板: PPT素材下载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载: PPT课件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 数据挖掘技术概论9二、二、数据挖掘的方法分类PPT模板下载: 行业PPT模板: 节日PPT模板: PPT

8、素材下载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载: PPT课件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 数据挖掘技术概论101.几种简单的数据挖掘方法u 分类 (Classification)u 聚类(Clustering)u 回归分析(Regression analysis)u 关联规则(Affinity grouping or association rules)u 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等)二、二、数据挖掘方法分类PPT模板下载: 行业PPT模板: 节日PPT模板: PPT素材下

9、载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载: PPT课件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 数据挖掘技术概论112.分类(Classification)C4.5 (基于决策树改进的算法) CART(分类回归树)SVM(支持向量机)AdaBoost(集成学习算法)kNN(K近邻算法,k-NearestNeighbor)Naive Bayesian(朴素贝叶斯)二、二、数据挖掘方法分类数据已训练好的模型类别A类别BPPT模板下载: 行业PPT模板: 节日PPT模板: PPT素材下载: PPT图表下载: 优秀PPT下载:

10、PPT教程: Word教程: Excel教程: 资料下载: PPT课件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 数据挖掘技术概论122.分类(Classification)kNN(K近邻算法,k-NearestNeighbor)二、二、数据挖掘方法分类PPT模板下载: 行业PPT模板: 节日PPT模板: PPT素材下载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载: PPT课件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 数据挖掘技术概论133.聚类(Clustering)(1)划分方法(2)层次的方法(3)基于密度

11、的方法(4)基于网格的方法(5)基于模型的方法 经典算法:K-means(K均值)二、二、数据挖掘方法分类PPT模板下载: 行业PPT模板: 节日PPT模板: PPT素材下载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载: PPT课件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 数据挖掘技术概论144. 回归分析(Regression analysis) 回归分析是一个统计预测模型,用以描述和评估因变量与一个或多个自变量之间的关系,反映的是变量或属性间的依赖关系。线性回归多项式回归逻辑回归二、二、数据挖掘方法分类XPPT模板下载:

12、行业PPT模板: 节日PPT模板: PPT素材下载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载: PPT课件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 数据挖掘技术概论155.关联规则(Affinity grouping or association rules) 关联规则关联规则最初提出的动机是针对购物篮分析(Market Basket Analysis)问题提出的。 关联规则关联规则是形如XY的蕴涵式,其中, X和Y分别称为关联规则的先导(antecedent或left-hand-side, LHS)和后继(conseque

13、nt或right-hand-side, RHS) 。其中,关联规则XY,存在支持度支持度和信任度信任度。 关联规则中最经典的算法:AprioriApriori算法算法二、二、数据挖掘方法分类PPT模板下载: 行业PPT模板: 节日PPT模板: PPT素材下载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载: PPT课件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 数据挖掘技术概论165.关联规则(Affinity grouping or association rules)二、二、数据挖掘方法分类网球拍网球运动鞋羽毛球11110211

14、0031000410105011161100 若考虑网球拍-网球的关联关系,则其支持度为S=3/6=0.5,置信度为C=3/5=0.6,假如设计支持度最小为0.5,置信度为0.6,那么网球拍和网球的关联关系就是有意义的一对关联关系。PPT模板下载: 行业PPT模板: 节日PPT模板: PPT素材下载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载: PPT课件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 数据挖掘技术概论17二、二、数据挖掘方法分类5.关联规则(Affinity grouping or association rule

15、s)PPT模板下载: 行业PPT模板: 节日PPT模板: PPT素材下载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载: PPT课件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 数据挖掘技术概论18三、三、数据挖掘案例PPT模板下载: 行业PPT模板: 节日PPT模板: PPT素材下载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Excel教程: 资料下载: PPT课件下载: 范文下载: 试卷下载: 教案下载: PPT论坛: 数据挖掘技术概论19三、三、数据挖掘案例背景背景 银行金融衍生品部门最新新上线了一款金融理财产品,而销售方式为直接电邮,考虑到多数用户可能不会对理财产品感兴趣,所以销售目标为用户群中对产品兴趣度最高的前20%数据表 有效字段客户表 姓名、职业、性别、生日、收入日期对照表 日期的各种转化形式账号信息表 账号类型,月费、透支额度等交易信息表 交易类型、交易日期、交易金额PPT模板下载: 行业PPT模板: 节日PPT模板: PPT素材下载: PPT图表下载: 优秀PPT下载: PPT教程: Word教程: Exce

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论