0b924数据挖掘及应用第5讲分类基础_第1页
0b924数据挖掘及应用第5讲分类基础_第2页
0b924数据挖掘及应用第5讲分类基础_第3页
0b924数据挖掘及应用第5讲分类基础_第4页
0b924数据挖掘及应用第5讲分类基础_第5页
已阅读5页,还剩102页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5 11231123通过特征一步步依靠特征描述找到目 维和度量的数据许多当前的OLAP对于概念形成,数据库属性可以是各种各样的数据类数据库中属性 也可能包括复杂的数据类用户需要对每个维的作用有透彻的理为了找到一个满意的描述,用户需要使用一长串OLAP操更自动化的过首先使用关系数据库查询收集任务相关的数 什么叫拥有大量不同如何判断一个属性该被删除、泛化、还是直接保概念如何分 经验判比较对象:可比较类(或概念 模型的 知每个训练样本属于哪个类的“指导”下进模型的学习不知道每个训练样本属于哪个聚类是典型的无指导1123vs随后,数学家伯努利、拉斯、泊松和高斯等人对伯努纳为拉斯所定义的古典概型。但这种概率定义既要求 用同一仪器多次称量同一物体的重量,所得结果总是略有差异多次射击,所中的环数也不尽相明天某 的价格是多少这种不确定现象称为随机现E1:抛一枚硬币,观察正面 S6:{t︱S7:{(x,y︱T0≤x≤y≤T1},这里x示最低温度,y表示最高包含:AB或B,称事件B包含事件A,即事件A发生相等:AB且BA,即AB,称事件A与事件B和:AB,表示A、B二事件中至少有一个发生; 示n个事件A1,A2,…,An中至少有一个发生。 n个事件A1A2An

k生;若n个事件A1A2An的任意两个事件不能同时发生,则称A1,A2,…,An互不相容。对立(互逆):若AB=S,且AB=,则A与B逆。有AAS,AA

ABBA,ABBA;ABCABC,ABCABABCABAC,德·

ABABABA对于个事件,德·对于一个随机事件A(除必然事件和不可能事件外)来说, A发生的次数nA称为事件A发生的频数。比值nAn称为事号n=n=1223314551627482933⑶可列可加性:设A1,A2,…两两互不相容的事件,即对于i≠j, AiAj=,i,j=1,2,…,则有 PAnP(An 性质 P(S)1,P()性质2 对任意n个事件A1,A2,,An,若他们是两互不相容的事件,则有niP(A)ii

i

P(Aini否 P(A)ii

P(AiAjni 1ijn P(AAA)1nP( 1ijk性质3 设A,B是两个事件,AB,则P(BA)P(B)P(A);P(B)P(性质 对于任一事件A,P(A)性质 若为A的对立事件, P(A)1否则

若AB,则PABPAP(B);PABPAP(BPAB).P(AB)P(AB)1P(A1{P(A)P(B)P(

832000

6

P(AB)

P(A)

250 83

p1 20008P(B)

2000 为个,记为e1,e2,…,en,而且这些事件是两两互不 1=P(S)=P({e1}∪{e2}∪…∪{en})=若事件

这里ii,i是这里ii,i是中某k个不同的数。则有

iP(A

A包含的样本点数j

样本点总数 ⑵由于A2={TTT},于PA1PA11 任一个盒子,故共有Nn种不同的放法,而每个盒子中至A NN1Nn A p N N 为(男,男),(男,女),(女,男),(女,女)的可能性是一样的。若以记 P(AB)2

P(AB)P(B)m(P(AB)m(AB)

m(S P(AB)

m(S

P(B) P(P(BA)P(⑶可列可加性:设B1,B2,…两两互不相容的事件,即对于i≠j, BiBj= ,i,j=1,2,…,则有 PBiA

i iP(B)P(A1A2B)P(A1B)P(A2B)P(A1A2 –,且条件概率是在试验的条件上加上一个新条件如发生求事件如发生的概率。条件概率与的区别就是在E的条件上增加了一个新条件。而无条件概率是没有增加新条件的概率。。⑴BiBj=,i≠j,i,j=1,2,…,n;,B1,B2,…,Bn为S的一个划分,且P(Bi)>0(i=1,2,…,n),则 样本空间可以划分为事件一知道正确答案,A一不知P(B∣A)=1,而P(B∣A)=1/4。由全概率公式 1123Thomas(做过神甫)P(AB)P(BA)P(P(B) 感冒——发烧、流鼻涕、头发烧、流鼻涕、头痛——感冒长寿——吃大吃大蒜…一个划分,且P(A)>0,P(Bi)>0(I=1,2,…,n),则

A)

P(ABj)P(BjP(ABiP(ABi)P(Bin

,i1,2,, P(AP(ABi)P(BiP(Bi

A)

nnP(ABj)P(Bjj

,i1,2,,设村民过去 P(`H)=0.21)1)P(Bi

A)

P(ABj)P(BjP(ABiP(ABi)P(Bin

,i1,2,,贝叶斯决策就是在不完全下,对部分未知的状态用主1、已知类条件概率密度参数表达式和先验概2、利用贝叶斯公式转换成后验概3Cf1f2f3P(健康|P(小李症状|P(P(小李症状)=P(打喷嚏|健康)P(咳嗽|健康)P(不发烧|健康)P(健康)/P(小李症状)=0.1×0.1×(1-0.01)×0.9/P(小李症状)=0.0089PP(感冒|0.05)(0.9)(0.8)(0.3)/P(E)=0.01PP(过敏|P0.0089+0.010.019P(健康|P(感冒|P(过敏| –表达能力强,基本反映客观现实但无法计算 反映较小部分客观现实,可计算,代价较 Bayesiannetwork又称信任网络(beliefnetwork)或是有向非循环图形模型(directedacyclicgraphicalmodel),是一种概率图型模型,借由有向非循环图形(directedacyclicgraphs,orDAGs)中得知一组随 分配(conditionalprobabilitydistributions,orCPDs)的 概念描述与OLAP的区别是什么概念描述方法有哪什么是分类,什么是有指导/无指导学习什么是决定性现象,什么是不确定现象什么是随机试验、样本空间、样本点什么是随机事件、基本事件、复合事件、必然事件、不可能事

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论