data mining bayesian classifiers管理学教授财经信息管理与工程学院_第1页
data mining bayesian classifiers管理学教授财经信息管理与工程学院_第2页
data mining bayesian classifiers管理学教授财经信息管理与工程学院_第3页
data mining bayesian classifiers管理学教授财经信息管理与工程学院_第4页
data mining bayesian classifiers管理学教授财经信息管理与工程学院_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

贝叶斯分类器(Bayesian托马斯贝叶斯(Thomas,约1702年-1761年4月17PagePagePage联合概率P(X=x,条件概率P(Y=y|P(X,Y)=P(Y|X)×P(X)=P(X|Y)×ConditionalBayes

P(C|A)P(A,C)P(P(A|C)P(A,C)P(C)P(C|A)P(A|C)P(C)=0.75=P(X=蓝|Y=蓝P(Y=蓝P(X=蓝|Y=红P(Y=红=0.75×0.35+0.3PagePageConsidereachattributeandclasslabelasrandomGivenarecordwithattributes(A1,GoalistopredictclassSpecifically,wewanttofindthevalueofCthatmaximizesP(C|A1,A2,…,An)CanweestimateP(C|A1,A2,…,An)directlyfromcomputetheposteriorprobability(后验概率P(C|A1,A2,…,An)forallvaluesofCusingtheBayesP(C|AAA)P(A1A2

|C)P(C)1A P(1A

2AnChoosevalueofCthatP(C|A1,A2,…,EquivalenttochoosingvalueofCthatmaximizesP(A1,A2,…,An|C)P(C)HowtoestimateP(A1,A2,…,An|CPagePage朴素贝叶斯分类器NveBayesAssumeindependenceamongattributesAiwhenclassisP(A1,A2,…,An|C)=P(A1|Cj)P(A2|Cj)…P(An|CanestimateP(Ai|Cj)forallAiandNewpointisclassifiedtoCjifP(Cj)P(Ai|Cj)isPagePage 1125KNo 1125KNo2No100KNo3No70KNo4120KNo5No95K6No60KNo7220KNo8No85K9No75KNo10No90K P(No)=P(Yes)=Fordiscrete

|

)=

|/where|Aik|isnumberofinstanceshavingattributeAiandbelongstoclassCkForcontinuousDiscretizetherangeintooneordinalattributeperviolatesindependenceTwo-waysplit:(A<v)or(A>chooseonlyoneofthetwosplitsasnewProbabilitydensityAssumeattributefollowsanormalUsedatatoestimateparametersofdistribution(e.g.,meanandstandarddeviation)Onceprobabilitydistributionisknown,canuseittoestimatetheconditionalprobabilityP(Ai|c)1125KNo2No100KNo3NoNo4120KNo5No6NoNo7220KNo8No9NoNoNo P(A|c)

(A Oneforeach(Ai,ci)For(Income,Ifsamplemean=samplevariance=P(Income120|No)

(120110e2(2975 PageExampleofNaeBayesGivenaTestnaiveBayesP(Refund=No|No)=4/7P(Refund=Yes|Yes)=0P(Refund=No|No)=4/7P(Refund=Yes|Yes)=0P(MaritalStatus=Single|No)=2/7P(MaritalStatus=Divorced|No)=1/7P(MaritalStatus=Married|No)=4/7P(MaritalStatus=Single|Yes)=2/7P(MaritalStatus=Married|Yes)=0FortaxableIf Ifclass=Yes: samplemean=90P(Married|=4/74/70.0072=P(Married|=101.210-9=P(No)= SinceP(X|No)P(No)>P(X|Yes)P(Yes) P(No|X)>P(Yes|X)=>Class=NoPagePagePageNaeBayesIfoneoftheconditionalprobabilityiszero,thentheentireexpressionbecomeszeroProbability

|C)

c:numberof

N|C)N

Nic

p:priorprobabilitym:parameterNcii

|C)

mm称为等价样本大小的参数,决定先验概率p和观测概率nc/n当训练样例较少时,mPagePageExampleofNaeBayesA:leopardP(A|M)

P(A|N)

1103

7P(A|M)P(M)0.06

P(A|N)P(N)0.004 ?=>PagePageNaeBayesRobusttoisolatednoiseHandlemissingvaluesbyignoringtheinstanceduringprobabilityestimatecalcul

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论