




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2024/8/71贝叶斯分类方法
贝叶斯分类器是一个统计分类器。它们能够预测类别所属的概率,如:一个数据对象属于某个类别的概率。例子:预测对某移动电话的一次呼叫能否成功(P136)2024/8/72贝叶斯定理P(H|X)表示条件X下H的概率(条件概率、后验概率)2024/8/73贝叶斯定理——例子某电子设备厂所用的元件是由三家元件厂提供的,根据以往的记录,这三个厂家的次品率分别为0.02,0.01,0.03,提供元件的份额分别为0.15,0.8,0.05,设这三个厂家的产品在仓库是均匀混合的,且无区别的标志。问题:在仓库中随机地取一个元件,若已知它是次品,分析此次品出自何厂家的概率最大?2024/8/74题解设A取到的元件是次品,Bi表示取到的元件是由第i个厂家生产的,则
P(B1)=0.15,P(B2)=0.8,P(B3)=0.05那么,在仓库中随机地取一个元件,它是次品的概率为由贝叶斯公式
结果表明,这个次品来自第2家工厂的可能性最大,来自第1家工厂的概率次之,来自第3家工厂的概率最小。2024/8/75简单贝叶斯分类器(朴素贝叶斯)
进行分类操作处理的步骤(1)2024/8/76简单贝叶斯分类器
进行分类操作处理的步骤(2)2024/8/77简单贝叶斯分类器
进行分类操作处理的步骤(3)2024/8/78贝叶斯分类器的应用【例】利用贝叶斯分类方法预测一个数据对象X(
年龄<30,收入=中,是否学生=是,信用=一般)类别(P137)序号年龄收入是否学生信用购买PC1<=30高否中否2<=30高否优否331~40高否中是4>40中否中是5>40低是中是6>40低是优否731~40低是优是8<=30中否中否9<=30低是中是10>40中是中是11<=30中是优是1231~40中否优是1331~40高是中是14>40中否优否利用表中的数据作为训练样本集和贝叶斯分类器来帮助预测未知(类别)数据样本类别。训练数据集包含年龄、收入、是否学生和信用这四个属性,其类别属性为购买PC。它有两个不同的取值:{是,否}。2024/8/79设c1对应类别购买PC=是,即c1=9;c2对应类别购买PC=否,即c2=5;因此对未知样本所要进行的分类就是:
X={年龄<30,收入=中,是否学生=是,信用=一般}为了获得P(X|Ci)P(Ci)(其中i=1,2),P(Ci)为每个类别的事前概率,所进行的具体计算结果描述如下:
P(C1)=9/14=0.643 P(C2)=5/14=0.357为了计算P(X|Ci)P(Ci)(i=1,2),需要首先进行以下运算:
P(年龄<30|C1)=2/9=0.222 P(年龄<30|C2)=3/5=0.600 P(收入=中|C1)=4/9=0.444 P(收入=中|C2)=2/5=0.400 P(是否学生=是|C1)=6/9=0.667 P(是否学生=是|C2)=1/5=0.200 P(信用=一般|C1)=6/9=0.667 P(信用=一般|C2)=2/5=0.400利用以上所获得的计算结果,可以得到:
P(X|C1)=0.222×0.444×0.667×0.667=0.044 P(X|C2)=0.600×0.400×0.200×0.400=0.019最后计算P(X|Ci)P(Ci)(i=1,2)
P(X|C1)P(C1)=0.044×0.643=0.028 P(X|C2)P(C2)=0.019×0.357=0.007因为P(X|C1)P(C1)>P(X|C2)P(C2),所以根据贝叶斯分类方法得出结论:数据对象X的“购买PC类=是”,即X属于购买PC类2024/8/710练习:下表是其保险公司某项健康保险业务销售的客户记录
现有一名客户年龄是32岁,收入水平中等,没有固定职业,信用等级良好,用贝叶斯分类器预测该客户是否购买这种健康保险。2024/8/711题解2024/8/712贝叶斯分类器的作用
从理论上讲与其他分类器相比,贝叶斯分类器具有最小的错误率。但实际上由于其所依据的类别独立性假设和缺乏某些数据的准确概率分布,从而使得贝叶斯分类器预测准确率受到影响。但各种研究结果表明:与决策树和神经网络分类器相比,贝叶斯分类器在某些情况下具有更好的分类效果。贝叶斯分类器的另一个用途就是它可为那些没有利用贝叶斯定理的分类方法提供了理论依据。例如在某些特定假设情况下,许多神经网络和曲线拟合算法的输出都同贝叶斯分类器一样使得事后概率取最大2024/8/713贝叶斯信念网络基本贝叶斯分类器是基于各类别相互独立这一假设来进行分类计算的,也就是要求若给定一个数据样本类别,其样本属性的取值应是相互独立的。这一假设简化了分类计算复杂性。若这一假设成立,则与其他分类方法相比,基本贝叶斯分类器是最准确的;但实际上变量间的相互依赖情况是较为常见的。贝叶斯信念网络就是用于描述这种相互关联的概率分布。该网络能够描述各属性子集之间有条件的相互独立。它提供了一个图形模型来描述其中的因果关系,而学习也正是基于这一模型进行的。这一图形模型就称为贝叶斯信念网络(常简称为信念网络)。2024/8/714贝叶斯信念网络2024/8/715贝叶斯信念网络2024/8/716贝叶斯信念网络例子:P1382024/8/717贝叶斯信念网络2024/8/718贝叶斯信念网络信念网络中的一个结点可以被选为输出结点,用以代表类别属性,网络中可以有多于一个的输出结点。该网络可以利用学习推理算法;其分类过程不是返回一个类别标记,而是返回一个关于类别属性的概率分布,即对每个类别的预测概率。贝叶斯网络的优点:易于理解,预测效果好 缺点:倾向于发生频率很高的结果2024/8/719Micro
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB13-2352-2016-煤场、料场、渣场扬尘污染控制技术规范-河北省
- 2025型靶机维修服务合同范本
- 2025年北京市车位租赁合同范本
- 《优化社会和谐》课件
- 检验工作要求培训
- 安徽省长丰县高中化学 第三章 探索生活材料 3.2 金属的腐蚀与防护教学设计 新人教版选修1
- 高标准农田建设项目可行性分析报告
- 仓库工作总结中的经验教训计划
- 第二单元教学设计 2023-2024学年统编版语文七年级下册
- 2025年特许金融分析师考试应试技巧试题及答案
- (三诊)绵阳市高中2022级高三第三次诊断性考试 英语试卷A卷(含答案)
- 中职语文静女教案
- 2025年执业兽医备考攻略完美版
- 猪场6S管理培训资料
- 国家安全教育教案第五章坚持以政治安全为根本
- PPT公路工程施工常见质量通病与防治措施(图文并茂)
- 提升中西医协同协作能力实施方案
- 热烈欢迎某某公司领导莅临指导
- 多旋翼理论-AOPA考证试题库(含答案)
- 电解铝供电整流系统的优化改造
- 《孤独症认知训练》PPT课件
评论
0/150
提交评论