




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1ArtificialIntelligence,简记为AI,是当前科学技术迅速发展及新思想、新理论、新技术不断涌现的形势下产生的一个学科,也是一门涉及数学、计算机科学、哲学、认知心理学和心理学、信息论、控制论等学科的交叉和边缘学科。智能是知识和智力的总和,知识是一切智能行为的基础,智力是获取知识并运用知识2)记忆和思维能力机器学习(MachineLearning,ML)是机器获取知识的根本途径,也是机器具有智能的重要标志,是人工智能研究的核心问题之一。机器学习是使计算机无需明确编程就能学习的5.人工智能的主要学派6.人工智能的主要研究内容1)知识表示:实际上是对知识的一种描述,或者是一组约定,是机器可以接受的用于描述知识的数据结构。2)推理:指按照某种策略,从已知事实出发,利用知识3)搜索与规划:搜索是指为了达到某个目标,不断寻找推理路线,以引导和控制推理,使问题得以解决的过程。规划是一种重要的问题求解技术,是从某个特定问题状态出发,寻找并建立一个操作序列,直到求得目标状态为止的一个行动过程4)机器学习:是机器获取知识的根本途径,也是机器具有智能的重要标志,是人工智能研究的核心问题之一。28.监督学习与非监督学习区别1)原理不同:监督学习是指利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程。无监督学习指根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题的过程。2)算法不同:监督学习的算法是通过分析已知类别的训练数据产生的。无监督学习的算法主要有主成分分析方法、等距映射方法、局部线性嵌入方法、拉普拉斯特征映射方法、黑塞局部线性嵌入方法和局部切空间排列方法等。3)适用条件不同:监督学习适用于样本数据已知的情况。非监督学习适用于无类别9.监督学习与强化学习区别1)监督学习有两个主要任务,即回归和分类,而强化学习则具有不同的任务,例如习中,马尔可夫的决策过程为建模和决策情况提供了数学框架。3)监督学习意味着名称本身就表示它是高度监督的,而强化学习则受到较少的监督,并且依赖学习代理来通过确定不同的可能方式来确定输出解决方案,以实现最佳解决方案。过拟合:当学习器把训练样本学得太好了的时候,很可能已经把训练样本自身的一些特点当作了所有潜在样本都会具有的一般性质,这样就会导致泛化性能下降。欠拟合:指对训练样本的一般性质尚未学好。11.模型评估的关键在于如何获得测试集,且测试集应该与训练集互斥。4)调参与最终模型313.性能度量是衡量模型泛化能力的评价标准,反映了任务需求,使用不同的性能度量往往会导致不同的评判结果,回归任务最常用的性能度量是均方误差。4)代价敏感错误率与代价曲线在某种度量下取得评估结果后,不可以直接比较以评判优劣,因为测试性能不等于泛化性能,测试性能会随着测试集的变化而变化,并且很多机器学习算法本身有一定的随机泛化性能是由学习算法的能力、数据的充分性以及学习任务本身的难度共同决定,偏差-方差分解是解释学习算法泛化性能的一种重要工具。1)参数:从模型中学习得到的变量。2)超参数:在开始学习过程之前设置其值的参数,而不是通过训练获得的参数数据。2)不同的影响因素4强化学习问题可以描述为一个智能体从与环境的交互中不断学习以完成特定目标(比如取得最大奖励值)。强化学习就是智能体不断与环境进行交互,并根据经验调整其策略来最大化其长远的所有奖励的累积值。策。智能体的决策功能是指根据外界环境的状态来做出不同的动作(Action),而学习功能是指根据外界环境的奖励来调整策略。.环境(Environment):智能体外部的所有事物,并受智能体动作的影响而改变态,并反馈给智能体相应的奖励。1)强化学习是试错学习,由于没有直接的指导信息,智能体要以不断与环境进行交互,通过试错的方式来获得最佳策略。2)延迟回报,强化学习的指导信息很少,而且往往是在事后才给出的,这就导致了一个问题,就是获得正回报或者负回报以后,如何将回报分配给前面的状态。.这个过程是通过在每个状态下选择行动来控制的,试图获得最大的长期回报。EQ\*jc3\*hps31\o\al(\s\up15(如何),π)EQ\*jc3\*hps31\o\al(\s\up15(到),:)A53)示例(回收机器人)61)动态规划:发展良好,但需要完整准确的环境模型;2)蒙特卡罗方法:不需要模型,概念上非常简单,但不适合逐步增量计算;3)时差学习:时差法不需要模型,而且是完全增量的,但分析起来更复杂;2)动态规划是理解其他方法的必要基础。3)其他方法试图实现与DP几乎相同的效果,只是计算量较少,并且没有假设环境EQ\*jc3\*hps51\o\al(\s\up1(P),s)EQ\*jc3\*hps29\o\al(\s\up3(a),s)EQ\*jc3\*hps29\o\al(\s\up3(a),ss)a个状态并应用适当的备份28.蒙特卡罗(MC)方法与动态规划(DP)之间的区别和联系3)MC违规造成的伤害较小;4)MC方法提供了另一种策略评估过程;而无需等待最终结果。72)TD较少受到怪异事件和抽样的影响,因为与其他状态相关的估计可能会得到更好8EQ\*jc3\*hps31\o\al(\s\up36(V的),V)EQ\*jc3\*hps31\o\al(\s\up36(贝),π)EQ\*jc3\*hps31\o\al(\s\up36(曼),s)EQ\*jc3\*hps41\o\al(\s\up3(a),s),REQ\*jc3\*hps41\o\al(\s\up3(a),ss),ΣΣip,(s)ΣEQ\*jc3\*hps31\o\al(\s\up28(蒙特),V)9tV(s)仁V(s}考虑以下带有折扣因子
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 西安交通工程学院《口腔病理学》2023-2024学年第二学期期末试卷
- 西安职业技术学院《工管运筹学》2023-2024学年第二学期期末试卷
- 2025河北省安全员C证考试题库
- 云南中医药大学《农业推广学》2023-2024学年第二学期期末试卷
- 辽宁特殊教育师范高等专科学校《室内专题项目生态性居住空间设计》2023-2024学年第二学期期末试卷
- 2025年江西省建筑安全员-A证考试题库附答案
- 铜仁幼儿师范高等专科学校《口腔组织病理学实验》2023-2024学年第二学期期末试卷
- 辽阳职业技术学院《外贸函电与单证》2023-2024学年第二学期期末试卷
- 北京协和医学院《需求分析与系统设计(双语)》2023-2024学年第二学期期末试卷
- 四川电力职业技术学院《WTO-TBT基础知识》2023-2024学年第二学期期末试卷
- DL-T5153-2014火力发电厂厂用电设计技术规程
- 冀人版科学六年级下册全册同步练习
- (高清版)JTGT 3365-02-2020 公路涵洞设计规范
- DZ∕T 0223-2011 矿山地质环境保护与恢复治理方案编制规范(正式版)
- 2024年湖南有色金属职业技术学院单招职业适应性测试题库学生专用
- 静疗相关血管解剖知识课件
- 【苏科版】九年级物理下册教学计划(及进度表)
- 康复运动治疗技术
- 医保定点医疗机构申请表
- 《大肠埃希氏菌》课件
- 煤矿环境保护培训课件
评论
0/150
提交评论