下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能智慧树知到期末考试答案+章节答案2024年复旦大学在alpha-beta剪枝算法中,对于MAX节点,当它的效用值比当前的alpha低时可以进行剪枝。()
答案:错似然权重、马尔可夫蒙特卡洛方法这样的随机近似技术,可以对网络的真实后验概率进行合理估计,并能够比精确算法处理规模大得多的网络。()
答案:错alpha-beta剪枝一定比单纯的极大极小值算法效率高。()
答案:错强化学习中使用含参数的函数来估计状态,是从较小的空间映射到更大的空间。()
答案:错
答案:消去V后得到的因子是f4(W,Y)###产生的最大因子维度是3在无模型设定的强化学习中,马尔可夫决策过程的五元组已知部分有()
答案:在贝叶斯网络中,下面说法正确的是()。
答案:构建贝叶斯网络不一定要遵循因果关系###使用因果关系可以使贝叶斯网络的构建更加简单在估价函数中,对于g(x)和h(x)下面描述正确的是()。
答案:h(x)是从节点x到目标节点的最优路径的估计代价###g(x)是从初始节点到节点x的实际代价时序概率模型包含了()。
答案:描述观察过程的传感器模型###描述状态演变的转移模型如果回溯搜索算法运行弧相容检查并应用MRV和LCV来选择变量和值,那么回溯算法可能需要回溯的最大次数是多少?()。
答案:关于约束满足问题回溯算法中的LCV方法,说法正确的是()。
答案:LCV提高了回溯算法的效率,因为它通常会减少搜索中的回溯次数。
答案:当h是可采纳的,则存在常数c>0使得c*h是一致的。
答案:10%估值函数不满足的特点是()。
答案:效用值的大小与赢得游戏的几率无关。在强化学习值函数近似中,时序差分方法对参数的更新公式是()。
答案:在一个约束满足问题中,有n个变量,每个变量有d个取值,求解这样的树结构约束满足问题的计算复杂度是多少()。
答案:关于极大极小值搜索算法,以下说法正确的是()。
答案:状态的效用值是指当前状态下能得到的最大效用值。
答案:关于约束满足问题,以下说法错误的是()。
答案:约束满足问题存在最优解。基于模型的强化学习涉及纯离线计算,而模型无关的强化学习需要与环境进行在线交互。()
答案:错在求解约束满足问题时应用MRV和LCV来选择变量和值,可以在线性时间内求解问题。()
答案:错极小的衰减因子(接近0)会促使智能体选择贪心策略。()
答案:对深度优先搜索的空间复杂度更小,而广度优先算法的时间复杂度更小,而且更健壮。()
答案:对在图搜索算法中,如果按估价函数f(x)=g(x)+h(x)作为Frontier中的结点排序的依据,则该算法就是深度优先算法。()
答案:错
答案:错在贝叶斯网络中,当前节点条件独立于序号比它小的非父亲节点。()
答案:错马尔可夫过程一定存在稳态分布(不动点)。()
答案:错
答案:配备H-1的A*搜索###配备H-1的贪心搜索若一搜索树的树高有限且所有单步损耗均非负,则为每条边增加一正损耗c>0,以下树搜索算法中()所得搜索路径保持不变。
答案:BFS###DFS宽度优先搜索与深度优先搜索有何区别是()?
答案:宽度优先搜索的特点是先生成的节点先扩展###深度优先搜索的特点是先扩展最新产生的节点以下关于启发式函数和A*算法的描述正确的是()
答案:UCS图搜索和树搜索都是最优的###UCS是A*算法的一个特殊情况###如果启发式函数是可采纳的,则A*树搜索是最优的###如果启发式函数是一致的,则A*图搜索是最优的下列关于图搜索策略说法正确的是()。
答案:搜索过程中必须记住哪些点走过了###搜索过程中必须记住从目标返回的路径###是一种在图中寻找路径的方法###图的每个节点对应一个状态,每条连线对应一个操作符若一搜索树的树高有限且所有单步损耗均非负,则为每条边的损耗乘上一正常数w>0,以下树搜索算法中()所得搜索路径保持不变。
答案:BFS###DFS###UCS在有模型的强化学习中,属于动态规划求解的是()。
答案:策略迭代方法###值迭代方法
答案:+a−b−c+d;+a−b−c+d;+a−b+c+d;###+a−b−c+d;+a−b−c−d;+a+b−c−d强化学习中,泛化表示的特点有()。
答案:减少对经验的需求###降低内存消耗时序概率模型的推理任务主要有(),其中每一个人物都可以通过递归实现,运行时间与序列长度呈线性关系。
答案:预测###平滑###最可能解释###滤波在一个约束满足问题中,有n个变量,每个变量有d个取值,回溯算法在找到解决方案或得出不存在任何可行方案的结论之前,可能需要回溯的最大次数(即它生成的违反约束的部分或完整赋值方案的次数)是多少?()。
答案:理性的倾向选择不满足的条件是()。
答案:行为的效用值不一定是最大化的。
答案:
答案:E若转移矩阵是一个稀疏矩阵,且任何一个隐藏状态只能转移到M个可能的状态,使用维特比算法求最可能状态序列时可以忽略那些转移概率为0的路径,这时时间复杂度和空间复杂度为()。
答案:O(TMX),O(TX)我们可以使用监督学习或强化学习解决决策问题,则使用哪种方法时需要已知MDP的转移概率()
答案:两者都不需要在alpha-beta剪枝中,关于alpha、beta的初始化的说法正确的是()。
答案:alpha、beta的初始值分别为负无穷和正无穷。
答案:在采用树搜索求解八数码问题中,启发函数f(x)=g(x)+h(x)中的常使用()来定义g(x)。
答案:节点x所在层数下列关于马尔可夫决策问题(MDP)的说法中,正确的是()
答案:在等代价搜索算法中,总是选择()的节点进行扩展。
答案:代价最小我们可以使用监督学习或强化学习解决决策问题,则使用哪种方法需要来自接近最优策略(例如人类专家)的数据才能正常工作()
答案:监督学习关于零和游戏,以下说法错误的是()。
答案:玩家效用值的和为0。
答案:1/3,1/3
答案:若消元顺序为C->S时,求和消元后产生的最大因子维度为3.贝叶斯网络是()。
答案:有向无环图对于隐马尔可夫模型(HMM),设其观察值空间为O={o1,o2,…,oN},状态空间为:S={s1,s2,…,sK},观测值序列为Y={y1,y2,…,yT}。如果用维特比算法(Viterbialgorithm)进行解码,时间复杂为()。
答案:O(TK2)任何二阶马尔可夫过程都可以转化为一个扩大了状态变量集合的一阶马尔可夫过程。()
答案:对维特比算法的空间复杂度是O(TK)。()
答案:对下面属于精确推理的方法是():
答案:枚举推理法###变量消元法贝叶斯网络中精确推理的复杂度依赖于网络结构和网络规模()。
答案:对特征因子包括哪几种():
答案:联合分布###选定联合分布###多条件分布###单条件分布似然加权法是重要性采样的特殊情况,可能会生成不符合证据变量的样本()。
答案:错
答案:不独立,独立
答案:P(-cavity,catch,-toothache)=P(-cavity)P(catch|(-cavity)P(-toothache)|-cavity)###P(cavity,-catch,-toothache)=P(cavity)P(-catch|(cavity)P(-toothache)|cavity)贝叶斯网络中,节点的含义是什么()。
答案:随机变量
答案:0.5使用强化学习状态的泛化表示的好处有()。
答案:减少内存的消耗###可以减少采样在强化学习值函数近似中,蒙特卡洛方法对梯度计算是()。
答案:强化学习中有有模型的方法和无模型的方法()
答案:对在强化学习值函数近似中,时间差分方法对梯度计算是()。
答案:在强化学习值函数近似中,蒙特卡洛方法中可以使用SARSA和Q-learning进行真值的学习()
答案:错时序差分算法是一种在线学习的方法。()
答案:对
答案:从不
答案:具有确定性的状态转移时
答案:具有确定性的状态转移时当在一个MDP中只执行有限数量的步骤时,最优策略是平稳的。平稳的策略是指在给定状态下采取相同操作的策略,与智能体处于该状态的时间无关。()
答案:错假设马尔可夫决策问题(MDP)的状态是有限的,通过值迭代找到的策略优于通过策略迭代找到的策略。()
答案:错
答案:错
答案:对如果两个MDP之间的唯一差异是衰减因子的值,那么它们一定拥有相同的最优策略。()
答案:错约束满足问题关注动作路径。()
答案:错关于约束满足问题,说法错误的是()。
答案:对于任何类型的变量都可以通过枚举的方式展现所有变量赋值情况。关于约束满足问题的回溯搜索算法,以下说法正确的是()。
答案:赋值时,应选择最少限制的取值。###应选择剩余赋值选择最少的变量进行赋值。任何N元约束满足问题都可以转化为二元约束满足问题。()
答案:对约束满足问题的解是满足所有约束的一组变量赋值。()
答案:对alpha-beta剪枝中,哪些说法是正确的()。
答案:中间节点的极大极小值在执行完剪枝算法后可能是错误的。###alpha在MAX节点上更新。###对于MAX节点来说,当前效用值大于beta时可以进行剪枝。在期望最大搜索中,可能涉及什么类型的节点?()。
答案:两种都有。alpha-beta剪枝中,儿子节点的扩展顺序遵循效用值递减对MIN节点的值计算更高效。()
答案:错对抗博弈是一种零和游戏。()
答案:对极大极小值搜索算法相比于深度优先,更接近广度优先搜索算法。()
答案:错
答案:各数码到目标位置的曼哈顿距离总和###数码1、2、3、4移动到正确位置的步数###不在目标位置的数码总数在上述八数码问题中,有两种启发式函数,其中h1(n)为不在目标位置的数码总数,h2(n)为各数码到目标位置的曼哈顿距离总和,则h3(n)=max(h1(n),h2(n)),具有以下什么性质()。
答案:其余两项都满足假如一个搜索问题(有限状态)至少有一个解,则当A*图搜索算法配备任意可采纳的启发式函数时,一定能保证找到一解。()
答案:对当路径损耗非负时,一致代价搜索是A*算法的一种特例,其启发式函数既是可采纳的,又是一致的。()
答案:对
答案:G2以下无信息搜索算法中,同时具有完备性和最优性的有()。
答案:广度优先搜索###一致代
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 物理板块模型课程设计
- 乒乓球用品行业销售工作总结
- 酒店旅游行业行政后勤工作总结
- 线描基本技法课程设计
- 图文制作行业前台接待工作总结
- 三年高考地理(全国乙卷21-23)真题知识点-人口与城市
- 组织学生参加竞赛活动计划
- 2023-2024学年北京市清华大学附中朝阳学校高一(下)期中语文试卷
- DB32T 3393-2018 警务效能监察工作规范
- 網絡零售店店员工作总结
- 中小企业内部控制与风险管理(第二版)项目一:内部控制与风险管理基础
- 驾驶舱资源管理绪论课件
- 声艺 EPM8操作手册
- 西北农林科技大学专业学位研究生课程案例库建设项目申请书(MBA)
- 外墙保温、真石漆施工技术交底
- 车床日常点检表
- 配网工程施工监理管理要点~.docx
- 国内No.7信令方式技术规范----综合业务数字网用户部分(ISUP)
- 尾矿库在线监测方案)
- 房屋安全简易鉴定表.docx
- FSSC运营管理制度(培训管理办法)
评论
0/150
提交评论