版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
注:仅客观题绪论第一章单元测试第二章单元测试第三章单元测试第四章单元测试第五章单元测试第六章单元测试第七章单元测试第八章单元测试第九章单元测试第十章单元测试绪论1【单选题】(100分)针对智能体的思考是否合理,所引入的指标叫做()A.严谨B.理性C.严密D.智慧第一章单元测试1【单选题】(20分)在下图八数码问题中,需要通过移动将杂乱的8个方块按照右侧的顺序进行排列,那么该问题的状态空间的大小是()?A.9*9B.9C.9!D.82.【多选题】(20分)正确答案:ABC以下无信息搜索算法中,同时具有完备性和最优性的有()。A.一致代价搜索B.迭代加深搜索C.广度优先搜索D.深度优先搜索3.【多选题】(20分)正确答案:ABD对于有限状态图上的搜索问题,以下说法正确的有()。A.一致代价搜索(UCS)不一定总能找到最优解B.深度优先图搜索(BFS)可以保证找到解(如果存在至少一解)C.存在深度优先树搜索有解而广度优先树搜索无解的案例D.存在广度优先树搜索有解而深度优先树搜索无解的案例4【判断题】(20分对于一个边损耗非负的有限图,采用广度优先树搜索可以得到最优解,并且对每条边加上一个相同的非负损耗c>0之后,最优路径保持不变。()A.错B.对5【单选题】(20分)在下图搜索问题中,S为起始节点,G1、G2、G3均为目标节点,则采用一致代价找到的解是()A.G1B.均不可能C.G3D.G2第二章单元测试1【判断题】(20分假如一个搜索问题(有限状态)至少有一个解,则当A*图搜索算法配备任意可采纳的启发式函数时,一定能保证找到一解。()A.错B.对2【判断题】(20分当路径损耗非负时,一致代价搜索是A*算法的一种特例,其启发式函数既是可采纳的,又是一致的。()A.对B.错4.【多选题】(20分)正确答案:ACD在如图所示的八数码问题中,如果A格与B格相邻且B为空,则A可以移动至B。以下可以作为八数码问题的一致启发式函数的有()。A.各数码到目标位置的曼哈顿距离总和B.都不正确C.不在目标位置的数码总数D.数码1、2、3、4移动到正确位置的步数5【单选题】(20分)在上述八数码问题中,有两种启发式函数,其中h1(n)为不在目标位置的数码总数,h2(n)为各数码到目标位置的曼哈顿距离总和,则h3(n)=max(h1(n),h2(n)),具有以下什么性质()。A.一致的B.其余两项都不满足C.其余两项都满足D.可采纳的第三章单元测试1【判断题】(20分对抗博弈是一种零和游戏。()A.错B.对2【判断题】(20分极大极小值搜索算法相比于深度优先,更接近广度优先搜索算法。()A.错B.对3【判断题】(20分alpha-beta剪枝中,儿子节点的扩展顺序遵循效用值递减对MIN节点的值计算更高效。()A.对B.错4【单选题】(20分)在期望最大搜索中,可能涉及什么类型的节点?()。A.两种都有。B.随机节点。C.两种都无。D.MAX节点。5.【多选题】(20分)正确答案:ACDalpha-beta剪枝中,哪些说法是正确的()。A.对于MAX节点来说,当前效用值大于beta时可以进行剪枝。B.alpha在MIN节点上更新。C.中间节点的极大极小值在执行完剪枝算法后可能是错误的。D.alpha在MAX节点上更新。第四章单元测试1【判断题】(20分约束满足问题关注动作路径。()A.错B.对2【判断题】(20分约束满足问题的解是满足所有约束的一组变量赋值。()A.对B.错3【判断题】(20分任何N元约束满足问题都可以转化为二元约束满足问题。()A.错B.对4【单选题】(20分)关于约束满足问题,说法错误的是()。A.一元约束仅涉及一个变量。B.对于任何类型的变量都可以通过枚举的方式展现所有变量赋值情况。C.交通排班可以构建成一个约束满足问题。D.变量赋值往往伴随与倾向性相关的评价。5.【多选题】(20分)正确答案:AB关于约束满足问题的回溯搜索算法,以下说法正确的是()。A.应选择剩余赋值选择最少的变量进行赋值。B.赋值时,应选择最少限制的取值。C.应选择剩余赋值选择最多的变量进行赋值。D.赋值时,应选择最多限制的取值。第五章单元测试1【判断题】(10分假设马尔可夫决策问题(MDP)的状态是有限的,则对于,如果我们只改变奖励函数R,最优策略会保持不变。()A.错B.对2【判断题】(10分假设马尔可夫决策问题(MDP)的状态是有限的,若衰减因子满足,则值迭代一定会收敛。()A.对B.错3【判断题】(10分假设马尔可夫决策问题(MDP)的状态是有限的,通过值迭代找到的策略优于通过策略迭代找到的策略。()A.对B.错4【判断题】(10分如果两个MDP之间的唯一差异是衰减因子的值,那么它们一定拥有相同的最优策略。()A.错B.对5【判断题】(10分当在一个MDP中只执行有限数量的步骤时,最优策略是平稳的。平稳的策略是指在给定状态下采取相同操作的策略,与智能体处于该状态的时间无关。()A.对B.错第六章单元测试1【判断题】(10分时序差分算法是一种在线学习的方法。()A.对B.错2【单选题】(15分)F-learning可以看作Q-learning的一种健忘选择,也即Q-learning中的学习率。则F-learning在以下那种情况下收敛于固定的值:()A.具有随机性的状态转移时B.相应的Q-learning收敛时F-learning也会收敛C.具有确定性的状态转移时D.从不3【单选题】(15分)F-learning可以看作Q-learning的一种健忘选择,,也即Q-learning中的学习率。则F-learning在以下那种情况下收敛于最优q值:()A.从不B.具有确定性的状态转移时C.相应的Q-learning收敛时F-learning也会收敛D.具有随机性的状态转移时4【单选题】(15分)F-learning可以看作Q-learning的一种健忘选择,,也即Q-learning中的学习率。则F-learning在以下那种情况下收敛于随机策略的q值:()A.具有确定性的状态转移时B.具有随机性的状态转移时C.相应的Q-learning收敛时F-learning也会收敛D.从不第七章单元测试1.【多选题】(20分)正确答案:CD使用强化学习状态的泛化表示的好处有()。A.复杂的计算获得更精确的表示B.可以采样更多的样本C.可以减少采样D.减少内存的消耗2【单选题】(20分)在强化学习值函数近似中,蒙特卡洛方法对梯度计算是()。A.data-latex="a({G}_{t}({s}_{t})-x({{s}_{t})}^{T}w)*x({s}_{t})B.data-latex="a({G}_{t}({s}_{t})-x({{s}_{t})}^{T}w)*G({s}_{t})Cdata-latex="a({G}_{t}({s}_{t})-G({{s}_{t})}^{T}w)*x({s}_{t})D.data-latex="a({G}_{t}({s}_{t})+x{({s}_{t})}^{T}w)*x({s}_{t})3【单选题】(20分)在强化学习值函数近似中,时间差分方法对梯度计算是()。A.data-latex="a(r+γx({{s}^{'})}^{T}w-x({s)}^{T}w*x(s)B.data-latex="a(r-γx({{s}^{'})}^{T}w-x({s)}^{T}w*x(s)C.data-latex="a(r-γx({{s}^{'})}^{T}w+x({s)}^{T}w)*x(s)D.data-latex="a(r+γx({{s}^{'})}^{T}w+x({s)}^{T}w)*x(s)4【判断题】(20分在强化学习值函数近似中,蒙特卡洛方法中可以使用SARSA和Q-learning进行真值的学习()A.对B.错5【判断题】(20分强化学习中有有模型的方法和无模型的方法()A.错B.对第八章单元测试1【单选题】(10分)随机变量X的概率分布如下图,则x等于()。A.0.1B.0.4C.0.2D.0.55【单选题】(10分)贝叶斯网络中,节点的含义是什么()。A.概率值B.独立性C.随机变量D.变量关系6.【多选题】(10分)正确答案:CD在下面的贝叶斯网络中,正确的选项有()。A.P(cavity,catch,-toothache)=P(cavity)P(catch|-cavity)P(toothache)|cavity)B.P(-cavity,catch,-toothache)=P(-cavity)P(catch)P(-toothache)C.P(cavity,-catch,-toothache)=P(cavity)P(-catch|(cavity)P(-toothache)|cavity)D.P(-cavity,catch,-toothache)=P(-cavity)P(catch|(-cavity)P(-toothache)|-cavity)7【单选题】(10分)在下面的贝叶斯网络中,不给定Cavity和给定Cavity的情况下,Toothache和Catch的独立性分别是()。A.不独立,独立B.独立,独立C.不独立,不独立D.独立,不独立第九章单元测试1.【多选题】(10分)正确答案:AB下面属于精确推理的方法是():A.变量消元法B.枚举推理法C.拒绝采样法D.似然加权法2.【多选题】(10分)正确答案:ABCD特征因子包括哪几种():A.联合分布B.多条件分布C.选定联合分布D.单条件分布3【判断题】(10分似然加权法是重要性采样的特殊情况,可能会生成不符合证据变量的样本()。A.对B.错4【判断题】(10分贝叶斯网络中精确推理的复杂度依赖于网络结构和网络规模()。A.错B.对1【单选题】(10分)对于隐马尔可夫模型(HMM),设其观察值空间为O={o1,o2,…,oN},状态空间为:S={s1,s2,…,sK},
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 施工安全培训
- 【教案】部编语文三上12 总也倒不了的老屋【国家级】一
- 餐饮店员工用工合同的范本
- 中学劳动实践活动课
- 《员工安全教育教案》课件
- 小学四年级数学几百几十数乘以一位数同步考核训练题
- 言语治疗技术课程介绍
- 《央行的中间业务》课件
- 头孢菌素过敏试验法配制皮试液皮试液标准mgml皮试液
- 《品牌形象分析》课件
- Halcon表面划伤检测实例
- 弯矩二次分配法计算器
- 金属材料名称常用基础术语
- 题目 高中数学复习专题讲座数形结合思想
- 交叉作业安全管理规定
- 压裂工程技术及安全环保措施
- 125碘粒子知情同意书
- 英语人称代词-物主代词-名词所有格(共4页)
- 幕墙工程量自动计算结果表格
- 海湾控制器CAN总线联网调试说明(共26页)
- 第四章微量元素地球化学
评论
0/150
提交评论