人工智能-复习点简略-中国矿业大学_第1页
人工智能-复习点简略-中国矿业大学_第2页
人工智能-复习点简略-中国矿业大学_第3页
人工智能-复习点简略-中国矿业大学_第4页
人工智能-复习点简略-中国矿业大学_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章人工智能:人工智能就是用人工的方法在机器(计算机)上实现的智能,或称机器智能、计算机智能。与传统数学方法的根本区别不同于利用知识,知识的表示和使用成为人工智能研究的核心发展1950年图灵测试;麦卡洛克和皮兹1943年建成第一个神经网络模型(MP模型)。1959年美国的塞缪尔(Samuel)设计一个下棋程序;1982年,美国物理学家Hopfield提出了Hopfield神经网格模型,引入了“计算能量”概念,给出了网络稳定性判断。1986年,并行分布处理小组的Rumelhart等研究者提出多层网络的学习算法—BP算法人工智能认知观符号主义(Symbolism)起源:源于数理逻辑/逻辑推理原理:物理符号系统(即符号操作系统)假设和有限合理性原理研究内容:启发式算法、专家系统、知识工程连接主义(Connectionism)起源:源于仿生学,特别是人脑模型的研究原理:神经网络及神经网络间的连接机制与学习算法研究内容:神经网络行为主义(Actionism)起源:源于控制论原理:控制论及感知-动作型控制系统研究内容:智能控制、智能机器人人工智能的研究与应用领域问题求解与博弈-下棋程序,逻辑推理与定理证明,计算智能:涉及神经计算、模糊计算、进化计算、粒群计算、自然计算、免疫计算、人工生命等研究领域。分布式人工智能与Agent:分布式计算与人工智能结合,研究各Agent之间的合作与对话,包括分布式问题求解多和Agent系统。自动程序设计,专家系统,机器学习:使计算机具有智能的根本途径,自然语言理解,机器人学,模式识别,机器视觉,神经网络,智能控制,智能调度与指挥,智能检索,系统与语言工具第二章知识表示方法状态空间法、问题归约法、谓词逻辑法和语义网络法的要点是什么?它们有何本质上的区别状态空间法是一种基于解答空间的问题表示和求解方法,它是以状态和操作符为基础的.在利用状态空间图表示时,从某个初始状态开始,每次加一个操作符,递增地建立起操作符的试验序列,直到达到目标状态为止.由于状态空间法需要扩展过多的节点,容易出现“组合爆炸”,因而只适用于表示比较简单的问题.问题归约法从目标(要解决的问题)出发,逆向推理,通过一系列变换把初始问题变换为子问题集合和子子问题集合,直至最后归约为一个平凡的本原问题集合.这些本原问题的解可以直接得到,从而解决了初始问题,用与或图来有效地说明问题归约法的求解途径.谓词逻辑法采用谓词合适公式和一阶谓词演算把要解决的问题变为一个有待证明的问题,然后采用消解定理和消解反演来证明一个新语句是从已知的正确语句导出的,从而证明这个新语句也是正确的.语义网络是知识的一种图解表示,它由节点和弧线或链线组成.节点用于表示实体、概念和情况等,弧线用于表示节点间的关系.语义网络的解答是一个经过推理和匹配而得到的具有明确结果的新的语义网络.语义网络可用于表示多元关系,扩展后可以表示更复杂问题问题的搜索:正向搜索;状态空间法,问题的求解过程从初始状态开始搜索直到目标状态,解即是构成的算符序列。反向搜索问题归约法,从目标(要解决的问题)出发逆向推理,建立子问题以及子问题的子问题,直到最后把初始问题归约为一个平凡的本原问题集合。状态空间法状态空间法的三要素状态(state):为描述某类不同事物间的差别而引入的一组最少变量q0,q1,…,qn的有序集合,是表示问题解法中每一步问题状况的数据结构。有序集合中每个元素qi(i=0,1,...,n)为集合的分量,称为状态变量。给定每个分量的一组值就得到一个具体的状态。算符(operator):使问题从一种状态变化为另一种状态的手段称为操作符或算符。可为走步、过程、规则、数学算子、运算符号和逻辑符号。状态空间(statespace):是由问题的全部可用状态和算符所构成的集合。它包含三种说明的集合,即三元状态(S,F,G)。S:所有可能的问题初始状态集合;F:操作符集合;G:目标状态集合。例题:有三个传教士M和三个野人C过河,只有一条能装下两个人的船,在河的一方或者船上,如果野人的人数大于传教士的人数,那么传教士就会有危险,你能不能提出一种安全的渡河方法呢?分析:用状态空间法进行表示,步骤如下:定义状态的描述形式用所定义的状态描述形式把问题的所有可能的状态都表示出来,并确定出问题的初始状态集合描述和目标状态集合描述定义一组算符,利用这组算符可把问题由一种状态转变为另一种状态。题解:第一步设Sk=(M,C,B)表示传教士和野人在河左岸的状态。其中:M表示传教士在左岸的人数。C表示野人在左岸的人数。B用来表示船是不是在左岸。(B=1表示在左岸,B=0表示不在左岸)。第二步,用所定义的状态描述形式把问题的所有可能状态都表示出来,并确定出问题当然初始状态集和目标状态集。对于状态Sk=(M,C,B)来说,由于M、C的取值有0,1,2,3四种可能,B的取值有0和1两种可能,所以本问题所有可能的状态公有4X4X2=32种。各状态的形式描述如下:S0=(3,3,1),S1=(3,2,1),S2=(3,1,1),S3=(3,0,1),S4=(3,3,0),S5=(3,2,0),S6=(3,1,0),S7=(3,0,0),S8=(2,3,1),S9=(2,2,1),S10=(2,1,1),S11=(2,0,1),S12=(2,3,0),S13=(2,2,0),S14=(2,1,0),S15=(2,0,0),S16=(1,3,1),S17=(1,2,1),S18=(1,1,1),S19=(1,0,1),S20=(1,3,0),S21=(1,2,0),S22=(1,1,0),S23=(1,0,0),S24=(0,3,1),S25=(0,2,1),S26=(0,1,1),S27=(0,0,1),S28=(0,3,0),S29=(0,2,0),S30=(0,1,0),S31=(0,0,0),在这些状态中,由于有安全约束条件—任何岸边野人的数量都不得超过传教士的数量(即MC),所以只有20个状态而由于这些不合法状态的存在,又会导致某些合法状态是不可到达的。是合法的,这样,这个问题总共只有16种可到达的合法状态。问题的初始状态集:S={S0}={(3,3,1)},目标状态集:G={S31}={(0,0,0)}第三步:定义一组用于状态变换算符F。定义算符R(i,j)表示划船将i个传教士和j个野人送到右岸的操作;L(i,j)表示划船将i个传教士和j个野人送到左岸的操作。由于过河的船每次最多载两个人,所以i+j≤2。这样定义的算符集F中只可能有如下10个算符。F:R(1,0),R(2,0),R(1,1),R(0,1),R(0,2)L(1,0),L(2,0),L(1,1),L(0,1),L(0,2)至此,该问题的状态空间(S,F,G)构造完成。这就完成了对问题的状态空间表示,。为了求解该问题,根据该状态空间的16种可到达合法状态和10种算符,构造它的状态转换图,如下:由上述状态空间图,可见从初始状态(3,3,1)到目标状态(0,0,0)的任何一条通路都是问题的一个解。其中:{R(1,1),L(1,0),R(0,2),L(0,1),R(2,0),L(1,1),R(2,0),L(0,1),R(0,2),L(1,0),R(1,1)}是算符最少的解之一。问题归约四元式试用四元数列结构表示四圆盘梵塔问题,并画出求解该问题的与或图。用问题归约法来求解此问题:将原始问题归约为一个较简单的问题的集合:(1)移动圆盘A、B和C到柱子2的三圆盘难题。(2)移动圆盘D到柱子3的单圆盘难题。(3)移动圆盘A、B和C到柱子3的三圆盘难题。(1)移动圆盘A、B到柱子3的两圆盘难题。(2)移动圆盘C到柱子2的单圆盘难题。(3)移动圆盘A、B到柱子2的两圆盘难题。其子问题由一个包含两个四元数列的表列来描述,问题描述[(1111)=>(3333)]就意味着“把ABC盘从柱子1移到柱子2”。则将上述四圆盘梵塔问题用四元数列结构表示为:谓词逻辑量词:全称量词符号“”,存在量词符号“”连词:合取:符号“∧”,析取:符号“∨”,蕴涵:符号“→”,非:符号“~”/“┑”,双条件:“↔”用谓词逻辑表示下列知识:武汉是一个美丽的城市,但她不是一个沿海城市。如果马亮是男孩,张红是女孩,则马亮比张红长得高。定义谓词如下:BCity(x):x是一个美丽的城市HCity(x):x是一个沿海城市Boy(x):x是男孩Girl(x):x是女孩High(x,y):x比y长得高将个体带入谓词BCity(wuhan),HCity(wuhan),Boy(mal),Girl(zhangh),High(mal,zhangh)根据语义连接谓词BCity(wuhan)∧~HCity(wuhan)(Boy(mal)∧Girl(zhangh))→High(mal,zhangh)人人爱劳动。所有整数不是偶数就是奇数。自然数都是大于零的整数。第一步MAN(x):x是人LOVE(x,y):x爱yN(x):x是自然数;I(x):x是整数;E(x):x是偶数O(x):x是奇数GZ(x):x大于0第二步(无)第三步在一个房间里,有一个机器人Robot,一个壁橱Alcove,一个积木块Box,两个桌子A和B。开始时,Robot在Alcove旁边且两手是空的,A上放着Box,B上是空的。Robot将把Box从A移到B上TABLE(x):x是桌子EMPTYHANDED(x):x双手是空的AT(x,y):x在y旁边ON(w,x):w在x上EMPTYTABLE(x):桌子x上是空的个体词:ROBOT,BOX,ALCOVE,A,B用谓词演算公式表示下列英文句子(多用而不是省用不同谓词和项。例如不要用单一的谓词字母来表示每个句子)。Acomputersystemisintelligentifitcanperformataskwhich,ifperformedbyahuman,requiresintelligence.谓词定义:

P(x,y)means

x

can

perform

y.(x可以执行y)R(x)meansxrequiresintelligence.(x需要智能)C(x)meansxisacomputersystem.(x是个一计算机系统)H(x)

means

x

is

a

human.(x是一个人)

I(x)meansxisintelligent.(x是智能的){(x)(y)(t)[(H(y)∧P(y,t)∧R(t)∧C(x)∧P(x,t)]→I(x)}语义网络“带标识的有向图”有向图的节点代表实体,表示各种事物、概念、情况、属性、状态、事件、动作等;节点还可以是一个语义子网络,形成嵌套结构。有向图的弧代表语义关系,表示它所连结的两个实体之间的语义联系,它必须带有标识。蕴含的表示:通过增加蕴含关系节点来实现。在蕴含关系中,有两条指向蕴含节点的弧,一条代表前提条件(Antecedent),标记为ANTE;另一条代表结论(Consequence),标记为CONSE存在量词的表示:可直接用“ISA”、“AKO”等这样的语义关系来表示。在语义网络中,为了进行节点(结点,node)间节点属性的继承推理,规定了两个约定俗成的链(弧,arc),命名为(AKO)和(ISA),用来标明类与子类、类与个体之间的关系。类属关系Is-a(是一个)、A-member-of(是一员)、A-kind-of(是一种)聚集关系A-part-of(是一部分)属性关系Have(有)、Can(能、会)、Owner(所有者)。推论关系称它们之间是推论关系,可以用Fetch(推出)表示。例如:饥饿推出需要进食相近关系Similar-to(相似)、Near-to(接近)方位关系在上(Located-on),在下(Located-under),在内(Located-inside)、在外(Located-outside)、位于(Located-at)等都可以表示不同事物间的方位关系。时间关系Before(在前)、After(在后)等。构成关系例如:整数由正整数、负整数和零组成。例题用一个语义网络表示下列命题。树和草都是植物;树和草是有根有叶的;水草是草,且长在水中;果树是树,且会结果;苹果树是果树中的一种,它结苹果。第三章确定性推理深度优先搜索首先扩展最新产生的(即最深的)节点,深度相等的节点可以任意排列。扩展最深节点,搜索沿着状态空间某单一路径从起始节点向下进行下去;只有当搜索到达一个没后裔的状态时,考虑另一条替代路径。所以深度优先搜索是不完备的,即使问题有解,它也不一定能求得解宽度优先搜索以接近起始节点的程度依次扩展节点,在对下一层的任一节点进行搜索之前,必须搜索完本层的所有节点。一种高代价搜索,但若有解存在,则必能找到它。优先只要问题有解,用宽度优先搜索总可以得到解,而且得到的是路径最短的解。缺点宽度优先搜索盲目性较大,当目标节点距初始节点较远时将会产生许多无用节点,搜索效率低。必须遍历所有分支,占内存大。有界深度优先搜索状态空间的深度优先搜索引入搜索深度界限,设为dm,当搜索深度达到了深度界限而仍未出现目标节点时,就换一个分支进行搜索。如果问题有解,且其路径长度≤dm,则上述搜索过程一定能求得解。但是,若解的路径长度>dm,则上述搜索过程就得不到解。等代价搜索是宽度优先搜索的一种推广,不是沿着等长度路径断层进行扩展,而是沿着等代价路径断层进行扩展。搜索树中每条连接弧线上的有关代价,表示时间、距离等花费。若所有连接弧线具有相等代价,则简化为宽度优先搜索算法。三种盲目搜索技术的比较主要差别:在于挑选要扩展节点的规则不同宽度优先搜索技术:先扩展出来的节点随后先扩展,OPEN表是队列深度优先搜索技术:后扩展出来的节点随后先扩展,OPEN表是堆栈等代价搜索技术:选取OPEN表中代价最小的节点先扩展,OPEN表是线性表(以局部代价的递增顺序排列)全局优先搜索从OPEN表的所有节点中选择一个估价函数值最小的一个进行扩展。如果取估价函数f(n)=d(n),则它退化为广度优先搜索;广度优先搜索是全局优先搜索的一个特例。如果取估价函数f(n)=g(i),则它是等代价搜索。局部有限搜索仅从刚生成的子节点中选择一个估价函数值最小的一个进行扩展。如果取估价函数f(n)=d(n),则它退化为深度优先搜索;深度优先搜索是局部优先搜索的一个特例。A*算法在图搜索算法中,如第8步的重排OPEN表是利用估价函数f(n)=g(n)+h(n)对OPEN表中的节点进行排序,则该搜索算法为A算法。虽提高了算法效率,但不能保证找到最优解f(n)=g(n)+h(n)其中,f(n)是从初始状态经由状态n到目标状态的代价估计,g(n)是在状态空间中从初始状态到状态n的实际代价,h(n)是从状态n到目标状态的最佳路径的估计代价。启发函数基于规则的系统,均有两种推理方式,正向推理(从事实或状态向目标或动作进行操作),逆向推理(从目标或动作向事实或者状态进行操作)规则演绎系统 产生式系统产生式系统概念:用来描述若干个不同的以基本概念为基础的系统组成:总数据库:又称综合数据库,用于存放求解过程中的各种当前信息的数据结构产生式规则:规则库,用于存放与求解问题有关的某个领域的知识的规则集合及其交换规则控制策略:推理机构,由程序构成,用来控制产生式系统的运行,决定问题求解过程的推理路线,实现问题的求解产生式推理产生式系统的问题求解过程即对解空间的搜索过程,也就是推理过程。按照搜索方向可把产生式系统分为正向推理(事实或数据驱动推理、前向链接推理)、逆向推理(目标驱动推理、逆向链接推理)和双向推理。正向推理:从一组表示事实的谓词或命题出发,使用一组推理规则,来证明目标谓词公式或命题是否成立逆向推理:从表示目标的谓词或命题出发,使用一组规则证明事实谓词或命题成立,即提出一批假设目标,然后逐一验证这些假设。双向推理:同时从表示目标向事实推理和从事实向目标推理,并在推理过程中的某个步骤,实现事实与目标的匹配。产生式与蕴涵式的主要区别:(1)蕴涵式表示的知识只能是精确的,产生式表示的知识可以是不确定的。(2)蕴含式的匹配一定要求是精确的,而产生式的匹配可以是不确定的。产生式与条件语句的主要区别:(1)前件结构不同:产生式的前件可以是一个复杂的结构,而程序设计语言中条件语句的左部是布尔表达式。(2)控制流程不同:产生式系统中满足前提条件的规则被激活后,不一定被立即执行,能否执行将取决于冲突消解策略,而条件语句严格执行。消解原理反证法,将目标公式的否定化为子句集添加到命题公式集中,把消解反演系统应用于联合集,并推导出一个空子句(NIL),得到矛盾,从而定理得证。子句集求解消去蕴涵利用等价关系消去“→”和“↔”,A→B⇔~A∨B、A↔B⇔(A∧B)∨(~A∧~B)减少否定符号辖域双重否定律:~(~A)⇔A;摩根定律:~(A∧B)⇔~A∨~B;~(A∨B)⇔~A∧~B量词转换律:~(∀x)A(x)⇔(∃x)~A(x);~(∃x)A(x)⇔(∀x)~A(x)变量标准化在任一变量辖域内,受该变量约束的变量为哑元,重新命名变元,使不同量词约束的变元有不同的名字,变量改名,保证量词和约束变量的唯一性。消去存在量词消去存在量词时,需要区分以下两种情况:存在量词不出现在全称量词的辖域内,只要用一个新的个体常量替换受该存在量词约束的变元,就可消去该存在量词。例如(x)P(x)化为P(A)。存在量词位于一个或者多个全称量词的辖域内(y)[(x)P(x,y)]化(y)[P(g(y),y)]化为前束式前束形=(前缀)(母式)全称量词串无量词公式化为合取范式A∨(B∧C)⇔(A∨B)∧(A∨C)消去全称量词消去连词符号⋀用{A,B}代替(A∧B)变换变量名称对变元更名,使不同子句中的变元不同名消解反演求解过程否定L,得到~L把~L添加到S中去将集合{~L,S}化为子句集应用消解原理产生矛盾空子句第五章神经计算人工神经元的结构-人工神经网络(artificialneuralnets,ANN)由模拟神经元组成的,处理单元PE(processingelement)为节点,用加权有向弧(链)相互连接而成的有向图。处理单元是对生理神经元的模拟,而有向弧则是轴突-突触-树突对的模拟。有向弧的权值表示两处理单元间相互作用的强弱。神经元单元由多个输入xi,i=1,2,...,n和一个输出y组成。中间状态由输入信号的权和表示,而输出为式中,j为神经元单元的偏置(阈值),wji为连接权系数(激发状态取正值,抑制状态取负值),n为输入信号数目,yj为神经元输出,t为时间,f(_)为输出变换(激发)函数,决定节点(神经元)的输出。最简单的神经元为线性阈值单元,称能通过单个TLU解决的问题为线性可分的。与、或、非等简单逻辑都可通过单个TLU实现。异或问题是一个非线性可分问题,需要用多层感知器-多层神经网络来解决。异或问题的实现其实质就是通过多个神经元互联构成网络,形成多条直线对平面上的点进行分类,从而实现最终目的。神经网络是多个神经元以一定的拓扑结构互连组成的网络,按其结构可分为:递归(反馈)网络:在递归网络中,多个神经元互连以组织一个互连神经网络。前馈网络:具有递阶分层结构,由同层神经元间不存在互连的层级组成。简单遗传算法的遗传操作主要有选择(selection)、交叉(crossover)、变异(mutation)三种。流程结构算法流程图染色体编码00000表示x=0,11111表示x=31。s1=13(01101),s2=24(11000)群体初始化采用生成随机数的方法,对染色体的每一维变量进行初始化赋值。初始化染色体时必须注意染色体是否满足优化问题对有效解的定义。适应值评价通过适应度函数来决定染色体的优劣程度,体现了自然进化中的优胜劣汰原则。适应度函数要有效地反映每一个染色体与问题的最优解染色体之间的差距。评估函数用于评估各个染色体的适应值,进而区分优劣。规定适应值越大的染色体越优。对优化问题,适应度函数就是目标函数。例如,TSP(旅行商问题)的目标是路径总长度为最短,路径总长度可作为TSP问题的适应度函数:选择算子简单遗传算法的遗传操作主要有选择(selection)、交叉(crossover)、变异(mutation)三种。改进的遗传算法大量扩充了遗传操作,以达到更高的效率。选择操作也叫复制(reproduction)操作,根据个体的适应度函数值所度量的优劣程度决定它在下一代是被淘汰还是被遗传。交配算子的简单方式是将被选择出的两个个体P1和P2作为父母个体,将两者的部分码值进行交换。变异算子简单方式是改变数码串的某个位置上的数码二进制编码表示的简单变异操作是将0与1互换:0变异为1,1变异为0伪代码粒群优化算法惯性权重w;加速常数c1和c2求解步骤计算步骤第一步:初始化将族群初始化,以随机的方式求出每一粒子的初始位置与速度。第二步:计算根据适应度函数计算出其适应值以作为判断每一粒子的好坏。找出个体极值点(Pbest)找出每一粒子到目前为止的搜寻过程中最佳解,这个最佳解称为Pbest。找出全局极值点(Gbest)找出所有粒子到目前为止所搜寻到的整体最佳解,此最佳解称为Gbest。第三步:更新速度和位置根据式①与式②更新每一粒子之速度与位置。回到步骤二.继续执行,直到获得一个令人满意的结果或符合终止条件。反向传递(BP)网-有师学习是一种反向传递并修正误差的多层映射网,在参数适当时,能收敛到较小的均方误差,是当前应用最广的一种网络。缺点是训练时间长,易陷入局部极小。BP算法基本原理利用输出后的误差来估计输出层的直接前导层的误差,再用这个误差估计更前一层的误差,如此一层一层的反传下去,就获得了所有其他各层的误差估计。已知网络的输入/输出样本,即导师信号。BP学习算法由正向传播和反向传播组成:正向传播是输入信号从输入层经隐含层,传向输出层,若输出层得到了期望的输出,则学习算法结束;否则,转至反向传播。反向传播是将误差(样本输出与网络输出之差)按原连接通路反向计算,由梯度下降法调整各层节点的权值和阈值,使误差减小。学习的本质:对各连接权值的动态调整BP网络的知识存储在每层的神经元上BP的分类的基本原理在模式识别和分类:动态调整连接权值用一个特定的输出矢量将它与输入矢量联系起来;把输入矢量以所定义的合适方式进行分类第六章专家系统专家系统专家系统是一个含有大量的某个领域专家水平的知识与经验智能计算机程序系统,能够利用人类专家的知识和解决问题的方法来处理该领域问题;专家系统是一种模拟人类专家解决领域问题的计算机程序系统。专家系统具有一些共同的特点和优点专家系统具有下列3个特点:(1)启发性能运用专家的知识与经验进行推理、判断和决策。(2)透明性专家系统能够解释自身推理过程和回答用户问题,能让用户了解推理过程,提高对专家系统的信赖感。(3)灵活性

专家系统能不断地增长知识,修改原有知识,不断更新。专家系统具有下列8个优点:

(1)专家系统能高效率、准确、周到、不知疲倦进行工作。(2)专家系统解决实际问题不受周围环境的影响,也不可能遗漏忘记。(3)推广珍贵和稀缺的专家知识与经验,使专家的专长不受时间和空间的限制。(4)专家系统使领域专家的专业知识和经验得到总结和精炼,能够广泛有力地传播专家的知识、经验和能力。(5)能汇集多领域专家的知识和经验,使他们协作解决重大问题。(6)军事专家系统的水平是一个国家国防现代化的重要标志之一。(7)专家系统的研制和应用,具有巨大的经济效益和社会效益。(8)研究专家系统能够促进整个科学技术的发展。与一般应用程序的区别一般应用程序:把问题求解的知识隐含地编入程序,把知识组织为两级:数据级和程序级专家系统:把其应用领域的问题求解只是单独组成一个实体,即为知识库。将知识组织成三级;数据、知识库、控制。知识存储在知识库。更加准确的说一般应用程序把知识组织成两级:数据级和程序级;大多数专家系统将知识组织成三级:数据、知识库和控制在数据集上是已经解决了的特定问题的说明性知识。以及需要求解问题的有关事件的当前状态。在知识库级是专家系统的专门知识与经验。是否拥有大量知识是专家系统成功与否的关键,因而知识表示就成为专家系统的关键。在控制程序级,根据既定的控制策略和所求解问题的性质来决定应用知识库中的哪些知识。基于规则的专家系统,基于框架的专家系统,基于模型的专家系统工作领域:解释专家系统,预测专家系统,诊断专家系统,设计专家系统,规划专家系统,监视专家系统,控制专家系统,调试专家系统,教学专家系统,修理专家系统组成部分(作用)知识库 1)当前问题有关的数据信息,2)进行推理时要用到的一般知识和领域知识。知识库设计是建立专家系统最重要和最艰巨的任务。综合数据库 用于存储领域或问题的初始数据和推理过程中得到的中间数据,即被处理对象的一些当前事实;推理机用于记忆所采用的规则和控制策略的程序。正向链,逆向链解释器能够向用户解释专家的行为,包括解释推理结论的正确性以及系统输出其他候选解的原因;人机接口是人与计算机之间传递、交换信息的媒介和对话接口,是计算机系统的重要组成部分工作流程用户通过人机界面回答系统的提问,推理机将用户输入的信息与知识库中各个规则的条件进行匹配,并把被匹配规则的结论存放到综合数据库中。最后,专家系统将得出最终结论呈现给用户。创建步骤设计初始知识库:问题初始化、知识概念化、概念形式化、形式规则化、规则合法化原型机(prototype)开发与试验

建立整个系统所需的实验子集,典型知识,相关的简单任务和推理。知识库的改进与归纳

反复改进知识库及推理规则,归纳出更完善的结果。第七章机器学习机器学习的定义,机器学习是一门研究机器模拟人类的学习活动,获取知识和技能的理论和方法,以改善系统性能的学科。学习系统的基本结构:环境:向系统的学习部分提供某些信息学习:利用这些信息修改知识库,以增进系统执行部分完成任务的效能知识库:知识库里存放的是指导执行部分动作的一般原则执行与评价:根据知识库完成任务,同时把获得的信息反馈给学习部分。环境、知识库和执行部分决定了具体的工作内容,学习部分所需要解决的问题完全由上述3部分确定。影响学习系统设计的最重要因素是环境向系统提供的信息,或者更具体地说是信息的质量。知识库是影响学习系统设计的第二个因素。知识在选择表达方式要兼顾表达能力强、易于推理、容易修改知识库、知识表示易于扩展。执行部分是整个学习系统的核心,执行部分的动作是学习部分力求改进的动作。机械学习最简单机器学习方法,机械学习就是记忆,把新知识存储起来,供需要时检索调用,而不需要计算和推理。特点:忽略推理、计算过程,提高效率。机械学习实质上是用存储空间来换取处理时间。不需要推理机。归纳学习(同实例学习,示例学习)-KNN算法应用归纳方法,从足够多的具体事务中归纳出一般知识,提取事务的一般规律从概念的一组正例和反例中归纳出一个一般性的概念描述,使之适合所有正例,排除所有反例。基于实例的学习方法的学习过程只是简单地存储已知的训练数据,当遇到新的查询实例时,一系列相似的实例从存储器中取出,用来分类新的查询实例k-近邻算法(kNearestNeighbors,简称kNN)计算新样本与训练样本之间的距离,找到距离最近的K个邻居,根据这些邻居所属的类别来判定新样本的类别,如果属于同一个类别,那么新样本也属于这个类;否则,对每个候选类别进行评分,按照某种规则确定新样本的类别。算法描述输入:训练数据集D={(Xi,Yi),1≤i≤N},其中Xi是第i个样本的条件属性,Yi是类别,新样本X,距离函数d。输出:X的类别Y。fori=1toNdo计算X和Xi之间的距离d(Xi,X);endfor对距离排序,得到d(X,Xi1),d(X,Xi2),...,d(X,XiN);选择前K个样本:S={(Xi1,Yi1),...,(Xik,Yik)};统计S中每个类别出现的次数,确定X的类别Y。从k个最近邻居中决定分类结果(一定要是奇数)方式1:选出k个最近的邻居中的数量最多的类标号方式2:k个最近邻居分别按距离计算权重,权重最大的类标号获胜。权重可以采用1/(d2+1)来计算,其中d为某个最近邻居到待分类实例的距离。方法一:M的k个近邻中,蓝色有4个,黄色有1个,因此M的分类结果为蓝色方法二:weight(蓝)=1/3+1/2+1/3+1/5=1.367;weight(黄)=1/6=0.167决策树学习-ID3算法-归纳学习决策树的基本组成部分:决策结点、分支和叶子。分类:决策树分类方法采用自顶向下的递归方式,在决策树的内部结点进行属性值的比较并根据不同的属性值判断从该结点向下的分枝,在决策树的叶结点得到结论。决策树分类模型的建立通常分为两个步骤:树的生成→对训练样本进行分组从根结点开始、从上到下的递归过程关键,确定树根节点和分支准则停止生长时机树的剪枝→解决过度拟合问题对树结构进行修剪,删除多余分支预先修剪,限值决策树的充分生长,如:限制树的高度滞后修剪,待决策树充分生长完毕后再进行修剪目标构建一棵内部节点尽可能少、层次尽可能浅、分枝尽可能少,而分类精度尽可能大的树基本算法:自上而下分而治之的方法,开始时,所有的数据都在根节点根据特定的启发式规则选择某一属性对样本数据递归地进行分割结束条件内部结点对应的所有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论