计算机科学引论课件06市公开课一等奖百校联赛优质课金奖名师赛课获奖课件_第1页
计算机科学引论课件06市公开课一等奖百校联赛优质课金奖名师赛课获奖课件_第2页
计算机科学引论课件06市公开课一等奖百校联赛优质课金奖名师赛课获奖课件_第3页
计算机科学引论课件06市公开课一等奖百校联赛优质课金奖名师赛课获奖课件_第4页
计算机科学引论课件06市公开课一等奖百校联赛优质课金奖名师赛课获奖课件_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人工智能计算机科学引论1/499/12/20231MachineStructure智能什么是智能推理、计划、处理问题抽象思维连接复杂观点快速学习、从实践学习

人类拥有这些能力不过使用起来很累科学是由懒惰者推进?!2/499/12/20232MachineStructure人工智能人工智能(AI:ArtificialIntelligence)制造机器来完成需要使用人类智能工作什么样机器才能被认为有智能?图灵测试被测试有一个人,另一个是声称自己有些人类智力机器。测试时,测试人与被测试人是分开,测试人只有经过一些装置(如键盘)向被测试人问一些问题,这些问题随便是什么问题都能够。问过一些问题后,假如测试人能够正确地分出谁是人谁是机器,那机器就没有经过图灵测试,假如测试人没有分出谁是机器谁是人,那这个机器就是有些人类智能。3/499/12/20233MachineStructure人工智能图灵测试全方面经过图灵测试提问者能够提出任何问题尚遥遥无期局部经过图灵测试提问者只能提某个领域问题已经有先例IBMDeepBlue4/499/12/20234MachineStructure人工智能实现人工智能必要条件取得并了解人类感知视、听、触、味、嗅当前能够被输入计算机:视、听当前可被计算机全方面“了解”:没有!只可部分了解有时候被叫做“模式识别”(PatternRecognition)推理传统人工智能技术关注重点5/499/12/20235MachineStructure人工智能了解人类感知了解听觉了解视觉了解自然语言(NL:NaturalLanguage)自然语言是一个特殊“感知”:视听觉只是其传输方式每一个感知被称作一个“媒体”(media)多媒体处理(MultimediaProcessing):综合分析各种媒体内容来对一个素材内容进行了解6/499/12/20236MachineStructure人工智能了解人类感知多媒体处理“处理”主要指提取其语义内容三维渲染、视频剪辑、声音合成等技术通常不叫做“多媒体处理”不过依然可被认为是“多媒体技术”“多媒体处理”中也会用到一些相关技术多媒体素材数学模型语义多媒体处理各种合成技术7/499/12/20237MachineStructure多媒体处理了解声音(audio)声音分类噪声(noise)乐音(music)语音(speech)声音识别检测风声、雨声、读书声……爆炸声较少语音识别(SpeechRecognition)8/499/12/20238MachineStructure多媒体处理了解声音时域(timedomain)声音信号原来面目波形图9/499/12/20239MachineStructure多媒体处理了解声音频域(frequencydomain)声音信号在各个频率能量分布乐音信号:有显著谐波谐波:频率是基准频率整数倍声音分量10/499/12/202310MachineStructure多媒体处理了解声音频域早期声卡:频率合成FM:FrequencyModulation使用不一样加权权重即可取得不一样音色依据乐器音色设置权重即可模拟不一样乐器声音振荡器fx2fx3音阶fx4fxn输出……11/499/12/202311MachineStructure多媒体处理了解声音频域白噪声:在整个频率域强度大致相当12/499/12/202312MachineStructure多媒体处理了解声音频域语音:3.4KHz以下强度大,以上很快衰减13/499/12/202313MachineStructure多媒体处理了解声音第一步:把声音信号变换到频域FFT:FastFouriertransformDFT:DiscreteFouriertransform……第二步:把频率信息变换成特征倒谱(cepstrum):把频域信息再次进行频率变换MFCCLPCC实际计算中这两步经常合并成一步14/499/12/202314MachineStructure多媒体处理了解声音特征(Feature)物理上:能够很好地反应某个特征物理量数学上:一个矢量(FeatureVector)特征提取(FeatureExtraction)从原始信号中计算出所需要特征一旦原始信号被抽象成特征,对感知了解问题就成为一个数学问题把特征矢量转换成语义数学算法:分类15/499/12/202315MachineStructure多媒体处理了解声音分类(classification)把特征矢量转换成语义数学算法例:语音识别把MFCC所组成高维空间分解成不一样部分,每部分代表一个读音。如某个特征矢量落在某部分,则可知道该矢量代表读音。aoptkey16/499/12/202316MachineStructure多媒体处理了解声音分类怎样取得特征空间划分方法?机器学习(MachineLearning)采集一大堆样本,样本与语义对应关系已知。于是,依据这个对应关系就能够知道特征空间中某个区域所对应语义是什么。例:让100个人说“o”,然后对其声音进行变换,发觉其MFCC都落在图中区域,则可知该区域对应“o”。17/499/12/202317MachineStructure多媒体处理了解声音机器学习第一步:取得一个训练集(TrainingSet)特征矢量和所需要语义对应关系第二步:依据训练集训练出对特征空间划分模型(Model)第三步:依据所取得模型对新到特征矢量分类18/499/12/202318MachineStructure多媒体处理了解声音机器学习特征矢量是高维矢量惯用:10-1000维取得训练样本成本很高必须标注样本和语义对应关系,只能由人完成训练集在特征空间分布是非常稀疏19/499/12/202319MachineStructure多媒体处理了解声音机器学习高级建模算法SVM:SupportVectorMachineGMM:GaussianMixtureModelEM:ExpectationMaximumHMM:HiddenMarkovModel人工神经网络:NeuralNetwork矢量量化:VectorQuantization不一样应用需要不一样建模算法当前建模算法依然不够完善20/499/12/202320MachineStructure多媒体处理了解图像基本方法:特征提取训练分类惯用图像特征颜色主要颜色颜色直方图纹理Tamura颜色特征灰度共生矩阵形状傅立叶描述子21/499/12/202321MachineStructure多媒体处理了解图像基本方法:特征提取训练分类不过:一幅图像中可能有多个语义百闻不如一见草花树房子22/499/12/202322MachineStructure多媒体处理了解图像图像分割(segmentation)把图像分割成较小区域准则?语义:还未取得特征:假如分割效果很好,则语义已经取得,分割本身已无意义以特征为准则进行图像分割,其结果只能是特征空间上一致,不可能是语义上一致

分割还是不分割?23/499/12/202323MachineStructure多媒体处理了解图像图像分割支持派:一定要分,不然难以提取适当特征主要处理自然景观等较复杂图像研究复杂分割算法反对派:分割问题和分类问题一样难,所以不进行分割主要处理含单个物体简单图像研究复杂分类算法24/499/12/202324MachineStructure多媒体处理了解图像图像分割怎样结合二者好处?进行分割但不假设分割结果是符合语义,接收按照特征一致性分割结果两步分类首先将特征一致区域分类成低级、在视觉特征上较一致语义合并语义一致区域:SalientObject然后把低级语义分类成高级语义25/499/12/202325MachineStructure多媒体处理了解图像第一步:检测SalientObject把原始图像分割成特征一致区域把区域分类,合并相邻同类区域原始图像分割区域SalientObject26/499/12/202326MachineStructure多媒体处理了解图像第二步:依据图像中SalientObject分类为高级语义两步中都要使用高级建模算法MountainView27/499/12/202327MachineStructure多媒体处理了解视频视频是多个连续图像组成流了解图像技术能够沿用多个图像信息应该叠加提升检测准确率减低检测噪声28/499/12/202328MachineStructure多媒体处理了解视频叠加多帧检测结果可取得非常稳定结果TextFaceHairInsideSkinBlood29/499/12/202329MachineStructure多媒体处理了解文字(自然语言)语义:不一样应用有不一样含义声音、图像、视频:文字(关键字:keyword)即被认为是语义最正确表示当前研究致力于提取能够表示声音、图像、视频等文字文本:文字真实含义才是语义信息提取(IR:InformationRetrieval):时间、地点、人物、事件主题分类(TopicClassification)……30/499/12/202330MachineStructure多媒体处理自然语言处理了解自然语言真实语义汉字:分词(WordSegmentation)把连续字分成以词为单位词性标注(POS:Part-of-Speech)标注各个词为动词、名词……语法分析(SyntaxParsing)标注各个词为主语、谓语宾语……标注句子语法结构准确率普通不高:自然语言本身不是很准确31/499/12/202331MachineStructure多媒体处理自然语言处理统计方法词频:一个词在一个文档中出现次数一些词在不一样文档中出现频率差异很大矢量模型:由关键词词频组成矢量能够表示文本内容,即特征矢量在一些应用取得成功:如主题分类目标含有统计性质怎样实现提取时间、地点、人物、事件等细节特征?目标是一个个体,不含有统计性质WEB分析:假如有很多文档,则这些个体内容很可能被屡次重复,从而含有了统计性质32/499/12/202332MachineStructure多媒体处理了解人类感知特征提取怎样提取好特征?怎样把一个语义检测问题转换成一个数学问题机器学习怎样取得好分类模型怎样处理所转换出数学问题两方面均是现在计算机科学研究热点依然没有好处理方案33/499/12/202333MachineStructure推理了解人类感知给计算机提供了输入实现智能不但要能够输入还要依据输入作出响应推理依据当前出境作出最有利于自己行动规划输出把推理结果付诸实施假如行动规划已经存在,普通输出相对简单34/499/12/202334MachineStructure推理计算机怎样推理学习人推理方法人怎样推理?还未完全处理人大约怎样推理?产生式系统推理数学模型35/499/12/202335MachineStructure推理产生式系统基本原理:把全部可能尝试一次,选出对自己最有利那一次作为输出假设:有一个目标(goal),测试是否到达了目标很轻易“理性”(rational):总是采取对自己最有利36/499/12/202336MachineStructure推理产生式系统基本要素状态(state):系统所处位置目标测试:测试系统是否抵达了所期望目标初始状态:一开始系统所处状态状态空间:从初始状态能够抵达全部状态37/499/12/202337MachineStructure推理产生式系统搜索树搜索解所使用树节点(node)树中一个位置状态,父节点……724568317

4568312724

683157245

8316724568

13不一样概念:同一状态能够在不一样节点38/499/12/202338MachineStructure推理产生式系统展开(expand)把某个节点全部可能后继节点遍历路径从搜索树根到一个节点节点次序算法目标找到一条路径,其第一个节点为初始状态,其最终一个节点状态可经过目标测试39/499/12/202339MachineStructure推理产生式系统搜索策略宽度优先724568317

4568312724

683157245

8316724568

1340/499/12/202340MachineStructure推理产生式系统搜索策略宽度优先(breadth-first)优点:能够找到最短路径在某一层找到解即可终止问题:内存占用量大伴随层数增加指数增加41/499/12/202341MachineStructure推理产生式系统搜索策略深度优先724568317

4568312724

683157245

8316724568

1342/499/12/202342MachineStructure推理产生式系统搜索策略深度优先(depth-first)优点:内存占用量小只需保留最深那条路径问题:计算量大可能遍历到最终才能发觉解43/499/12/202343MachineStructure推理产生式系统搜索策略怎样最快地搜索到解最优节点优先:总是先搜索最有可能抵达解节点怎样知道哪个节点更有可能抵达解?假如准确知道此信息,则问题已经处理!预计一个抵达解成本先搜索成本较小节点最小成本优先(best-first)44/499/12/202344MachineStructure推理产生式系统最小成本优先预计节点成本启发(heuristic)72456831待测试状态目标状态计算对应单元不相同个数启发值=61234678

54

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论