![人工智能应用基础(高职)全套教学课件_第1页](http://file4.renrendoc.com/view12/M07/08/1C/wKhkGWX6dXSAPrXhAAMG-jb2NUE661.jpg)
![人工智能应用基础(高职)全套教学课件_第2页](http://file4.renrendoc.com/view12/M07/08/1C/wKhkGWX6dXSAPrXhAAMG-jb2NUE6612.jpg)
![人工智能应用基础(高职)全套教学课件_第3页](http://file4.renrendoc.com/view12/M07/08/1C/wKhkGWX6dXSAPrXhAAMG-jb2NUE6613.jpg)
![人工智能应用基础(高职)全套教学课件_第4页](http://file4.renrendoc.com/view12/M07/08/1C/wKhkGWX6dXSAPrXhAAMG-jb2NUE6614.jpg)
![人工智能应用基础(高职)全套教学课件_第5页](http://file4.renrendoc.com/view12/M07/08/1C/wKhkGWX6dXSAPrXhAAMG-jb2NUE6615.jpg)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
项目一人工智能:轨道交通智慧之门人工智能应用基础全套可编辑PPT课件项目1人工智能概述项目2机器学习:找出你是谁项目3图像检测:我知道现在有多少人项目4语音处理及应用项目5文本分析你的评论表达你的喜好0102了解人工智能、机器学习、深度学习的关系任务3认识人工智能在轨道交通中的应用任务1认识人工智能目录03任务1认识人工智能PART01人工智能(ArtificialInteligence,Al)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。本项目主要通过学习人工智能发展历史及人工智能在轨道交通中的应用、在Windows环境下载安装Pyhon并下载Python第三方模块包、利用PyCham进行程序编译后,实现简单的人工智能项目开发。通过了解人工智能及其在轨道交通中的应用,学会在Windows系统中安装Python开发环境以及需要的模块,并开发出一个简单的PythonGUI应用。项目一人工智能:轨道交通智慧之门项目一人工智能:轨道交通智慧之门01知识目标了解人工智能的历史。了解人工智能与机器学习的关系。了解人工智能在轨道交通中的应用。02能力目标掌握Windows系统中Python的安装方法。掌握Python中新增模块的安装方法。掌握Python项目的一般结构。03素质目标通过学习人工智能发展历史,激励学生树立学习目标,培养勇于面对挑战及敢于创新的精神。通过学习人工智能与机器学习的关系,培养学生勤于思考、融会贯通的学习习惯.通过学习Python安装方法,培养学生严谨的治学态度及精益求精的工匠精神。任务1认识人工智能人工智能是一个含义很广的术语。在其发展过程中,具有不同学科背景的人工智能学者对它有着不同的理解。综合各种人工智能观点,可以从“能力”和“学科”两方面对人工智能进行定义:任务1认识人工智能从能力的角度看,人工智能是指用人工的方法在机器(如计算机)上实现的智能;从学科的角度看,人工智能是一门研究如何构造智能机器或智能系统,使其能模拟、延伸和扩展人类智能的学科。任务1认识人工智能回顾历史,按照人工智能在不同时期的主要特征可以将其产生和发展过程概括为图1-1所示的几个阶段。任务1认识人工智能亚里士多德(前384一前322):古希腊伟大的哲学家和思想家,创立了演绎法。莱布尼茨(1646-1716):德国数学家和哲学家,把形式逻辑符号化,奠定了数理逻辑的基础。“01诞生期任务1认识人工智能图灵(1912-1954):英国数学家,1936年创立了自动机理论,自动机理论亦称图灵机,是一个理论计算机模型。并于1950年,发表题为《计算机能思维吗?》的著名论文,明确提出了“机器能思维”的观点。“01诞生期任务1认识人工智能什么是图灵测试?任务1认识人工智能什么是图灵测试?图灵测试是测试人在与被测试者(一个人和一台机器)隔开的情况下向被测试者随意提问。问过问题后,如果被测试者超过30%的答复不能使测试人确认出哪个是人、哪个是机器的回答,那么这台机器就通过了测试,并被认为具有人类智能。任务1认识人工智能莫克利(1907-1980):美国数学家、电子数字计算机的先驱,他与埃克特(JPEckert)合作,于1946年研制成功了世界上第一台通用电子计算机ENIAC。维纳(1874-1956):美国著名数学家,控制论创始人,1948年创立了控制论,为人工智能的诞生准备了必要的思想、理论和物质基础条件。“01诞生期任务1认识人工智能“01诞生期在达特茅斯大学举行了一个为期两个月的夏季学术研讨会,来自美国数学、神经学、心理学、信息科学和计算机科学方面的杰出科学家,在一起共同学习和探讨了用机器模拟人类智能的有关问题,并由麦卡锡提议,正式采用了“人工智能(AricalInteligcnce,Al)”这一术语。从此一个以研究如何用机器来模拟人类智能的新兴学科——人工智能诞生了。任务1认识人工智能“02低谷期从197l年到20世纪80年代末这段时间称为人工智能的知识应用期,也有人称为低潮时期。任务1认识人工智能“02低谷期(1)在博弈方面,塞缪尔的下棋程序在与世界冠军对弈时,5局中败了4局。(2)在定理证明方面,鲁滨逊归结法的能力有限,当用归结原理证明“两个连续函数之和还是连续函数”时,推了10万步也没证明出结果。(3)在问题求解方面,由于过去的研究一般针对具有良好结构的问题,而现实世界中的问题多为不良结构,如果用那些方法去处理,将会产生组合爆炸问题。(4)在神经生理学方面,研究发现人脑由101~10个神经元组成,按当时的技术条件,用机器从结构上模拟人脑是根本不可能的,致使人工神经网络的研究落入低潮。任务1认识人工智能“03专家系统期专家系统(ExpertSystem,ES)是一类具有大量专门知识,并能够利用这些知识去解决特定领城中需要由专家才能解决的问题的计算机程序,专家系统实现了人工智能从理论研究走向实际应用、从一般思维规律探讨走向专门知识运用的重大突破,是人工智能发展史上的一次重要转折。任务1认识人工智能“04深度学习期以机器学习和深度学习为引领是这一时期人工智能发展最重要的一个特征。了解人工智能、机器学习、深度学习的关系PART02任务2了解人工智能、机器学习、深度学习的关系机器学习案例:机器翻译,信息抽取,诈骗检测,人脸识别、语音识别等。深度学习案例:图像着色(为黑白照片添加颜色)、自动机器翻译、检测儿童是否发育迟缓等。任务3认识人工智能在轨道交通中的应用PART03任务3认识人工智能在轨道交通中的应用近年我国在轨道交通系统中陆续上线了各类信息化的管理系统,客观上对提高铁路系统内部信息传递,提高系统运作效率起到了显著作用,但同时各类信息系统之间不能连通、信息化孤岛不能贯通,持续引进的先进设备的网络接入和数据融合也显滞后,这些问题客观上阻碍了轨道交通系统进一步通过信息化提高系统效率。而以人工智能为核心的工业互联网技术从构建智能化的感知网络、虚拟化的信息硬件资源、平台化的业务和数据中台以及基于中台的轻量化的各类业务应用等,实现了整个轨道交通系统运行的“操作系统”。任务3认识人工智能在轨道交通中的应用人工智能技术在乘客服务中的应用人工智能技术在智慧车站中的应用学习与思考PART041.查阅相关文献资料,简述人工智能有什么应用价值。2.说明人工智能有哪些研究领域。学习与思考携手共进共创辉煌努力成就梦想!项目二机器学习:找出你是谁人工智能应用基础0102任务2理解分类问题任务3理解特征与标记任务1认识图像的表示目录03任务4认识分类器04任务5了解迭代学习05任务6项目开发人脸识别:我知道你是谁06人脸识别在安防领域的应用已经很多了,警方能够通过捕捉摄像头中的影像来确认谁是犯罪嫌疑人;系统能从海量级的人物照片库中找到被通缉人员。这些功能都可以通过人脸识别技术实现。基于人脸识别和大数据分析,可以从海量数据中根据目标人物的特征信息,如性别、年龄范围、着装颜色等,通过人脸比对分析确定嫌疑人身份。本项目我们来学习该案例中蕴藏的机器分类技术。通过使用现有机器学习框架模块,实现对人脸图片的分类,判断图片中是谁。项目二机器学习:找出你是谁项目一人工智能:轨道交通智慧之门01知识目标02能力目标03素质目标任务1认识人工智能任务1认识图像的表示计算机是怎么表示彩色图像的?任务1认识图像的表示在计算机里,对于彩色图像用红(R)、绿(G)、蓝(B)三基色来表示,用红(R)、绿(G)、蓝(B)三个数字来表示一个颜色,每个基本颜色的值为0-255,数值的大小表示这个颜色分量的明暗程度,数值越大,表示该基本颜色的比例越大。任务1认识图像的表示通过不同比例的调和,会呈现出我们人眼所能看到的任何颜色。任务1认识图像的表示任务1认识图像的表示(255,0,0)表示纯红色;任务1认识图像的表示(0,255,0)表示纯绿色;任务1认识图像的表示(0,0,255)表示纯蓝色;任务1认识图像的表示白色怎么表示?黑色怎么表示?灰色怎么表示?(255,255,255)(0,0,0)(100,100,100)任务1认识图像的表示一幅图像是由一个个小格子组成的,每个小格子是一个色块。如果用不同的数字表示不同的颜色,图像就可以表示成一个由数字组成的矩形阵列,称为矩阵,这样图像就会存储在计算机中。这里的小格子称为像素,格子的行数和列数统称为分辨率。反过来,如果给出一个数字组成的矩阵,将矩阵中的每个数值转换为对应的颜色,并在计算机屏幕上显示出来,就可以重现这幅图像。任务1认识图像的表示任务1认识图像的表示用三种颜色的不同比例(数字)就可以表示很多种颜色,可见,一张彩色图像就可以用三张由数字组成的阵列来表示,如图2-7所示,这些数字阵列称为三阶张量。三阶张量的长度和宽度为图像的分辨率,高度为3,即彩色图像有3个通道,灰度图像只有一个通道。任务2理解分类问题任务2理解分类问题分类就是在样本集中,通过已知样本的特征和属性,将样本划分到已有的类别中。也就是说,这些类别是已知的,通过对已知样本数据进行训练和学习,找到能区分数据类别的特征,再通过这些特征对待分类数据进行分类。子任务1了解分类原理子任务2掌握图像分类步骤及应用任务2理解分类问题子任务1了解分类原理图像分类是以图像的像素关联信息为基础,通过计算机获取图像的特征之后进行归纳,然后分类识别的过程。图像分类问题的原理是根据已经带有类别标签的图像数据集,对待分类图像进行归类,从已有类别集合中得到待分类图像标签,最终确定待分类图像归属类别的过程。任务2理解分类问题子任务1了解分类原理如图2-8所示,将水果图片进行分类,利用计算机从类别标签集合中找到水果对应的类别。该过程看起来比较简单,是因为人类的视觉系统能直接将眼睛获得的图像信息进行语义的转化。任务2理解分类问题子任务1了解分类原理但对于计算机来说,却是计算机视觉领城研究的关键问题之一,计算机视觉领域中的目标检测、图像分割、动态跟踪、人体分析、人脸识别等高层视觉分析都是以图像分类操作为基础。机器学习中图像分类通常采用基于数据驱动的方法。该方法的原理是从计算机读入大量数据,然后让计算机学习数据的属性,最终学到每一类的特征。任务2理解分类问题子任务2掌握图像分类步骤及应用图像分类是分类问题的一个分支,一般包含三个步骤:①输人数据:向分类模型输入包含N个图像的集合,其中每个图像的标签是K种分类标签中的一种。这个集合称为训练集。②学习过程:使用训练集来学习每个类的特征。也称该过程为训练分类器模型。任务2理解分类问题子任务2掌握图像分类步骤及应用③评价过程:利用训练好的分类器来预测它未曾见过的图像数据集(也称为测试集)的分类标签,并以此来评价分类器的质量。如果预测的图像标签的正确率达到一定的标准,就认为这个分类模型训练成功,否则将进行步骤②继续学习,直到达到评价标准为止。任务3理解特征与标记任务3理解特征与标记特征是一事物异于其他事物的特点。通常我们通过物体的特征来区分物体的类别,这是最有效的方式。如图2-8中的4张图片,设想一下,采用什么样的特征可以更好地区分它们呢?任务3理解特征与标记如果用“是否为圆形”作为一个特征,可以区分香蕉和梨,也可以区分草莓和苹果;如果再用“是否为红色”作为第二个特征,就可以区分是草莓或苹果还是香蕉和梨,如表2-1所示,这样就可以准确地区分这四张图片所属的类别了。任务3理解特征与标记对于人类而言,只要看一次照片,这些特征就会被大脑获取,“红色”+“圆形”特征的图片就是苹果。但对于计算机而言,一幅图片就是以某种特定格式存储在存储器的一串数据。让计算机通过相关的一系列的计算,从这些数据中提取“是否为圆形”这样的特征是非常困难的事情。任务3理解特征与标记图像的分类问题最终会回答哪一幅图像属于哪一个类别,也就是说,每个图像都有自己所属的类别,这个类别就是标记,也称为标签。如表2-1中的苹果、梨、香蕉等称为标记。训练分类模型所采用的训练数据集是带有标记的,而这个数据集需要人工标记。只有带有标记的训练集才能被分类模型所学习,才能使用学到的“知识”判断测试图像类别。任务3理解特征与标记数据标记需要标记员借助某种标注工具,例如,使用labelme、labelmg图像标注工具,对输入分类模型的训练数据集进行标注,该过程的主要作用是为训练数据集提供类别标签。数据标注成为当下大多数人工智能算法得以高效运行的关键环节,数据标注的量越大,算法的性能越好。任务4认识分类器任务4认识分类器携手共进共创辉煌努力成就梦想!项目三
图像检测:我知道现在有多少人任务1图像特征的提取任务2深度神经网络的前世今生任务3深度神经网络提取特征与分类任务4(拓展)图像中的目标检测任务5项目开发:指定物品的检测任务1图像特征的提取子任务1图像的特征如果用“是否有翅膀”作为一个特征,可以区分企鹅和狼,也可以区分飞机和汽车;如果再用“是否有眼睛”作为第二个特征,就可以区分是企鹅或狼还是飞机或者汽车,如下表1所示,这样我们就可以准确地区分这四张照片了。
企鹅野狼飞机汽车1特征是否有翅膀是否是否2特征是否有眼睛是是否否任务1图像特征的提取子任务1图像的特征如何从图像中提取如上所述的两个特征呢?在计算机视觉领域发展初期,人们手工设计了各种图像特征,包括图像的颜色、边缘、纹理等性质,能解决物体识别和物体检测等实际问题。那么,“相关的一系列计算”是如何进行的呢?任务1图像特征的提取子任务2卷积运算一.向量的卷积两个向量卷积的计算过程任务1图像特征的提取子任务2卷积运算二.矩阵的卷积两个矩阵的卷积任务1图像特征的提取子任务2卷积运算二.矩阵的卷积两个矩阵的卷积矩阵进行卷积运算时,需要沿着纵向和横向两个方向进行滑动任务1图像特征的提取子任务2卷积运算三.三阶张量的卷积任务1图像特征的提取子任务3利用卷积提取图像特征图像被表示为一个整数的图像矩阵。如果用一个较小的矩阵和这个图像矩阵做卷积运算,得到一个新的矩阵,这个新矩阵表示了一幅新的图像,这幅新的图像比原图像更清楚地表示了某些性质,把它当作原图像的一个特征任务2深度神经网络的前世今生人工设计的图像特征到深度神经网络ImageNet挑战赛是计算机视觉领域的世界级竞赛在计算机视觉的各个领域深度神经网络学习的特征也逐渐代替了手工设计的特征,人工智能也变得更加“智能”。任务2深度神经网络的前世今生深度神经网络与传统模式区别和联系任务3深度神经网络提取特征与分类子任务1深度神经网络的结构深度神经网络经过“相关的一系列计算”,解决了“是否有翅膀”和“是否有眼睛”这样高层次的抽象概念,获取了图像的特征,深度神经网络在图像分类中得到了广泛的应用,下面我们一步一步学习它任务3深度神经网络提取特征与分类子任务1深度神经网络的结构一.卷积层卷积层的作用卷积层提取图像特征的过程任务3深度神经网络提取特征与分类子任务1深度神经网络的结构二.全连接层经过通道输出的特征图再转换成特征向量,如果再需要对这个特征向量进行变换,担负这个转换任务的便是全连接层。任务3深度神经网络提取特征与分类子任务1深度神经网络的结构三.归一化指数层通常分类网络的最后一层就是归一化指数层,它以一个长度和类别个数相等的特征向量作为输入,然后输出图像属于各个类别的概率。任务3深度神经网络提取特征与分类子任务1深度神经网络的结构四.非线性激活层在每个卷积层和全连接层的后面增加一个非线性激活层,这样,每次变换的效果就得到保留非线性激活层如果以整流函数构成,则称为ReLU层任务3深度神经网络提取特征与分类子任务1深度神经网络的结构五.池化层池化层,降低特征图的分辨率.任务3深度神经网络提取特征与分类子任务1深度神经网络的结构五.池化层池化层的工作过程:经过池化后,特征图的长和宽都减少到原来的1/2,特征图中的元素数目减少到原来的1/4。任务3深度神经网络提取特征与分类子任务2深度神经网络的训练反向传播算法:是训练深度神经网络最有效的手段之一任务4(拓展)图像中的目标检测一.YOLO算法的概念YOLO算法,其全称是YouOnlyLookOnce:Unified,Real-TimeObjectDetection,其中YouOnlyLookOnce说的是只需要一次CNN运算;Unified指的是这是一个统一的框架,提供一个端到端方法的预测;而Real-Time体现是YOLO算法速度快,每秒可处理45帧。任务4(拓展)图像中的目标检测二.YOLO算法的运作(一)用YOLO检测给定图像中对象的处理步骤1.输入图像任务4(拓展)图像中的目标检测二.YOLO算法的运作(一)用YOLO检测给定图像中对象的处理步骤2.将输入图像划分为网格形式任务4(拓展)图像中的目标检测二.YOLO算法的运作(一)用YOLO检测给定图像中对象的处理步骤3.对每个网格应用图像分类和定位处理,获得预测对象的边界框及其对应的类别概率。任务4(拓展)图像中的目标检测二.YOLO算法的运作(二)对处理步骤的进一步详解1.建立标记数据例1例2例3任务4(拓展)图像中的目标检测二.YOLO算法的运作(二)对处理步骤的进一步详解2.将标记数据传递给模型进行训练例4:1)输入图像:100X100X32)使用经典的CNN网络构建模型,并进行模型训练3)在测试阶段,将图像传递给模型,经过一次前向传播就得到输出y任务4(拓展)图像中的目标检测二.YOLO算法的运作(二)对处理步骤的进一步详解3.确定边界框的值任务4(拓展)图像中的目标检测二.YOLO算法的运作(二)对处理步骤的进一步详解4.非极大值抑制例5任务4(拓展)图像中的目标检测三.识别单个网格中的多个对象-AnchorBoxes(锚框)任务4(拓展)图像中的目标检测三.识别单个网格中的多个对象-AnchorBoxes(锚框)(一)使用锚框(AnchorBoxes)任务4(拓展)图像中的目标检测三.识别单个网格中的多个对象-AnchorBoxes(锚框)(二)训练YOLO模型及预测1.训练任务4(拓展)图像中的目标检测三.识别单个网格中的多个对象-AnchorBoxes(锚框)(二)训练YOLO模型及预测2.测试对于每个网格,模型将预测3X3X16大小的输出。该预测中的16个值将与训练标签的格式相同。前8个值将对应于AnchorBoxes1,其中第一个值将是该网络中对象的概率,2-5的值将是该对象的边界框坐标,最后三个值表明对象属于哪个类。以此类推。最后,非极大值抑制方法将应用于预测框以获得每个对象的单个预测结果。任务4(拓展)图像中的目标检测三.识别单个网格中的多个对象-AnchorBoxes(锚框)(二)训练YOLO模型及预测3.YOLO算法遵循的确切维度和步骤1)准备对应的图像(608,608,3)。2)将图像传递给深度神经网络(CNN),该网络返回(19,19,5,85)维输出。3)输出的最后两个维度被展平以获得(19,19,425)的输出量。19×19网格的每个单元返回425个数字。425=5*85,其中5是每个网格的锚框数量。85=5+80,其中5表示(pc、bx、by、bh、bw),80是检测的类别数。4)最后,使用IoU和非极大值抑制去除重叠框。以上就是YOLO算法的基本内容。任务5项目开发:指定物品的检测一.注册百度AI开放平台,创建一个应用1.访问/
点击开放能力-->人脸与人体识别-->人流量统计任务5项目开发:指定物品的检测一.注册百度AI开放平台,创建一个应用2.点击立即使用,注册一个百度AI账号任务5项目开发:指定物品的检测一.注册百度AI开放平台,创建一个应用2.点击立即使用,注册一个百度AI账号任务5项目开发:指定物品的检测一.注册百度AI开放平台,创建一个应用3.创建一个用于统计人流量的应用,并且获取AppID、APIKey和SecretKey。点击人体分析-->创建应用。任务5项目开发:指定物品的检测一.注册百度AI开放平台,创建一个应用4.填写信息,选择【个人】,点击【立即创建】任务5项目开发:指定物品的检测一.注册百度AI开放平台,创建一个应用5.创建完成后点击【管理应用】,进入应用详情页面就可看到AppID、APIKey和SecretKey,任务5项目开发:指定物品的检测二.使用百度API对一张图片进行人流量检测1.新建一个Python文件,将person_num.py中的代码写到其中。person_num.py:#person_num.pyimportrequestsimportbase64
'''统计一张图片中的人流量'''AppID='填写自己的AppID'API_Key='填写自己的APIKey'Secret_Key='填写自己的SecretKey'任务5项目开发:指定物品的检测二.使用百度API对一张图片进行人流量检测2.将自己创建的应用的AppID、APIKey和SecretKey。填写入代码中,并且填写图片的路径。任务5项目开发:指定物品的检测三.使用GUI开发人流量检测界面1.创建一个文件夹,新建两个Python文件,GUIcontrol.py和GUIstatistical.py任务5项目开发:指定物品的检测三.使用GUI开发人流量检测界面2.GUIstatistical.py作用:生成GUI界面的组件、布局等GUIstatistical.py:#-*-coding:utf-8-*-
#Formimplementationgeneratedfromreadinguifile'PeopleNum.ui'##Createdby:PyQt5UIcodegenerator5.13.0##WARNING!Allchangesmadeinthisfilewillbelost!任务5项目开发:指定物品的检测三.使用GUI开发人流量检测界面3.GUIcontrol.py作用:实现上传文件、展示图片和统计图片中的人流量等功能GUIcontrol.py:importsysfromPyQt5.QtWidgetsimportQApplication,QMainWindow,QFileDialogfromPyQt5.QtGuiimport*fromGUIstatisticalimportUi_MainWindowimportrequestsimportbase64
classMainWindow(QMainWindow,Ui_MainWindow):任务5项目开发:指定物品的检测三.使用GUI开发人流量检测界面4.运行GUIcontrol.py,打开GUI界面任务5项目开发:指定物品的检测三.使用GUI开发人流量检测界面5.点击【上传图片】选择一张图片,图片格式为.jpg或.png。选择后GUI界面会显示图片任务5项目开发:指定物品的检测三.使用GUI开发人流量检测界面5.点击【上传图片】选择一张图片,图片格式为.jpg或.png。选择后GUI界面会显示图片任务5项目开发:指定物品的检测三.使用GUI开发人流量检测界面6.上传完图片后点击【检测图片】,检测完成后文本框会返回信息:检测到图片中人数为:N人恭喜你!已完成本项目学习任务。《人工智能应用基础》
项目四语音识别:实时记录员任务描述
张先生您好:请问需要什么帮助?文字转语音
录音北京明天的天气怎么样?识别北京明天是晴天,最高气温28度,适合郊游。合成问答播放
理解语音的预处理理解语音的特征提取学习目标重难点重点:(1)语音识别的概念及应用(2)语音合成的概念及应用(3)语音处理实践难点:(1)语音处理的概念(2)语音的特征提取1.了解语音识别技术的发展理解语音识别的概念及一般流程5.能进行语音合成应用语音处理技术应用框架4.1语音处理的概念4.2语音识别及应用4.3语音合成及应用4.1语音处理的概念4.1.1语音处理的概念
语音处理(speechsignalprocessing)是研究语音发声过程、语音信号的统计特性、语音的自动识别、机器合成以及语音感知等各种处理技术的总称。
由于现代的进音处理技术都以数字计算为基础,并借助微处理器、信号处理器或通用计算机加以实现,因此也称数字语音信号处理。4.1语音处理的概念4.1.1语音处理的概念
语音处理主要包括语音识别、语音合成两个部分。
语音识别,是把语音转化为文字,并对其进行识别、认知和处理。
语音合成,是指通过机械的、电子的方法产生人造语音的技术。
一个完整的语音处理系统,包括前端的信号处理、中间的语音语义识别和对话管理以及后期的语音合成。语音处理中的主要技术点包括:前端处理:说话人声检测,回声消除,唤醒词识别,麦克风阵列处理,语音增强等。语音识别:特征提取,模型自适应,声学模型,语言模型,动态解码等。语义识别和对话管理:更多属于自然语言处理的范畴。语音合成:文本分析、语言学分析、音长估算、发音参数估计等4.1语音处理的概念语音识别语义理解对话管理语音唤醒声纹识别4.1.2语音处理的流程小兔你好大白你好语音合成4.1语音处理的概念4.1.2语音处理的流程语音识别过程
语音合成过程4.1语音处理的概念4.2语音识别及应用4.3语音合成及应用4.2语音识别4.2.1语音识别的概念输入语音
语音前处理有效语言检测接口层特征提取语音识别声学模型语言模型识别结果文本训练集数据清洗和正规化模型训练和优化语言模型训练数据预处理语音训练集声学模型训练4.2语音识别4.2.1语音识别的概述百度语音识别技术每年迭代算法模型/article/201611/245559.html4.2语音识别4.2.1语音识别的概述Google的语音合成系统WaveNet:示意图/p/8599090/4.2语音识别4.2.2语音识别的应用:过程4.2语音识别4.2.2语音识别的应用:输入语音语音编码语音质量16K16bit、8K16bit、Speex压缩避免丢音、截幅、音量过小等理想音频丢音截幅音量过低4.2语音识别4.2.2语音识别的应用:声学匹配声学一致性:待识别语音和训练语音具有一致性声学模型训练数据预处理(NoiseRobust)语音训练集声学模型远场近场设备降噪用户口音4.2语音识别4.2.2语音识别的应用:文匹配本文本一致性:待识别领域和训练文本具有一致性语言模型语言模型训练数据清洗和正规化模型训练和优化文本训练集领域数据核心词汇“请问岳父怎么样?”“请问月付怎么样?”4.2语音识别4.2.2语音识别的应用:迭代优化输入语音
语音前处理有效语言检测接口层特征提取语音识别声学模型语言模型识别结果文本训练集数据清洗和正规化模型训练和优化语言模型训练数据预处理语音训练集声学模型训练4.2语音识别4.2.2语音识别的应用:应用场景社交聊天社交聊天发送实时语音,支持中文,英文识别,方言支持粤语,四川话。让沟通交流更加准确合作案例:游戏娱乐语音聊天转文字,让用户在操作的同时也可看到聊天内容合作案例:语音输入法摆脱生僻字和拼音障碍,将所输入文字,直接用语音的方式输入,让输入法更加便捷合作案例:
语音搜索搜索内容直接以语音的方式输入,让搜索更加高效合作案例:4.2语音识别4.2.2语音识别的应用:唤醒词“小度小度”“有什么可以帮您”语音识别(ASR)Service语义理解(NLP)识别文本语音唤醒(Wakeup)4.2语音识别4.2.2语音识别的应用:唤醒词特征提取关键词识别声学模型库>阈值?得分接受拒绝错误拒绝率(FRR)错误接受率(FAR)功耗4.2语音识别4.2.2语音识别的应用:唤醒词唤醒词环境设备简单易记日常少用易于唤醒(百度语音云,上传唤醒词评估)远场近场背景噪声声学信息功耗设计4.2语音识别4.2.2语音识别的应用:声纹识别“小度小度,给我来首歌”“马上播放小兔子乖乖”语音识别(ASR)Service语义理解(NLP)识别文本语音唤醒(Wakeup)声纹确认(VoicePrint)4.1语音处理的概念4.2语音识别及应用4.3语音合成及应用4.3语音合成及应用语音识别语义理解对话管理语音合成语音唤醒声纹识别小兔你好大白你也好4.3.1语音合成的概念4.3语音合成及应用4.3.1语音合成的概念文本分析(文本正则、分词、词性标注、注音)韵律停顿预测声学参数预测单元选择声码器在线合成(拼接)离线合成(参数)音库4.3语音合成及应用4.3.2语音合成的应用:出行功能:通过语音指令,解放双手,进行语音的识别,听懂车主用户是需求。案例:途胜响应高频需求5.3语音合成及应用4.3.2语音合成的应用:酒店功能:运用语音识别,通过语音交互,进行酒店预订服务。案例:说出酒店需求,去哪儿即可调取信息4.3语音合成及应用4.3.2语音合成的应用:智能家居功能:通过语音“说出”用户的需求,智能家居就能识别,执行。案例:智能电视系统,直接根据语音操作4.3语音合成及应用4.3.2语音合成的应用:娱乐功能:通过语音识别,调动视频应用的程序,进行操作。案例:爱奇艺搜索系统合作用户App语音输入App调用搜索云端接口SDK把文本传给AppApp调用百度SDK搜索云服务用户意图判断图谱服务搜索服务云服务返回结果给AppApp进行展现4.3语音合成及应用4.3.2语音合成的应用:机器人功能:机器人的语音合成交互形式,与用户对话,响应用户需求。案例:度秘机器人应用,解说体育赛事4.3语音合成及应用4.3.2语音合成的应用:手机助手功能:通过语音唤醒,一声指令,即可让应用进入工作状态。案例:手机厂商集成语音智能服务,高速响应4.3语音合成及应用4.3.2语音合成的应用:文化功能:通过语音合成,文字转换成语音。案例:读者农家数字书屋项目,解放双手,用耳朵获取知识4.3语音合成及应用4.3.2语音合成的应用:机器人功能:机器人的语音合成交互形式,与用户对话,响应用户需求。案例:度秘机器人应用,解说体育赛事
4.4提取语音特征功能:机器人的语音合成交互形式,与用户对话,响应用户需求。案例:度秘机器人应用,解说体育赛事任务描述
张先生您好:请问需要什么帮助?文字转语音张先生您好:请问需要什么帮助?文字转语音《人工智能应用基础》
项目五:你的评论表达你的喜好任务描述
☆
文本情感分析输入一段客户评价文字,对文字进行分析,了解客户满意度知识目标素质目标(1)培养学生吃苦耐劳的品质(2)培养学生团队协作、互相帮助的精神(3)提高学生全面、系统考虑问题的意识。1.了解文本分析的基本流程了解分词、词向量的概念和作用理解文本分类的应用能力目标认识中文分词的过程掌握词向量的表示方法掌握使用深度学习进行文本分类的方法5.1了解中文分词
5.2理解文本表示5.3了解文本分类模型5.4应用5.1了解中文分词为什么需要中文分词?自然语言人工语言人类社会约定俗成程序设计语言/机器语言汉语,英语等C++,Java,Python等简洁长度和规则上都会有一定的冗余含糊、歧义无二义性如果李春来到了无锡,我请他吃饭。5.1了解中文分词分词:WordSegmentation在自然语言处理中,英文文本具有天然的空格作为区分,但是中文没有明显的分隔符,因此需要对中文进行分词。单词是语义的基本单位,句子和文档都由大量单词构成。中文分词指将中文语句切分成一个个单独的词语。即将连续的自然语言文本,切分成具有语义合理性和完整性的词汇序列。5.1了解中文分词分词:WordSegmentation5.1了解中文分词常用的分词工具现有的分词方法可分为三大类:基于字符串匹配的分词方法;基于理解的分词方法;基于统计的分词方法。5.1了解中文分词常用的分词工具jieba分词:支持三种模式:(1)精确模式:试图将句子最精确地切开,适合文本分析;(2)全模式:把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义;(3)搜索引擎模式:在精确模式
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年秋八年级历史上册 第五单元 从国共合作到国共对峙 第17课 中国工农红军长征说课稿 新人教版
- 12古诗三首 题临安邸 说课稿-2024-2025学年语文五年级上册统编版
- 2023七年级英语下册 Module 3 Making plans Unit 2 We're going to cheer the players第4课时说课稿 (新版)外研版
- 18《童年的水墨画》(说课稿)2023-2024学年统编版语文三年级下册
- 10我们不乱扔 说课稿-2024-2025学年道德与法治二年级上册统编版001
- 2025个人果树承包租赁合同范本提供3篇
- 计算机系统配套零、部件项目融资渠道探索
- 水景喷泉照明设计合同(2篇)
- 法院离婚协议书(2篇)
- 2024-2025年高中语文 第1单元 2 北大是我美丽羞涩的梦说课稿 粤教版必修1
- 老年上消化道出血急诊诊疗专家共识2024
- 广东省广州黄埔区2023-2024学年八年级上学期期末物理试卷(含答案)
- 医院护理10s管理
- 人教版一年级下册数学第五单元认识人民币练习
- 学校安全工作计划及行事历
- 《GMP基础知识培训》课件
- 2025届江苏省无锡市天一中学高一上数学期末质量检测试题含解析
- 数学家华罗庚课件
- 贵州茅台酒股份有限公司招聘笔试题库2024
- 《纳米技术简介》课件
- 血液透析高钾血症的护理查房
评论
0/150
提交评论