《深度学习技术应用》课件全套 项目1-6 TensorFlow实现服装图像分类 - 使用VGG19迁移学习实现图像风格迁移_第1页
《深度学习技术应用》课件全套 项目1-6 TensorFlow实现服装图像分类 - 使用VGG19迁移学习实现图像风格迁移_第2页
《深度学习技术应用》课件全套 项目1-6 TensorFlow实现服装图像分类 - 使用VGG19迁移学习实现图像风格迁移_第3页
《深度学习技术应用》课件全套 项目1-6 TensorFlow实现服装图像分类 - 使用VGG19迁移学习实现图像风格迁移_第4页
《深度学习技术应用》课件全套 项目1-6 TensorFlow实现服装图像分类 - 使用VGG19迁移学习实现图像风格迁移_第5页
已阅读5页,还剩823页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

项目一TensorFlow实现服装图像分类深度学习应用技术项目引导案例

目前在国内各大电商购物平台,实质是以文搜图。该技术要求事先对服装图像进行分类,打标签。随着数量的爆发式增长,该方法的缺点越来越显著。耗费时间、精力、成本信息表达不全,检索效果不佳

基于文本标注的传统方法渐显疲态,而基于图像内容的新方法方兴未艾。通过对图像进行特征提取,获得其特征表示,然后进行相似性度量,并依据相似性进行排序,从而得到检索结果。

目前,图像特征提取方法可分为基于传统图像处理和基于深度学习两种方式。项目引导案例Tensorflow基础操作01介绍Tensorflow以及一些深度学习的基本知识和代码操作服装图像分类02基于服装图像数据,进行最基础的分类模型的训练KerasTuner超参数调节03使用超参数调节的方法来进行模型训练思考一下对于如此海量的服装图像数据该如何分类呢?项目引导案例TensorFlow基础操作任务一职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务一TensorFlow基础操作了解Tensorflow的内涵、名字含义、框架;了解Tensorflow的核心概念,常量、变量、张量、计算图和会话等;了解Tensorflow优势、缺点以及主流框架的对比。能够了解开源框架TensorFlow;能够掌握在TensorFlow中张量运算的方法;能够掌握TensorFlow中数据类型转换方法。职业能力目标01知识目标技能目标职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务一TensorFlow基础操作

了解TensorFlow的基本知识,进行代码操作练习。任务描述任务要求安装TensorFlow;创建TensorFlow中的常量与变量;实现TensorFlow中的数据类型转换;完成包括加法、平方和压缩求和在内的张量运算。任务描述与要求02职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务一TensorFlow基础操作任务分析如何实现Tensorflow的安装、环境配置?Tensorflow如何进行运算操作,常见的有哪些?任务分析与计划03任务计划表通过上面的思考,你是否对本任务要完成的工作有所了解?让我们一起来制订完成本次任务的实施计划吧!任务分析与计划03项目名称TensorFlow实现服装图像分类任务名称TensorFlow基础操作计划方式自主设计计划要求请用8个计划步骤来完整描述出如何完成本次任务序号任务计划1

2

3

4

5

6

7

8职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务一TensorFlow基础操作TensorFlow核心概念204知识储备TensorFlow基本介绍1TensorFlow特点3TensorFlow的内涵04①TensorFlow™是一个开放源代码软件库,用于进行高性能数值计算。借助其灵活的架构,用户可以轻松地将计算工作部署到多种平台(CPU、GPU、TPU)和设备(桌面设备、服务器集群、移动设备、边缘设备等)。②TensorFlow™最初是由GoogleBrain团队(隶属于Google的AI部门)中的研究人员和工程师开发的,可为机器学习和深度学习提供强力支持。TensorFlowFlow为“流”,即张量之间通过计算而转换的过程TensorFlowTensorFlow名字的含义04Tensor为“张量”,即多维组数的数据结构TensorFlow是一个通过计算图的形式表述计算的编程系统,每一个计算都是计算图上的一个节点,节点之间的边描述了计算之间的关系。+=TensorFlow基本架构04分布式TensorFlow的核心组件分发中心(distributedmaster)执行器(dataflowexecutor)内核应用(kernelimplementation)最底端的设备层(devicelayer)/网络层(networkinglayer)TensorFlow基本架构04分发中心从输入的数据流图中剪取子图,将其划分为操作片段并启动执行器。执行器负责图操作在进程和设备中的运行、收发其它执行器的结果。内核应用负责单一的图操作,包括数学计算、数组操作、控制流和状态管理操作。单进程版本的TensorFlow没有分发中心和执行器,而是使用特殊的会话应用联系本地设备。TensorFlow的C语言API是核心组件和用户代码的分界,其它组件/API均通过C语言API与核心组件进行交互。04知识储备TensorFlow核心概念2TensorFlow基本介绍112Tensorflow特点3

常量概念04

常量指在运行过程中不会改变的值,在TensorFlow中无需进行初始化操作。

常量在TensorFlow中一般被用于设置训练步数、训练步长和训练轮数等超参数,此类参数在程序执行过程中一般不需要被改变,所以一般被设置为常量。

04

变量指在运行过程中值可以被改变的单元。变量在创建时必须确定初始值,可以像定义常量一样。

TensorFlow中的变量是可以被机器优化过程中自动改变值的张量,也可以理解为待优化的张量。变量创建后,一般无需人工进行赋值,系统会根据算法模型,在训练优化过程中自动调整变量的值。

变量概念

04变量概念

TensorFlow中的变量使用Variable类来保存,使用时用initial_value参数指定初始化函数,name参数指定变量名。训练梯度变量:tf.GraphKeys.TRAINABLE_VARIABLES全局变量:tf.GraphKeys.GLOBAL_VARIABLES本地变量:tf.GraphKeys.LOCAL_VARIABLESTensorflow提供变量集合以储存不同类型的变量,默认的变量集合包括:

04

占位符的本质就是先声明数据类型,以便建立模型时申请内存。

TensorFlow中的Variable变量类型,在定义时需要初始化,但有些变量定义时并不知道其数值,只有当真正开始运行程序时,才由外部输入,比如训练数据,这时候需要用到占位符

占位符概念

张量是属于线性代数里的知识点,线性代数是用虚拟数字世界表示真实物理世界的工具。我们用点线面体的概念来比喻解释会更加容易理解:·点——标量(scalar)·线——向量(vector)·面——矩阵(matrix)·体——张量(tensor)张量概念04张量概念04张量的数据类型23种,数据类型之间可以互相转换2个特殊类型4类浮点实数字符串2类浮点复数逻辑13类整数04TensorFlow中的张量

从功能的角度,张量可以简单理解为多维数组,

需要注意的是,张量并没有真正保存数字,它保存的是计算过程。零阶张量表示标量(scalar),也就是一个数;一阶张量为向量(vector),也就是一维数组;n阶张量可以理解为一个n维数组。

04TensorFlow中的张量

一个张量就是一个可以容纳N维数据及其线性操作的容器。

张量是一个多维数组。与NumPyndarray对象类似,tf.Tensor对象具有数据类型和形状。此外,tf.Tensors可以驻留在加速器内存中(如GPU)。

张量(tensor)类型与Python类型放一起做个比较:tensor类型Python类型描述DT_FLOATtf.float3232位浮点数DT_DOUBLEtf.float6464位浮点数DT_INT646464位有符号整型DT_ING323232位有符号整型DT_INT161616位有符号整型DT_INT888位有符号整型DT_UNIT8tf.unit88位无符号整型DT_STRINGtf.string可变长度的字节数组,每一个张量元素都是一个字节数组DT_BOOLtf.bool布尔型DT_COMPLEX64plex64由两个32位浮点数组成的复数:实数和虚数04TensorFlow中的张量张量张量可以由加速器内存(如GPU、TPU)支持。张量是不可变的。NumPyNumPy兼容性在TensorFlowtf.Tensor和NumPy之间转换ndarray很容易VS04张量操作

TensorFlow提供了丰富的张量操作如:

函数描述mod()返回除法的余数cross()返回两个张量的点积abs()返回输入参数张量的绝对值ceil()返回输入参数张量向上取整的结果cos()返回输入参数张量的余弦值exp()返回输入参数张量的自然常数e的指数floor()返回输入参数张量的向下取整结果inv()返回输入参数张量的倒数log()返回输入参数张量的自然对数maximum()返回两个输入参数张量中的最大值minimum()返回两个输入参数张量中的最小值neg()返回输入参数张量的负值pow()返回输入参数第一个张量的第二个张量次幂rsqrt()返回输入参数张量的平方根的倒数sqrt()返回输入参数张量的平方根square()返回输入参数张量的平方04计算图和会话计算图和会话TensorFlow在数据流编程下运行,具体地,使用数据流图表示计算指令间的依赖关系,随后依据图创建会话并运行图的各个部分。计算图由节点(nodes)和线(edges)组成。节点表示操作符Operator,或者称之为算子,线表示计算间的依赖。实线表示有数据传递依赖,传递的数据即张量虚线通常可以表示控制依赖,即执行先后顺序。04计算图和会话动态计算图动态计算图已经不区分计算图的定义和执行了,而是定义后立即执行。因此称之为EagerExcutionTensorFlow2.0怀旧版静态计算图为了确保对老版本tensorflow项目的兼容性,在pat.v1子模块中保留了对TensorFlow1.0那种静态计算图构建风格的支持TensorFlow1.0静态计算图使用静态计算图分两步,第一步定义计算图,第二部在会话中执行计算图04计算图和会话•使用计算图(Graph)来表示计算任务•在被称之为会话(Session)的上下文(context)中执行计算图•使用张量(tensor)表示数据•通过变量(Variable)维护状态•使用feed和fetch可以为任意的操作复制或者从其中获取数04知识储备Tensorflow核心概念2TensorFlow基本介绍112Tensorflow特点3

Tensorflow优势04(1)可用性工作流程相对容易,API稳定,兼容性好,并且TensorFlow与Numpy完美结合,很容易上手。(2)灵活性TensorFlow能够在各种类型的机器上运行,从超级计算机到嵌入式系统。(3)效率自TensorFlow第一次发布以来,效率不断提高。(4)支持在TensorFlow周围形成了一个强大的社区。谷歌已经在TensorFlow上发布了多个预先训练好的机器学习模型,他们可以自由使用。

Tensorflow缺点04(1)缺少符号循环:每个计算流必须构建成图,没有符号循环,这样使得一些计算变得困难。(2)档和接口混乱底层接口写起来繁琐,高层接口不灵活,且封装混乱。(3)默认占用所有GPU的所有内存tf在GPU不可用时会自动改在CPU上跑,这样一方面会导致速度变慢,另一方面,在共用显卡的情况下,你根本就不知道是在CPU上跑。(4)调试困难TensorFlow作为静态图框架,api经常变,打印中间结果必须要借助Session运行才能生效,或者学习额外的tfdbg工具。

主流框架对比04职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务一TensorFlow基础操作05任务实施创建常量与变量2安装TensorFlow1数据类型转换3张量运算4安装TensorFlow05在JupyterLab中使用感叹号“!”表示执行来自操作系统的命令。1.安装TensorFlow

-i

是指向下载源,默认是国外源,但由于国外源下载速度慢,因此这里指向国内源,以便于提高下载速度。

导入tensorflow并查看版本号05任务实施创建常量与变量2安装TensorFlow1数据类型转换3张量运算4创建常量05创建常量方法如下:1.创建常量tf.constant(value,dtype=None,shape=None,name=’const’,verify_shape=False)在创建常量时只有value值是必填的,dtype等参数可以缺省,会根据具体的value值设置相应的值。创建常量05参数名称必选/可选参数类型含义value必选数值或者list输出张量的值dtype可选dtype输出张量元素类型shape可选一维张量或array输出张量的维度name可选string张量名称validate_shape可选bool检测shape是否和value的shape一致,若为False,即不一致时,会用最后一个元素将shape补全。创建常量参数说明05

在创建的同时指定数据类型,在数值兼容的情况下会自动做数据类型转换。2.创建指定数据类型的常量053.创建指定shape的常量如果shape参数值被设定,则会做相应的reshape工作。05在变量的参数中,trainable参数用来表征当前变量是否需要被自动优化,创建变量对象时默认是启用自动优化标志。4.创建变量创建方法如下:tf.Variable(initial_value,dtype=None,validate_shape=None,trainable=True,name='Variable')创建变量创建变量05参数名称必选/可选参数类型含义initial_value必选所有可以转换为Tensor的类型变量的初始值dtype可选dtype输出张量元素类型validate_shape可选bool如果为False,则不进行类型和维度检查trainable可选bool如果为True,需要被自动优化,创建变量对象时默认是启用自动优化标志name可选string变量的名称,如果没有指定则系统会自动分配一个唯一的值创建变量参数说明05任务实施创建常量与变量2安装TensorFlow1数据类型转换3张量运算405通过tf.cast()进行数据类型转换。数据类型转换

TensorFlow支持不同的数据类型:

实数:tf.float32,tf.float64整数:8,16,32,64,tf.unit8布尔:tf.bool复数:plex64,plex128数据类型转换05任务实施创建常量与变量2安装TensorFlow1数据类型转换3张量运算4051.加减乘除运算张量运算052.幂指对数运算张量运算053.压缩求和使用tf.reduce_sum()进行张量压缩求和运算压缩求和tf.reduce_sum(input_tensor,axis=None,keepdims=False,name=None)创建变量的参数说明如下:input_tensor:输入张量。axis=None:求和轴,如果为None,所有元素都会被压缩求和。keepdims=False:如果为True,压缩后的维度会变成1。name:赋予的变量名。05node1=tf.constant([[1,2],[3,4],[5,6]],32)node2=tf.reduce_sum(node1,axis=1)node3=tf.reduce_sum(node1,axis=0)压缩求和[[1,2],[3,4],[5,6]]的shape是3*2*1当axis=1时,留下索引0和2,得到的数据的shape为3*1,得到[3711]当axis=0时,留下索引1和2,得到的数据的shape为2*1,得到[46]05node4=tf.reduce_sum(node1,axis=0,keepdims=True)压缩求和keepdims:是否保持原有张量的维度,设置为True,结果保持输入tensor的形状;设置为False,结果会降低维度,如果不传入这个参数,则系统默认为False054.其他运算张量运算职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务一TensorFlow基础操作任务检查与评价061、请参照评价标准完成自评和对其他小组的互评。2、各组请代表分析本组任务实施经验。项目名称Tensorflow实现服装图像分类任务名称Tensorflow基础操作评价方式可采用自评、互评、老师评价等方式说

明主要评价学生在项目学习过程中的操作技能、理论知识、学习态度、课堂表现、学习能力等

评价内容与评价标准序号评价内容评价标准分值得分1理论知识(20%)了解Tensorflow的基本概念、常量与变量的基本概念、Tensor张量的基本概念。(20分)20分

2专业技能(40%)安装Tensorflow(5%)正确安装Tensorflow,并查看版本(5分)5分

3创建常量与变量(15%)正确创建常量(指定数据类型、指定shpe)(10分)15分

正确创建变量(5分)4数据类型转换(10%)正确转换常量数据类型(5分)10分

正确转换变量数据类型(5分)5张量运算(10%)正确的做加法运算(2分)10分正确的做平方运算(3分)正确的做压缩求和运算(5分)6核心素养(20%)具有良好的自主学习能力、分析解决问题的能力、整个任务过程中有指导他人(20分)20分

具有较好的学习能力和分析解决问题的能力,任务过程中无指导他人(15分)能够主动学习并收集信息,有请教他人进行解决问题的能力(10分)不主动学习(0分)7课堂纪律(20%)设备无损坏、设备摆放整齐、工位区域内保持整洁、无干扰课堂秩序(20分)20分

设备无损坏、无干扰课堂秩序(15分)无干扰课堂秩序(10分)干扰课堂秩序(0分)总得分职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务一TensorFlow基础操作任务小结07职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务一TensorFlow基础操作任务拓展08除了书中提到的张量运算操作之外,TensorFlow还提供哪些算数操作?常见的算数操作有哪些,TensorFlow提供的算术操作类似常量算数操作。解题

思路提示谢谢大家学习项目一TensorFlow实现服装图像分类深度学习应用技术服装图像分类任务二职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务二服装图像分类了解人工智能领域机器学习的概念、分类及应用与深度学习的概念、训练过程了解神经网络的基本结构掌握激活函数、损失函数的意义及作用掌握过拟合、欠拟合的概念及避免策略能够正确导入训练所需的FashinMNIST数据集并查看能够使用matplotlib库实现数据可视化并完成数据预处理能够使用Keras构建简单的神经网络模型能够完成模型的训练、评估并使用模型进行预测职业能力目标01知识目标技能目标职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务二服装图像分类

对下载服装图像数据集进行预处理,使用TensorFlow进行模型构建、模型训练以及评估。任务描述任务要求掌握FashionMNIST数据集的加载和处理;学习使用TensorFlow框架搭建神经网络;掌握并实现神经网络模型训练过程;掌握并实现模型评估及预测过程。任务描述与要求02职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务二服装图像分类任务分析如何添加神经层?过拟合和欠拟合的区别是什么?任务分析与计划03任务计划表通过上面的思考,你是否对本任务要完成的工作有所了解?让我们一起来制订完成本次任务的实施计划吧!任务分析与计划03项目名称TensorFlow实现服装图像分类任务名称服装图像分类计划方式自主设计计划要求请用8个计划步骤来完整描述出如何完成本次任务序号任务计划1

2

3

4

5

6

7

8职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务二服装图像分类神经网络204知识储备人工智能领域概念1过拟合、欠拟合3人工智能04人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。04人工智能(1)弱人工智能

弱人工智能(ArtificialNarrowIntelligence/ANI),只专注于完成某个特定的任务,它们只是用于解决特定的具体类的任务问题而存在,大都是统计数据,以此从中归纳出模型。人工智能目前分为弱人工智能、强人工智能和超人工智能。04人工智能

强人工智能(Artificial

Generallnteligence/AGI),属于人类级别的人工智能,在各方面都能和人类比肩,它能够进行思考、计划、解决问题、抽象思维、理解复杂理念、快速学习和从经验中学习等操作,并且和人类一样得心应手。(2)强人工智能索菲亚04人工智能

超人工智能(ArtificialSuperintelligence/ASI),在几乎所有领域都比最聪明的人类大脑都聪明许多,包括科学创新、通识和社交技能。在超人工智能阶段,人工智能已经跨过“奇点”,其计算和思维能力已经远超人脑。(3)超人工智能人工智能发展史04

第一次发展高潮(1955年—1974年)。计算机可以解决代数应用题、证明几何定理、学习和使用英语。

第一次寒冬(1974年—1980年)。AI遭遇到瓶颈。第二次发展高潮(1980年—1987年)。在这期间目标是造出能够与人对话、翻译语言、解释图像、能够像人一样推理的机器。第二次寒冬(1987年—1993年)。AI硬件的市场需求突然下跌。第三次发展高潮(1993年至今)。云计算、大数据、机器学习、自然语言和机器视觉等领域发展迅速人工智能机器学习(MachineLearning)住在二环,是人工智能的核心区域,也是当前发展最迅猛的一部分,子算法流派枝繁叶茂,但思想比较统一。深度学习人工智能04人工智能(ArtificialIntelligence)涵盖范围最广,三环以内都可以叫人工智能,它关注的问题和方法也最杂,包括知识推理、逻辑规划以及机器人等方面。深度学习(DeepLearning)其实原本是从机器学习的神经网络子算法分支发展出来的一系列成果,知识体系一脉相承。

机器学习——人工智能、机器学习、深度学习的关系04机器学习的概念

机器学习(MachineLearning,ML),是人工智能的核心,属于人工智能的一个分支。

机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。所以机器学习的核心就是数据,算法(模型),算力(计算机运算能力)。机器学习的分类04

监督学习(有导师学习):输入数据中有导师信号,以概率函数、代数函数或人工神经网络为基函数模型,采用迭代计算方法,学习结果为函数。

无监督学习(无导师学习):输入数据中无导师信号,采用聚类方法,学习结果为类别。典型的无导师学习有发现学习、聚类、竞争学习等。

强化学习(增强学习):以环境反馈(奖/惩信号)作为输入,以统计和动态规划技术为指导的一种学习方法。04

机器学习应用领域十分广泛,无论是在军事领域还是民用领域,都有机器学习算法施展的机会。例如:数据挖掘、数据分类、计算机视觉、自然语言处理(NLP)、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、机器翻译、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用等。机器学习的应用

04

深度学习(DL,DeepLearning)是机器学习(ML,MachineLearning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI,ArtificialIntelligence)。

深度学习在搜索技术,数据挖掘,机器学习,机器翻译,自然语言处理,多媒体学习,语音,推荐和个性化技术,以及其他相关领域都取得了很多成果。深度学习的概念源于人工神经网络的研究,含多个隐藏层的多层感知器就是一种深度学习结构。

深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。

深度学习深度学习的概念04深度学习的训练过程

(1)自下上升的非监督学习

从底层开始,一层一层地往顶层训练。采用无标定数据分层训练各层参数,这一步可以看作是一个无监督训练过程,这也是和传统神经网络区别最大的部分,可以看作是特征学习过程。(2)自顶向下的监督学习

通过带标签的数据去训练,误差自顶向下传输,对网络进行微调。基于第一步得到的各层参数进一步优调整个多层模型的参数,这一步是一个有监督训练过程。04知识储备神经网络2112过拟合、欠拟合3人工智能领域概念神经网络04

神经网络的算法目前最受追捧,因为击败李世石的阿尔法狗所用到的算法实际上就是基于神经网络的深度学习算法。

神经网络简单地说就是将多个神经元连接起来、组成一个网络。一个多层感知机的示意图如右,网络的最左边一层被称为输入层,其中的神经元被称为输入神经元。

最右边及输出层包含输出神经元,在这个例子中,只有一个单一的输出神经元,但一般情况下输出层也会有多个神经元。中间层被称为隐含层,因为里面的神经元既不是输入也不是输出。030102神经元04

神经元是神经网络的基本组成,如果把它画出来,大概就长成右图这样。

图中神经元左边的x表示对神经元的多个输入,w表示每个输入对应的权重,神经元右边的箭头表示它仅有一个输出。04激活函数

激活函数(ActivationFunction)是一种添加到人工神经网络中的函数,旨在帮助网络学习数据中的复杂模式。类似于人类大脑中基于神经元的模型,激活函数最终决定了要发射给下一个神经元的内容。能使得神经网络输出变为非线性映射,且能有效减轻梯度消失问题。04

①Sigmoid函数是一个在生物学中常见的S型函数,也称为S型生长曲线。在信息科学中,由于其单增以及反函数单增等性质,Sigmoid函数常被用作神经网络的阈值函数,将变量映射到0,1之间。②Sigmoid函数的缺点:倾向于梯度消失;函数输出不是以0为中心的,这会降低权重更新的效率;执行指数运算,计算机运行得较慢。Sigmoid函数公式如下

激活函数04

①Tanh是双曲函数中的一个,Tanh()为双曲正切。tanh函数和sigmoid函数的曲线相对相似。但是它比sigmoid函数更有一些优势。

②当输入较大或较小时,Tanh函数输出几乎是平滑的并且梯度较小,这不利于权重更新。二者的区别在于输出间隔,tanh的输出间隔为1,并且整个函数以0为中心,比sigmoid函数更好;

③在tanh图中,负输入将被强映射为负,而零输入被映射为接近零。

④注意:在一般的二元分类问题中,tanh函数用于隐藏层,而sigmoid函数用于输出层,但这并不是固定的,需要根据特定问题进行调整。激活函数04Relu激活函数(TheRectifiedLinearUnit),用于隐层神经元输出,相比于sigmoid函数和tanh函数,它具有如下优点:当输入为正时,不存在梯度饱和问题。计算速度快得多。当然,它也有缺点:

当输入为负时,ReLU完全失效,在正向传播过程中,这不是问题。ReLU函数不是以0为中心的函数。激活函数04

①LeakyReLU函数,一种专门设计用于解决DeadReLU(神经元坏死)问题的激活函数,为了彻底避免deadReLU现象。用一个类似0.01的小值来初始化神经元,从而使得ReLU在负数区域更偏向于激活而不是死掉。LeakyReLU公式如下:激活函数04

①ELU函数是针对ReLU函数的一个改进型,相比于ReLU函数,在输入为负数的情况下,是有一定的输出的,而且这部分输出还具有一定的抗干扰能力。

②与ReLU相比,ELU有负值,这会使激活的平均值接近零。

ELU具有ReLU的所有优点,输出的平均值接近0,以0为中心。

ELU公式如下:激活函数04损失函数损失函数

损失函数用来评价模型的预测值和真实值不一样的程度,给模型的优化指引方向。损失函数选择的越好,通常模型的性能越好。不同的模型用的损失函数一般也不一样。优化神经网络的基准,就是缩小损失函数的输出值。04交叉熵损失(CrossEntropy):均方差损失与评价绝对误差损失

均方差(MSE)损失是机器学习、深度学习回归任务中最常用的一种损失函数,也称为L2Loss。平均绝对误差(MAE)是另一类常用的损失函数,也称为L1Loss。MSE比MAE能够更快收敛,MAE对异常点更加鲁棒。MSE与MAE区别损失函数04

合页损失函数是一种将MSE与MAE结合起来,取两者优点的损失函数。从图中可以看到:1)0-1损失:当样本被正确分类时,损失为0;当样本被错误分类时,损失为1。2)感知机损失函数:当样本被正确分类时,损失为0;当样本被错误分类时,损失为-y(wx+b)。3)合页损失函数:当样本被正确分类且函数间隔大于1时,合页损失才是0,否则损失是1-y(wx+b)。也就是说,合页损失函数对学习有更高的要求。缺点:合页损失函数是对错误越大的样本施以更严重的惩罚。可这样会导致损失函数对噪音敏感。损失函数04

①softmax函数,又称归一化指数函数。

我们知道概率有两个性质:预测的概率为非负数;各种预测结果概率之和等于1。softmax就是将在负无穷到正无穷上的预测结果按照这两步转换为概率的。

②softmax第一步就是将模型的预测结果转化到指数函数上。为了确保各个预测结果的概率之和等于1,只需要将转换后的结果进行归一化处理。损失函数04

交叉熵损失函数,也称为对数损失或者logistic损失。交叉熵能够衡量同一个随机变量中的两个不同概率分布的差异程度,在机器学习中就表示为真实概率分布与预测概率分布之间的差异。交叉熵的值越小,模型预测效果就越好。

损失函数神经网络204知识储备人工智能领域概念1过拟合、欠拟合3104过拟合概念

训练准确率和测试准确率之间的差距代表过拟合。过拟合是指机器学习模型在新的、以前未曾见过的输入上的表现不如在训练数据上的表现。简言之,过拟合就是训练时的结果很好,但是在预测时结果不好的情况。避免过拟合的策略04

更多的数据能够让模型学习的更加全面。数据集扩增就是要得到更多符合要求的数据。

结构风险损失函数就是经验损失函数+表示模型复杂度的正则化,正则项通常选择L1或者L2正则化。结构风险损失函数能够有效地防止过拟合。

(1)数据集扩增(2)正则化

在训练的过程中,记录到目前为止最好的验证正确率,当连续10次Epoch,验证正确率没有达到最佳Accuracy,就可以停止迭代了。

数据较少时,降低模型复杂度是比较有效的方法,适当的降低模型复杂度可以降低模型对噪声的拟合度。(3)提前停止训练(4)降低模型复杂度欠拟合概念04

欠拟合就是模型没有很好地捕捉到数据特征,不能够很好地拟合数据。模型不够复杂或者训练数据过少时,模型均无法捕捉训练数据的基本(或者内在)关系,会出现偏差。这样一来,模型一直会错误地预测数据,从而导致准确率降低,这种现象称之为模型欠拟合。04避免欠拟合策略增加新特征添加多项式特征减少正则化参数,使用非线性模型调整模型的容量(capacity)集成学习方法。避免欠拟合策略职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务二服装图像分类05任务实施模型搭建2模型任务准备1模型训练与评估3模型预测4模型任务准备05本任务使用TensorFlow版本为2.5.01、安装TensorFlow代码如下:!sudopipinstalltensorflow==2.5.005本任务使用了tf.keras。2、导入依赖包tf.keras是TensorFlow中用来构建和训练模型的高级API。模型任务准备05加载数据集会返回四个NumPy数组:3、导入FashionMNIST数据集训练集:train_images和train_labels,模型使用它们的数据进行学习。测试集:test_images和test_labels,它们的数据会被用来对模型进行测试。模型任务准备05标签与类对应表图像是28x28的NumPy数组,像素值介于0到255之间。模型任务准备05Fashion_Mnist数据集训练集60,000个图像来训练网络,使用10,000个图像来评估网络学习对图像分类的准确率。在训练模型之前,先浏览训练集的格式。4、浏览数据模型任务准备05任务实施模型搭建2模型任务准备1模型训练与评估3模型预测4051、添加神经层神经网络的基本组成部分是层。层会从向其馈送的数据中提取表示形式。大多数深度学习都包括将简单的层链接在一起。大多数层(如tf.keras.layers.Dense)都具有在训练期间才会学习的参数。模型参数:模型搭建Flatten()展平层,将tensor展开,不做计算Dense()全连接层05在准备对模型进行训练之前,还需要再对其进行一些设置。以下内容是在模型的编译步骤中添加的:2、编译模型损失函数-用于测量模型在训练期间的准确率。优化器-决定模型如何根据其看到的数据和自身的损失函数进行更新。指标-用于监控训练和测试步骤。模型搭建05#编译模型tf.keras.Mpile(optimizer,loss,metrics)模型搭建

optimizer:模型训练使用的优化器,可以从tf.keras.optimizers中选择。loss:模型优化时使用的损失值类型,可以从tf.keras.losses中选择。metrics:训练过程中返回的矩阵评估指标,可以从tf.keras.metrics中选择。05任务实施模型搭建2模型任务准备1模型训练与评估3模型预测405开始训练,调用model.fit方法,这样命名是因为该方法会将模型与训练数据进行“拟合”:1、向模型馈送数据tf.keras.Model.fit(x,y,batch_size,epochs,validation_data)x:训练集数组。y:训练集标签数组。batch_size:批处理数量。(此次省略)epochs:迭代次数。validation_data:验证集的图片和标签数组。(此次省略)模型训练与评估05比较模型在测试数据集上的表现2、评估准确率模型训练与评估tf.keras.Model.evaluate(x,y,batch_size=None,verbose=1):x:测试集图片数组。y:测试集标签数组。batch_size:批处理数量。verbose:模式选择,0为静音模式,1为正常模式,有处理进度条。053、模型预测在模型经过训练后,您可以使用它对一些图像进行预测。模型具有线性输出,即logits。您可以附加一个softmax层,将logits转换成更容易理解的概率。np.argmax():返回数组中最大值的index。模型训练与评估054、验证预测结果正确的预测标签为蓝色,错误的预测标签为红色。数字表示预测标签的百分比(总计为100)。模型训练与评估05任务实施模型搭建2模型任务准备1模型训练与评估3模型预测405从测试数据集中抓取一个图像进行预测。1、模型预测模型预测tf.keras.Model.predict(x,batch_size=None,verbose=0)x:图片数据数组batch_size:批处理数量。verbose:模式选择,0为静音模式,1为正常模式,有处理进度条。职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务二服装图像分类任务检查与评价061、请参照评价标准完成自评和对其他小组的互评。2、各组请代表分析本组任务实施经验。项目名称Tensorflow实现服装图像分类任务名称服装图像分类评价方式可采用自评、互评、老师评价等方式说

明主要评价学生在项目学习过程中的操作技能、理论知识、学习态度、课堂表现、学习能力等

评价内容与评价标准序号评价内容评价标准分值得分1理论知识(20%)了解人工智能领域概念、神经网络基本架构、过拟合与欠拟合的基本概率及避免策略。(20分)20分

2专业技能(40%)模型任务准备(10%)正确安装Tensorflow,并导入依赖包、数据集(3分)10分

正确的浏览训练集的格式(2分)正确的对数据进行预处理(5分)3模型搭建(10%)正确添加神经层(5分)10分

正确编译模型(5分)4模型训练与评估(15%)正确向模型馈送数据(5分)15分

正确评估准确率5分)正确的预测模型并验证预测结果(5分)5模型预测(5%)正确的预测模型5分6核心素养(20%)具有良好的自主学习能力、分析解决问题的能力、整个任务过程中有指导他人(20分)20分

具有较好的学习能力和分析解决问题的能力,任务过程中无指导他人(15分)能够主动学习并收集信息,有请教他人进行解决问题的能力(10分)不主动学习(0分)7课堂纪律(20%)设备无损坏、设备摆放整齐、工位区域内保持整洁、无干扰课堂秩序(20分)20分

设备无损坏、无干扰课堂秩序(15分)无干扰课堂秩序(10分)干扰课堂秩序(0分)总得分职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务二服装图像分类任务小结07职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务二服装图像分类任务拓展08尝试调整模型训练参数,并观察训练过程的变化。

模型训练的参数有:x:训练集数组。y:训练集标签数组。batch_size:批处理数量。epochs:迭代次数。validation_data:验证集的图片和标签数组。解题

思路提示谢谢大家学习项目一TensorFlow实现服装图像分类深度学习应用技术KerasTuner超参数调节任务三职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务三KerasTuner超参数调节理解KerasTuner库的概念及作用了解模型超参数与算法超参数的定义了解超参数调节的常用搜索方法理解超模型的定义和作用了解Hyperband调节器使用的调节算法能够搭建KerasTuner环境并完成数据集准备能够使用Keras构建模型能够实例化Hyperband调节器并执行超调能够使用最佳超参数构建模型并完成模型训练、评估职业能力目标01知识目标技能目标职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务三KerasTuner超参数调节

本任务将使用KerasTuner进行超参数调节,进行调节后的模型训练并实现模型评估。任务描述任务要求实现数据集下载与处理;使用KerasTuner构建模型;实现超参数调节,并使用调节后的超参数进行模型训练;实现模型评估。任务描述与要求02职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务三KerasTuner超参数调节任务分析有哪些超参数调节方法?如何定义超参数搜索空间?任务分析与计划03任务计划表通过上面的思考,你是否对本任务要完成的工作有所了解?让我们一起来制订完成本次任务的实施计划吧!任务分析与计划03项目名称TensorFlow实现服装图像分类任务名称KerasTuner超参数调节计划方式自主设计计划要求请用8个计划步骤来完整描述出如何完成本次任务序号任务计划1

2

3

4

5

6

7

8职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务三KerasTuner超参数调节KerasTuner简介204知识储备Keras概述1超参数介绍3Keras概述04Keras是一个由Python编写的开源人工神经网络库,可以作为Tensorflow、Microsoft-CNTK和Theano的高阶应用程序接口,进行深度学习模型的设计、调试、评估、应用和可视化。Keras工作流程04定义训练数据:输入张量和目标张量。定义层组成的网络,将输入映射到目标。配置学习过程:选择损失函数、优化器和需要监控的指标。调用模型的fit方法在训练数据上进行迭代,显示准确率。使用predict预测目标结果。040504Keras特性相同的代码可以在CPU或GPU上无缝切换运行。具有用户友好的API,便于快速开发深度学习模型的原型。内置支持卷积网络(用于计算机视觉)、循环网络(用于序列处理)以及二者的任意组合。支持任意网络架构:多输入或多输出模型、层共享、模型共享等。Keras特性04Keras模型Keras模型序贯模型函数式模型

单输入单输出,一条路通到底,层与层之间只有相邻关系,没有跨层连接。这种模型编译速度快,操作也比较简单

多输入多输出,层与层之间任意连接。相比于序列化模型,函数化模型显示定义了隐含层的张量,因此可以更容易地搭建非序列化的模型,具有更好的可扩展性。KerasTuner简介204知识储备Keras概述1超参数介绍304KerasTuner概述

KerasTuner是一个分布式超参数优化框架,能够在定义的超参数空间里寻找最优参数配置。内置有贝叶斯优化、Hyperband和随机搜索算法等算法。04KerasTuner工作流程(1)定义一个调谐器;(2)库搜索功能执行迭代循环;(3)通过在保持的验证集中计算训练模型的准确性来执行评估;(4)就验证精度而言,最好的超参数组合可以在暂留的测试集上进行测试。KerasTuner简介204知识储备Keras概述1超参数介绍304超参数解释

超参数是控制训练过程和ML模型拓扑的变量。这些变量在训练过程中保持不变,并会直接影响ML程序的性能。超参数有两种类型:模型超参数:影响模型的选择。算法超参数:影响学习算法的速度和质量。超参数网格搜索指在目标位置基本服从均匀分布的条件下,搜索轨迹随机且均匀散布在目标分布区域内的一种搜索方式。贝叶斯搜索超参数调节04在所有候选的参数选择中,通过循环遍历,尝试每一种可能性,表现最好的参数就是最终的结果。其原理就像是在数组里找最大值。黑盒优化,根据输出结果(损失函数)找更合适的超参,在搜索中要探索和利用的结合(需要一个采集函数来衡量);由迭代次数等来停止探索。随机搜索随机搜索基于梯度的优化对于特定的学习算法,可以计算相对于超参数的梯度,然后使用梯度下降优化超参数。

超参数调节为机器学习(ML)应用选择正确的超参数集,这一过程称为超参数调节或超调。职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务三KerasTuner超参数调节05任务实施执行超调2任务准备与构建模型1训练模型3评估模型4任务准备与构建模型05进行环境配置,运行该项目需要预装的依赖库1、环境配置05使用KerasTuner为FashionMNIST数据集内的服装图像进行分类的机器学习模型找到最佳超参数。2、导入FashionMNIST数据集并进行数据集预处理任务准备与构建模型05为超调设置的模型称为超模型。可以通过以下两种方式定义超模型:3、构建模型使用模型构建工具函数将KerasTunerAPI的HyperModel类子类化

任务准备与构建模型05#模型构建工具函数将返回已编译的模型,并使用内嵌方式定义的超参数对模型进行超调。#KerasTunerAPI使用hp进行参数遍历,常用方法有:#(1)hp.Int:hp_units=hp.Int('units',min_value=1,max_value=100,step=5)name:Str.参数的名字,必须唯一min_value:Int.范围的最小值max_value:Int.范围的最大值step:步长任务准备与构建模型#(2)hp.Choice:hp_learning_rate=hp.Choice('learning_rate',values=[0.5,0.6,0.8])05任务准备与构建模型name:Str.参数的名字,必须唯一values:可能值的list.值的类型可以是int,float,str,orbool.所有的值必须是一个类型05任务实施执行超调2任务准备与构建模型1训练模型3评估模型405实例化调节器以执行超调。KerasTuner提供了四种调节器:1、实例化调节器执行超调RandomSearchHyperbandBayesianOptimizationSklearn05#在本任务中,使用Hyperband调节器。keras_tuner.Hyperband(hypermodel,objective,max_epochs,factor=3):hypermodel:构建的hypermodel模型实例。objective:优化的参照标准。max_epoch:训练一个模型的最大迭代次数。factor:模型消减因子,默认为3。director:调节日志输出文件夹名。project_name:项目名称。执行超调052、创建回调创建回调以在验证损失达到特定值后提前停止训练。#patience=5:达到5次后停止stop_early=tf.keras.callbacks.EarlyStopping(monitor='val_loss',patience=5)执行超调053、运行超参数搜索。除了上面的回调外,搜索方法的参数也与tf.keras.model.fit所用参数相同。执行超调05任务实施执行超调2任务准备与构建模型1训练模型3评估模型405使用从搜索中获得的超参数找到训练模型的最佳周期数。1、训练模型训练模型052、实例化超模型重新实例化超模型并使用上面的最佳周期数对其进行训练。训练模型05任务实施执行超调2任务准备与构建模型1训练模型3评估模型405代码如下:评估模型评估模型tf.keras.Model.evaluate(x,y,batch_size=None,verbose=1):x:测试集图片数组。y:测试集标签数组。batch_size:批处理数量。(此次省略)verbose:模式选择,0为静音模式,1为正常模式,有处理进度条。职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务三KerasTuner超参数调节任务检查与评价061、请参照评价标准完成自评和对其他小组的互评。2、各组请代表分析本组任务实施经验。项目名称Tensorflow实现服装图像分类任务名称KerasTuner超参数调节评价方式可采用自评、互评、老师评价等方式说

明主要评价学生在项目学习过程中的操作技能、理论知识、学习态度、课堂表现、学习能力等

评价内容与评价标准序号评价内容评价标准分值得分1理论知识(20%)了解Keras的基本概念、KerasTuner的基本概念、超参数的基本概念。(20分)20分

2专业技能(40%)任务准备(5%)正确的环境配置(1分)5分

正确的导入数据集并进行数据集预处理(4分)3构建模型(10%)正确的构建模型(10分)10分

4执行超调(10%)正确实例化调节器(5分)10分

正确的创建回调并运行超参数搜索(5分)5训练模型(10%)正确的训练模型(5分)10分正确的实例化超模型(5分)6评估模型(5分)正确的评估模型(5分)5分7核心素养(20%)具有良好的自主学习能力、分析解决问题的能力、整个任务过程中有指导他人(20分)20分

具有较好的学习能力和分析解决问题的能力,任务过程中无指导他人(15分)能够主动学习并收集信息,有请教他人进行解决问题的能力(10分)不主动学习(0分)8课堂纪律(20%)设备无损坏、设备摆放整齐、工位区域内保持整洁、无干扰课堂秩序(20分)20分

设备无损坏、无干扰课堂秩序(15分)无干扰课堂秩序(10分)干扰课堂秩序(0分)总得分职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务三KerasTuner超参数调节任务小结07职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务三KerasTuner超参数调节任务拓展08除了任务中的方法外,KerasTuner还提供2个内置的可调模型:HyperResnet和HyperXception。请任选一个模型进行调优。使用HyperResnet模型进行调优,代码如下:tuner=kt.tuners.BayesianOptimization(kt.applications.HyperResNet(input_shape=(256,256,3),classes=10),objective='val_accuracy',max_trials=50)解题

思路提示谢谢大家学习项目二TensorFlow实现文本分类深度学习应用技术项目引导案例

情感分析是种有趣的自然语言处理应用,对文本数据中包含的情绪进行解析和分类,衡量人们的观点倾向。

例如被用来分析观众对电影的评论或由该电影引起的情绪状态,又例如将在线客户对产品或服务的反馈按照正面或负面的体验进行分类。项目引导案例自定义神经网络对电影评论文本分类01使用评论文本将影评分为积极(positive)或消极(nagetive)两类,也就是文本的情感分析使用Kears和TensorflowHub对电影评论进行文本分类02使用Keras构建模型进行文本分类,TensorFlowHub模型训练过程,用评估模型准确率的方法并进行预测思考一下,大家知道自然语言处理还应用在哪些方面吗?项目引导案例自定义神经网络对电影评论文本分类任务一职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务一自定义神经网络对电影评论文本分类了解自然语言处理发展史,技术,应用研究;理解文本分类概念、分类输入数据、文本分类过程相关知识;理解情感分析概念、层次及方法。能够导入IMDB数据集并浏览数据能够对文本进行数据预处理能够使用嵌入(Embedding)方法构建简单的文本分类模型能够对进行文本分类模型训练并对模型进行评估职业能力目标01知识目标技能目标职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务一自定义神经网络对电影评论文本分类

了解自然语言处理的相关知识,构建神经网络模型,利用下载的IMDB数据集进行模型训练和模型评估。任务描述任务要求下载IMDB数据集并对其进行预处理;构建神经网络模型;完成模型训练;绘制损失值图表和准确率图表。任务描述与要求02职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务一自定义神经网络对电影评论文本分类任务分析自然语言处理技术是怎么做情感分析?想一想如何自定义神经网络?任务分析与计划03任务计划表通过上面的思考,你是否对本任务要完成的工作有所了解?让我们一起来制订完成本次任务的实施计划吧!任务分析与计划03项目名称TensorFlow实现文本分类任务名称自定义神经网络对电影评论文本分类计划方式自主设计计划要求请用8个计划步骤来完整描述出如何完成本次任务序号任务计划1

2

3

4

5

6

78职业能力目标01任务描述与要求02任务分析与计划03知识储备04任务实施05任务检查与评价06任务小结07任务拓展08任务一自定义神经网络对电影评论文本分类文本分类204知识储备自然语言处理1情感分析3自然语言处理04自然语言处理(NaturalLanguageProcessing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理主要应用于机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、中文OCR等方面。自然语言处理发展史04第一阶段第二阶段第三阶段③统计自然语言处理(90年代开始):基于统计的机器学习开始流行,很多NLP开始用基于统计的方法来做。①早期自然语言处理(60~80年代):基于规则来建立词汇、句法语义分析、问答、聊天和机器翻译系统。②神经网络自然语言处理(2008年之后):深度学习开始在语音和图像发挥威力。基于传统机器学习的自然语言处理技术04

自然语言处理可将处理任务进行分类,形成多个子任务,传统的机械学习方法可利用SVM(支持向量机模型)、Markov(马尔科夫模型)、CRF(条件随机场模型)等方法对自然语言中多个子任务进行处理,进一步提高处理结果的精度基于传统机器学习的自然语言处理技术04模型的性能过于依赖训练集的质量,需要人工标注训练集,降低了训练效率不足1传统机器学习模型中的训练集在不同领域应用会出现差异较大的应用效果,削弱了训练的适用性,暴露出学习方法单一的弊端不足2无法人工标注出更抽象、更高阶的自然语言特征,使得传统机器学习只能学习预先制定的规则,而不能学规则之外的复杂语言特征不足3基于深度学习的自然语言处理技术04

深度学习是机器学习的一大分支,在自然语言处理中需应用深度学习模型,如卷积神经网络、循环神经网络等,通过对生成的词向量进行学习,以完成自然语言分类、理解的过程。04能够以词或句子的向量化为前提,不断学习语言特征,掌握更高层次、更加抽象的语言特征,满足大量特征工程的自然语言处理要求优势1深度学习无需专家人工定义训练集,可通过神经网络自动学习高层次特征。优势2基于深度学习的自然语言处理技术词法分析基于大数据和用户行为的分词后,对词性进行标注、命名实体识别,消除歧义。应用场景:各大手机厂商语音助手。文本分类对文章按照内容类型(体育、教育、财经、社会、军事等等)进行自动分类,为文章聚类、文本内容分析等应用提供基础支持。应用场景:垃圾过滤,新闻分类,词性标注等。文本纠错识别文本中有错误的片段,进行错误提示并给出正确的建议文本内容。应用场景:写作类平台。

情感分析能够对文本信息进行“情感”上的正向、负向及中性进行评价。应用场景:评论分析与决策。应用研究0404知识储备文本分类2自然语言处理112情感分析3文本分类(textclassification),指的是将一个文档归类到一个或多个类别中的自然语言处理任务。应用场景非常广泛,涵盖垃圾邮件过滤、垃圾评论过滤、自动标签、情感分析等任何需要自动归档文本的场合。文本的类别有时又称作标签,所有类别组成了标注集,文本分类输出结果一定属于标注集。文本分类是一个典型的监督学习任务,其流程离不开人工指导:人工标注文档的类别,利用语料训练模型,利用模型预测文档的类别。文本分类04分类输入数据0401

02分类数据通过稀疏张量(sparsetensors)表示最有效,稀疏张量是具有非常少的非零元素的张量。分类数据是指表示来自有限选择集的一个或多个离散项的输入特征。例如,它可以是用户观看的电影集,文档中的单词集或人的职业。分类输入数据04构建电影推荐模型,可以为每个可能的电影分配一个唯一的ID,通过用户观看过的电影的稀疏张量来表示每个用户。矩阵的每一行是捕获用户的电影观看历史的示例,被表示为稀疏张量,因为每个用户仅观看所有可能电影的一小部分。最后一行对应于稀疏张量[1,3,999999],使用电影图标上方显示的词索引。04文本分类过程特征抽取语料预处理索引词频统计分类器训练

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论