《深度学习原理》课件_第1页
《深度学习原理》课件_第2页
《深度学习原理》课件_第3页
《深度学习原理》课件_第4页
《深度学习原理》课件_第5页
已阅读5页,还剩55页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

深度学习原理课程概述1课程目标掌握深度学习核心原理2学习内容神经网络、CNN、RNN等模型先修知识第一章:深度学习简介定义多层神经网络的机器学习方法特点自动特征提取优势处理复杂非线性问题什么是深度学习?定义使用多层神经网络从数据中学习表示与机器学习关系机器学习的子领域,特征自动学习深度学习特点层次结构,端到端学习深度学习的发展历史11943年McCulloch-Pitts神经元21986年反向传播算法32012年AlexNet引发革命42016年后深度学习全面爆发深度学习的应用领域计算机视觉图像识别、目标检测自然语言处理机器翻译、情感分析语音识别语音助手、实时翻译其他领域游戏AI、自动驾驶第二章:神经网络基础1复杂网络深度架构2学习算法反向传播3激活函数非线性变换4神经元基本计算单元人工神经元模型生物神经元类比树突-细胞体-轴突对应输入-计算-输出数学模型加权和+激活函数,y=f(∑wixi+b)激活函数Sigmoid输出范围(0,1),早期常用ReLUmax(0,x),现代网络主流Tanh输出范围(-1,1),零中心化前向传播输入层接收原始数据隐藏层加权求和+激活函数输出层生成预测结果损失函数均方误差(MSE)回归问题常用,(y-ŷ)²的平均交叉熵分类问题标准,-∑y·log(ŷ)作用量化模型预测与真实值差距反向传播算法前向计算获取预测值计算损失对比预测与真实值求梯度使用链式法则计算每层参数梯度更新权重权重-学习率×梯度优化算法SGD最基本,容易振荡Adam自适应学习率,收敛快RMSprop解决梯度爆炸/消失第三章:深度神经网络CNN空间特征学习1RNN序列数据处理2GAN生成建模3Transformer注意力机制4自编码器无监督学习5多层感知机(MLP)结构输入层+多个隐藏层+输出层优点简单易实现通用函数逼近缺点参数量大空间关系丢失卷积神经网络(CNN)卷积层通过卷积核提取局部特征池化层降维,提取主要特征全连接层最终分类/回归CNN架构1LeNet(1998)手写数字识别先驱2AlexNet(2012)深度CNN突破,赢得ImageNet3VGG(2014)使用小卷积核堆叠4ResNet(2015)残差连接,解决深层训练循环神经网络(RNN)结构带循环连接,处理序列LSTM三门结构,解决长期依赖GRU简化版LSTM,参数更少自编码器输入原始数据编码器压缩到潜在空间潜在表示低维特征解码器重建原始数据1应用降维、去噪、特征学习2变体变分自编码器(VAE)、堆叠自编码器生成对抗网络(GAN)生成器创建样本从随机噪声生成假数据1判别器评估区分真实与生成数据2生成器改进通过对抗学习提高质量3双网络博弈过程,最终达到纳什均衡第四章:深度学习模型训练1模型部署实际应用2调优评估提高性能3训练过程参数学习4数据准备预处理数据预处理标准化转换为均值0方差1,z=(x-μ)/σ归一化缩放到[0,1]或[-1,1]区间数据增强旋转、缩放、裁剪扩充样本缺失值处理填充、删除或预测批量处理Mini-batch每次使用数据子集训练,平衡效率与精度批量归一化标准化每层输入,加速收敛过拟合问题定义模型过于复杂,记住训练数据细节表现训练误差低但测试误差高检测交叉验证,早停法正则化技术L1正则化添加权重绝对值和惩罚,产生稀疏L2正则化添加权重平方和惩罚,权重更小Dropout训练时随机关闭神经元,防止共适应数据增强扩充训练集,提高泛化能力超参数调优定义搜索空间学习率、层数、神经元数量等网格搜索穷举所有组合,计算开销大随机搜索随机采样,效率更高贝叶斯优化基于先验结果指导搜索迁移学习概念利用预训练模型知识解决新任务应用场景数据量少任务相似计算资源受限方法特征提取微调多任务学习第五章:计算机视觉应用1主要任务分类、检测、分割、识别、生成2关键技术CNN架构、特征提取、迁移学习图像分类原理CNN提取特征,全连接分类常用数据集MNIST:手写数字CIFAR-10:10类物体ImageNet:1000类物体评估指标准确率精确率/召回率F1分数目标检测1R-CNN系列区域提议+CNN分类,精确但慢2YOLO系列单次检测,实时性好3SSD多尺度特征图检测4RetinaNet引入FocalLoss解决类别不平衡语义分割FCN全卷积网络,像素级分类U-NetU形编解码结构,医学图像分割DeepLab空洞卷积+CRF,边界精确人脸识别人脸检测定位人脸位置人脸对齐标准化姿态特征提取学习身份表示匹配/分类相似度计算深度模型:FaceNet、ArcFace、CosFace图像生成1风格迁移将一幅图的艺术风格应用到另一幅图2图像超分辨率提高低分辨率图像质量3图像修复填补图像缺失区域4图像合成文本转图像,条件生成第六章:自然语言处理应用文本分类情感分析、主题识别1机器翻译语言间转换2问答系统自动回答问题3文本生成创作文本内容4命名实体识别识别文本中实体5词嵌入Word2VecCBOW和Skip-gram模型,词向量学习GloVe基于全局词共现统计的词表示优势捕捉语义关系,king-man+woman≈queen序列到序列模型基本架构编码器-解码器架构机器翻译源语言句子转目标语言文本摘要长文本压缩为短摘要注意力机制基本原理加权关注输入序列的不同部分Self-Attention序列内部元素相互关注Multi-HeadAttention多组注意力并行计算优势解决长距离依赖,并行计算Transformer模型结构编码器-解码器,全注意力机制核心组件多头注意力位置编码前馈网络应用机器翻译文本生成大规模预训练BERT和GPT预训练大规模无标注文本微调特定下游任务应用广泛NLP任务BERT双向Transformer,掩码语言模型GPT单向Transformer,自回归语言模型第七章:语音识别与合成1自然对话语音互动2语音合成文本转语音3语音识别语音转文本4声学处理特征提取语音识别基础声学模型音频信号到音素映射语言模型预测词序列概率处理流程预处理→特征提取→解码→后处理深度学习在语音识别中的应用1DNN-HMM神经网络声学建模+隐马尔可夫状态转移2RNN/LSTM序列建模,捕捉时序依赖3CTC端到端训练,无需精确对齐4Attention-based编码器-解码器+注意力机制语音合成技术传统方法拼接式和参数式合成WaveNet自回归CNN生成原始波形Tacotron端到端生成梅尔频谱,与声码器结合第八章:强化学习环境提供状态和奖励1智能体选择动作2奖励评估动作好坏3策略学习最优决策4目标:最大化长期累积奖励强化学习基础马尔可夫决策过程(MDP)状态、动作、转移概率、奖励、折扣因子价值函数评估状态或动作的长期回报Q-learning学习动作-价值函数,离线学习探索与利用尝试新动作与使用已知最优动作的平衡深度强化学习DQN深度网络近似Q函数,经验回放+目标网络PolicyGradient直接优化策略,REINFORCE算法Actor-Critic结合策略和价值学习,A3C/A2C应用案例AlphaGo/AlphaZero围棋、国际象棋、将棋超人类水平机器人控制运动规划、抓取操作自动驾驶路径规划、决策控制第九章:深度学习框架TensorFlowGoogle开发,工业部署优势PyTorchFacebook开发,研究友好Keras高级API,快速原型设计MXNetAmazon支持,多语言TensorFlow简介1计算图静态图定义后编译执行2TensorFlow2.0特点即时执行模式,更直观3部署优势TensorFlowServing,移动端TFLite4可视化工具TensorBoard监控训练过程PyTorch简介动态图边定义边执行,灵活调试自动求导动态构建计算图,自动计算梯度优势Pythonic风格研究友好自然语言处理强大其他框架对比TensorFlowPyTorchKerasMXNet各框架都有各自优势,选择应基于项目需求第十章:深度学习硬件GPU并行计算加速,主流训练硬件TPU谷歌定制AI芯片,高效矩阵运算FPGA可编程门阵列,低功耗推理GPU加速CUDANVIDIA并行计算平台,GPU编程cuDNN深度神经网络库,优化基础操作优势并行计算能力强矩阵运算高效生态系统成熟TPU和FPGATPU原理专用矩阵乘法单元,为深度学习优化TPU优势性能/功耗比高,规模化训练FPGA特点硬件可重配置,定制化加速FPGA应用边缘计算,低延迟推理分布式训练数据并行模型复制,每份处理不同数据批次模型并行模型分割到不同设备,适合大模型同步与异步同步:等待所有更新异步:独立更新,收敛难第十一章:深度学习前沿研究前沿:少样本学习、自动架构设计、可解释AI、隐私保护学习、节能AI元学习1定义学习如何学习,快速适应新任务2Few-shot学习从少量样本学习新类别3MAML模型无关元学习算法4原型网络基于原型表示的度量学习神经架构搜索(NAS)架构生成搜索空间中采样候选架构1性能评估训练模型测试准确率2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论