人工智能基础知识_第1页
人工智能基础知识_第2页
人工智能基础知识_第3页
人工智能基础知识_第4页
人工智能基础知识_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人工智能基础进阶篇汇报人:XXXfoundationofartificialintelligence目录让人工智能更智能无监督机器学习的方法阿尔法狗背后的秘密CONTENT让人工智能更智能Makeartificialintelligencesmarter监督学习需要训练数据的标注信息的学习过程,就是监督学习如:分类器从数据中学会了区分鸢尾花的品种如:对图像、音频和视频的分类,都需要类别的标注信息,都属于监督学习没有类别的标注信息供人工智能参考时,怎么办?“计算机能不能自动将照片整理好?”无监督学习没有标注信息的学习过程无类别信息指导很难判断哪一些鸢尾花是相同品种“计算机能不能自动将照片整理好?”聚类(clustering)通过分析数据在特征空间的聚集情况,可以将一组数据分成不同的类。旨在把一群样本分为多个集合,使得同一个集合内的元素尽量“相似”或者“相近”是一种无监督学习过程不需要数据的类别标注不需要预先定义类别让人工智能像真正的科学家一样,自己发掘规律。问题的提出我们希望人工智能在不知道鸢尾花品种的前提下将这N朵鸢尾花分为K类,使得同一类样本的特征相似程度高,而不同类样本的特征相似程度低。算法主要思路先从任意一组划分出发,通过调整,逐步达成上述目标算法步骤1.先计算鸢尾花的聚类中心2.针对矛盾样本进行调整3.K均值聚类结果4.重复第2、3步骤,直到聚类中心与划分方式不再发生变化K均值聚类算法KmeansclusteringalgorithmUnsupervisedmachinelearningmethods无监督机器学习的方法聚类算法示例(鸢尾花分类问题)1.先计算鸢尾花的聚类中心2.针对矛盾样本进行调整3.K均值聚类结果K均值聚类算法Kmeansclusteringalgorithm只要我们能对照片中的人脸提取特征,用特征空间里的特征点表示每一张人脸,就能使用K均值算法将“相似”的人脸聚集起来了相册中的人脸聚类K均值聚类算法Kmeansclusteringalgorithm聚类数量过大会导致照片划分得过细,这样就失去了实用性,需要在平均距离与聚类数量之间取得平衡如图,在K=3的时候,曲线产生了一个明显的拐点,拐点后随着K的增加平均距离减少得非常慢,因此K=3是个合适的选择。K值的确定手肘法(elbowmethod)K均值聚类算法Kmeansclusteringalgorithm潜在语义分析技术Latentsemanticanalysis针对文本数据“多主题”的特点而设计计算机可以借助该技术,从海量的文本数据中自动发掘潜在的主题,进而完成对文本内容的概括和提炼相关专有名词语料库(corpus):海量的文本数据文档(document):语料库中独立的文本主题:文档的中心思想或主要内容主题模型与潜在语义分析技术TopicModelandLatentSemanticAnalysisTechnology词袋模型

词袋模型(bagofwords

model)是用于描述文本的一个简单的数学模型,常用文本特征提取方式之一。词袋模型将一篇文文件看作是一个“装有若干词语的袋子”,只考虑词语在文档中出现的次数,而忽略词语的顺序以及句子的结构。利用词袋模型构建文本特征的基本流程文本的特征中文分词词频特征文档词袋删除停止词与低频词中文分词中文分词词典词频率—逆文档频率特征主题模型与潜在语义分析技术TopicModelandLatentSemanticAnalysisTechnology中文分词

对中文文本进行词袋构建之前,我们还需要藉助额外的手段拆分词语,这项技术称为中文分词。中文分词方法大多基于匹配和统计学方法。停止词与低频词停止词:是文档常出现的,构成中文句子的基本字词,对区分不同文文件的主题没有任何帮助(不携带任何主题信息的高频词)低频词:通常是一些不常用的专有名词,只出现于特定的文章中(比如姓名),不能代表某一主题。词频率与逆文档频率反映一个词语对于一篇文档的重要性的两个指标一个词语在一篇文文件中出现的频率即为词频率(team

frequency)借助逆文档频率(inversedocumentfrequency)来修正每个词语在每篇文档中的重要性文本的特征主题模型与潜在语义分析技术TopicModelandLatentSemanticAnalysisTechnology主题模型(topic

model)是描述语料库及其中潜在主题的一类数学模型将文文档词频、主题比重、主题词频三者的关系表示为:D

=

WT,这个等式建立了语料库与潜在主题之间的关系,是主题模型的核心。通过主题模型,我们建立了语料库与其中潜在主题之间的关系发掘文本中潜在的主题主题模型与潜在语义分析技术TopicModelandLatentSemanticAnalysisTechnology生成对抗络GenerativeAdversarialNetwork概述生成对抗络由生成络(generativenetwork)和判别络(discriminativenetwork)两部分构成生成络:用于生成数据判别络:用来分辨数据是真还是假generativeadversarialnetwork,GAN02由“生成”、“对抗”和“路”三个词语构成。其中“生成”是指它是一个生成模型(generativemodel),即它可以随机生成观测数据0103基本思想:通过生成络和判别络之间的相互“对抗”来学习0504数据空间与数据分布数据空间(dataspace)是数据所在的空间假定输入图片的分辨率为128x128,此时的数据空间就是所有形状为128x128x3的张量的集合。此时每张图片都是此空间里的一个点(数据点)数据分布(datadistribution)是数据点在空间的分布情况生成对抗络GenerativeAdversarialNetwork分类路与生成路工作方式的比较生成络生成器(generator)把潜在空间中的分布变换为图像空间中的分布(生成分布)生成络生成的点就叫做生成点生成对抗络GenerativeAdversarialNetwork例:用判别络分辨点的来源判别络判别器(discriminator)判断一张图片究竟是来自真实数据还是由生成络所生成训练判别络训练数据标注输入图片来自真实数据:标注数值1,输入图片来自生成路:标注数值0输出结果用一个数值来指示空间中的一个点来自真实数据的可能性(概率)生成对抗络GenerativeAdversarialNetwork包含两个交替进行的阶段固定生成路,训练判别路1.给定二分类数据集:真实图片/随机生成图片2.目标:使判别路对真实图片的预测接近1,而对生成图片的预测接近0固定判别路,训练生成路1.生成路利用判别路给出的反馈讯息来调整路参数2.目标:使生成路输出更接近真实图片的生成图片对抗过程生成络的训练生成对抗络GenerativeAdversarialNetworkThesecretbehindAlphaDog阿尔法狗背后的秘密深蓝vs卡斯帕罗夫阿尔法狗vs李世石强化学习(reinforcementlearning)功不可没~棋类计算机程序的发展Developmentofchesscomputerprograms价值络阿尔法狗的走棋络AlphaDog'sChessNetwork01030402走棋络又被称为策略络(policynetwork)该络接受当前棋盘局面作为输入,并输出在当前局面下选择每个位置的落子概率。策略络监督学习策略络强化学习策略络输入局面(3000万样本)深度卷积神经络落子概率预测(s,a)s:当前棋局局面状态

a:人类的落子方案监督学习决策络可以模仿人类的风格下棋,可人类棋手的水平高低不一,并非每个样本都是好的落子方案,络把好的坏的都学了,如何提高棋力?监督学习策略络Supervisedlearningstrategynetwork强化学习的目的是找到一个最佳策略,从而使得主体发出一系列动作后,收到的累计回报最多策略梯度的强化学习技术监督学习策略络强化学习策略络A强化学习策略络B初始化自我对弈强化学习络在训练时的目标不再是模拟人类棋手的风格,而是以最终赢棋为目标强化学习策略络ReinforcementLearningStrategyNetwork阿尔法元只以棋盘当局作为络输入,使用策略迭代的强化学习

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论