人工智能通识教程课件 03 人工智能技术的新探索-机器学习技术框架01_第1页
人工智能通识教程课件 03 人工智能技术的新探索-机器学习技术框架01_第2页
人工智能通识教程课件 03 人工智能技术的新探索-机器学习技术框架01_第3页
人工智能通识教程课件 03 人工智能技术的新探索-机器学习技术框架01_第4页
人工智能通识教程课件 03 人工智能技术的新探索-机器学习技术框架01_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

03人工智能技术的新探索

——机器学习技术框架011本章目标理解数据智能的本质掌握数据智能的核心要素了解数据科学的概念掌握机器学习的概念2/60重点重点数据智能3/60回顾:人工智能技术三次浪潮4/60如何实现机器自主学习?5/60人类机器学习学习现代人工智能的基石数据智能利用先进的数据分析、机器学习技术,从海量数据中提取有价值的信息,并将这些信息转化为洞察力和智能决策的能力数据文字图片视频音频...从以下几个方面理解数据智能6/60从数学角度看模型从认识论看数据智能从模型论看数据智能数据智能探讨人类如何从感知到认知将抽象的认识论概念具体化为可操作的思维工具实现模型和思维的精确方法和语言从认识论看数据智能透过现象看本质7/60世界是什么?世界究竟存在哪些本质属性?本体论我们如何能够认识这个世界?我们的认知是否可靠、全面?认识论感知智能活动的起点8/60科技扩大感知范围尽管如此,还有很多我们无法感知的世界......电磁波暗物质眼耳舌鼻身感知认知认知始于感知,但不止于感知9/60儿时.这只狗会咬我!!!害怕恐惧看见狗咬人的狗大脑对接收到的信息进行加工处理感知与认知的哲学基础认知并非是对真实世界的把握10/60康德及其代表性作品儿时.被狗咬过或者没养过狗的人养过狗的人这是一只会咬人的狗!这是一只可爱的狗!这是一只什么样的小狗?曾经或现在我们所认知的并非物自体,而是经过我们认知结构处理后的现象事物的本体事物表象≠先验认识论对数据智能的启示11/60数据:女孩、房子、纸推断:一个女孩在看一张纸数据:女孩、房子、纸、玩偶、灯笼推断:这可能是一家饭店,一个女孩在看菜谱数据:女孩、房子、纸、玩偶、灯笼、花、文字......推断:这是一个日本餐馆,正在营业中,一个女孩餐馆前,可能在点餐,当前的季节可能是春秋季......数据智能搜索更多的数据,得出更多的推断......儿童成人侦探数据智能是人类认知的模拟和扩展数据智能如何增强人类的认知能力

多源数据融合技术先进的算法设计和数据选择方法12/60先验认识与数据智能的对应13/60人的感知大脑的信息处理人类的认知和判断先验认知数据采集数据处理和分析模式识别和决策制定数据智能更广泛更复杂更准确想一想在数据智能中,什么是康德所说的“物自体”,什么是“经过我们认知处理后的现象”?14/60我们所认知的并非物自体,而是经过我们认知结构处理后的现象事物的本体事物表象≠数据采集数据处理和分析模式识别和决策制定数据智能从模型论看数据智能15/60人脑运用想象世界来处理实际问题时,主要依赖于模型论模型思维的起源与发展人脑必须借助于模型才能有效运转模型在认知过程中的作用决策树模型神经网络模型主题模型模型在数据智能中的应用宗教、科学、生物学、文学创作、工程实践、生活模型思维在现实中的应用人脑运用想象世界来处理实际问题时,主要依赖于模型论模型思维的起源与发展16/60古希腊柏拉图

我们所见的世界只是表象,其背后存在一个更为真实的理念世界。理念世界中的每一个理念或模型,都是表象世界中相应事物的本质或原型苹果模型模型在认知过程中的作用人脑必须借助于模型才能有效运转17/60儿时.被狗咬过或者没养过狗的人狗是咬人的!狗是可爱的!狗是什么样的动物?曾经或现在模型根据经历不同,不同的人构建出的狗的模型不同,所以看到的表象也不同事物表象事物表象养过狗的人模型思维在现实中的应用18/60牛顿定律宗教信仰科学生物学模型思维在现实中的应用19/60文学宇宙文明人生百态工程哲学生活模型在数据智能中的应用决策树模型20/60树状结构表示决策过程,用于分类任务判断好瓜还是坏瓜的决策树模型在数据智能中的应用神经网络模型21/60多输入下的神经元模型深度神经网络单层感知机模型模型在数据智能中的应用主题模型22/60LDA主题模型想一想从模型论的角度来说,数据智能要建立合适的模型拟合数据。那么以城市交通流量预测模型为例,你认为模型大概是怎么样的?可能有哪些局限性?23/60从数学角度看模型万物皆数24/60毕达哥拉斯学派毕达哥拉斯定理弦长比与音程的关系数学思维本质上是一种模型思维数学在数据智能中的应用线性代数

25

25/60RGB是通过对三原色红(R)、绿(G)、蓝(B)通道的变化以及它们相互之间的叠加,得到各式各样的颜色xyRGB(226,237,233)G:237R:226B:233xy[[226,237,233],[188,202,191],[137,159,147],[96,120,110],........[221,......,......],[191,......,.......],[176,......,.......],[182,.....,......],..............,......,......,......,........]颜色矩阵RGB数学在数据智能中的应用概率与统计学26/60英国学者贝叶斯根据贝叶斯模型实现下面预测贝叶斯定理概率统计[类别=P][天气=晴]该情况的概率数学在数据智能中的应用优化理论27/60利用梯度下降算法求解模型参数数学在数据智能中的应用信息论28/60最大信息增益—父节点的不纯度MIN所有子节点的不纯度MAX决策树模型构建决策树时,算法会尝试最小化子节点的不纯度,这样可以使得每个节点尽可能纯。纯度越高,划分效果越清晰,需要再进行划分的次数越少纯度最高的子集每次选择哪个特征作为拆分节点?身材大小是否叫脖子长短是否会结网是否会飞数学在数据智能中的应用微积分29/60正向传播反向传播数学模型的优势与局限优势30/60局限精确性欠拟合与过拟合欠拟合认为苹果也是树叶好的树叶模型过拟合认为必须边缘有锯齿状才是树叶,其他不是树叶数据智能的核心要素三要素31/60模型数据学习感知理解表达原料方法目标数据智能的局限32/60从认识论角度原有认知已理解事物无法解释的事物从模型角度从数学角度本质上,模型都是简化的不是所有问题都是可计算的是否会最终停止(停机)?认知是有局限的停机问题无法判断小结什么是数据智能从各个角度看数据智能认识论、模型论、数学数据智能的核心要素数据、模型、学习数学智能局限性认识论、模型论、数学33/60数据科学34/60数据是21世纪的石油数据科学什么是数据科学驾驭数据以驱动智能的核心领域35/60数据智能数据科学数据科学的特征数据36/60形式多样快速产生价值密度低数据量大全维度覆盖淘宝2024年月活跃用户8.87亿Facebook日产数据4PB100亿条消息3.5亿张照片1亿小时视频一个大型医疗集团每年可能积累PB级别的电子病历数据文字图片音频视频互动信息交通医疗教育工业农业某工业车间内的传感器每秒钟产生数条数据,但只有故障数据可能才是有价值数据从人类认知科学领域看数据科学37/60遵循逻辑规则推理判断逻辑思维抽象思维运用数学知识方法和算概念思考并计求解问题数学与计算思维数据智能数据挖掘和智能算法对客观现实间接概括感性思维(直觉思维)从自然科学领域看数据科学38/60数据驱动精准医疗气象预测生物学领域气象学领域从社会研究学领域看数据科学39/60舆情分析用户画像社交媒体数据分析从人工智能领域看数据科学40/60数据科学作为核心驱动力机器学习关键组成部分机器学习41/60什么是机器学习儿时的你是怎么学习的?42/60耳朵长的是兔子鼻子长的是大象这是什么?耳朵长,是兔子学习的过程预测的过程什么是机器学习机器“学习”的过程与人类一样43/60机器学习与统计学习方法44/60机器学习统计学习方法统计学习方法是机器学习的重要组成部分不关注数据的描述和推断,而是通过构建数学模型,让计算机通过数据进行预测或决策提取特征、学习规律相关概念的区分45/60传统的统计分析方法统计学习方法数据集小规模、低维度大规模、高维度复杂关注重点数据的描述性分析和推断统计注重数据建模、预测和决策举例

一家制药公司研发了一种新的感冒药,想要测试其对缩短感冒病程的有效性。他们招募了一个小规模的测试组,共有50名感冒患者参与实验

基因研究公司对一个基因数据集实现分析。包含成千上万个基因表达数据(维度),样本数量达到数百万级,数据非常复杂,基因之间相互关联,并且与疾病的发生、发展有着复杂的关系

小型社区超市,主要销售食品、日用品和文具3大类商品,想要分析各类商品的销售情况。

大型电商平台(如京东、天猫),有数以百万计的商品,每个商品都有大量与之相关的数据维度,如商品价格、品牌、类别、历史销量、好评率、店铺信誉、促销活动、季节因素、消费者评价关键词等诸多因素,构成了一个大规模、高维度的数据集统计学习方法的优势46/60电子病历系统中数以万计患者的病历强大的数据处理能力灵活的模型选择金融领域的线性数据与非线性数据使用随机梯度下降调优图像识别模型高效的优化算法严格的评估标准使用精准率、准确率等实现评估个人信用卡风险评估LDA模型股票价格波动SVM模型线性数据非线性数据CNNAdam图像识别模型分类模型评估指标电子病历数据量大机器学习的数学基础和应用47/60微积分线性代数概率论优化理论梯度下降--反向传播--正则化--......----标准化归一化--贝叶斯模型--模型融合--......--梯度下降及变种--超参数优化--模型选择--......数据矩阵表示--神经网络线性变换--向量空间--......--实战训练—机器学习原理体验2-1任务描述体验机器学习概念与原理。任务要求分别完成丹顶鹤与鸵鸟的识别、鸵鸟与鸸鹋的识别2.总结我们自己是如何完成上面的识别任务的?3.思考这个过程对比机器学习实现图像识别,可能有哪些异同?48/34实战训练—机器学习原理体验2-2教学指导

用3-5分钟时间,浏览观察训练图片中10张丹顶鹤图片和10张鸵鸟图片,总结每张图片中动物的体貌特征并记录。

选择测试图片,尝试说出图中是丹顶鹤还是鸵鸟?为什么?

识别鸵鸟与鸸鹋的任务同上。请注意鸸鹋与鸵鸟的体貌特征接近,需要更细微的特征观察总结人识别图片中动物的具体过程对比人的图像识别与机器实现图像识别的异同提示:

例如,对于丹顶鹤的特征,人可能有一部分先验知识,比如头上有红色,嘴又尖又长。但机器对于这些信息,可能需要进行一些标注并存储,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论