




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
人工智能应用基础授课人:周老师
技术篇项目2 机器学习与深度学习01项目描述05项目拓展02项目分析06项目小结03相关知识07项目练习04项目实施目录项目描述01早上一缕阳光照进卧室,小明听到一个熟悉的声音:“现在是早上7点,新的一天开始了”。小明对这个声音很熟悉,是卧室的智能音响发出的,小明还可以问它今天的天气,并且自己打开窗帘。小明来到餐厅开始吃早餐,刚拿出手机想浏览今天的新闻,手机就自动解锁了。当打开手机里的电商网站,第一时间就看到了自己喜欢的商品。几年前仍是科幻小说里的场景,不仅成为小明每天的日常,也已经成为我们大部分人真实的生活经历。2.1项目描述这背后是人工智能算法在驱动。
它们是怎么执行的?为什么会表现出像人一样的智能?
小时也想学习人工智能技术,利用这项技术造福更多的人。因此,小明想了人工智能算法的相关知识。2.1项目描述02项目分析人工智能算法无时无刻不在影响我们的生活。目前人工智能算法中,机器学习与深度学习已成为主流,正是它们藏在我们身旁,才让上面这一切以前不敢想的生活如今成为现实。要了解人工智能算法是怎么让设备具有智能的,需要学习以下内容:1.
人工智能算法的分类2.
数据在计算机的表示方法3.算法的学习过程2.2项目分析03相关知识人类的智能我们可以根据三角形的定义,很容易区分出哪些是直角三角形2.3相关知识人类的智能也可以很容易区分出猫和狗的图片,但此时规则变得很复杂,很难将规则写成计算机程序。2.3相关知识猫
?头型耳朵毛发五官五官长圆立折平突............狗
?定义规则人工智能的子类-机器学习让计算机从数据中自动寻找规律,并利用学习到的规律对未知或无法观测的数据进行预测,这样的方法就被称为机器学习,并可以用来完成各种识别任务。2.3相关知识人工智能的子类-深度学习深度学习是机器学习下的一个分支,它的核心是人工神经网络(ArtificialNeuralNetwork,ANN)。它使用多层人工神经网络来模拟人脑的神经元工作方式,数据输入到神经网络时会经过多次处理,相比于传统机器学习而言会比较深,因而叫做深度学习。2.3相关知识人工智能的分类任何模仿人类或其它生物体智力或行为的方法都叫人工智能。而机器学习是人工智能领域中专指利用数据进行学习的技术,它无需依靠人来定义规则,深度学习则是机器学习领域中受人类神经系统启发的一种技术。2.3相关知识数据的表示方法在面对声音、图像、文本等输入数据时,语音识别任务可以根据人说话的音频信号,判断说话的内容;图像识别根据输入的图片来判断图中的内容;机器翻译则可以将输入的某一种语言文字转换成一种语言。学习的目的就是要掌握这些数据的规律,将他们转换为对应的输出。2.3相关知识文本表示在计算机中,每个字符都用一个数字表示,比如有字符串“helloworld”,会将每个字母用一个数字替代。如果是中文字符,会用十六进制来表示,因为英文字母总共只有26个,但汉字的数量有很多。2.3相关知识文本的分词为了理解单词的含义,需要将句子划分为单词,以单词为基本单位来编码,这个过程称为分词2.3相关知识图像的表示一张黑白图片,当我们将其中一块区域放大后,就可以明显的看到一个个的像素,它们通过一定的顺序(矩阵形式)进行排列,像素是组成图像的基本单位,每个像素用一个数字表示,叫做灰度值。比如0代表黑色,1代表白色,中间不同的灰度就用0到1之间的小数来代表2.3相关知识声音的表示声音是通过声波进行传播,声波由物体的振动产生,再经介质传播,最后到达人耳被人感知。计算机没有耳朵,这时候我们就需要把声波转换成便于计算机存储的数字信号。2.3相关知识声波的数字化经过采样-量化-编码三个步骤将声波转换为能在计算机中存储的数字编码。2.3相关知识机器学习的过程预处理步骤把原始数据转换成适合机器学习的数据格式,再通过特征提取与转换步骤来获得其中有用的特征,即数据中包含的可利用规律,最后根据这些提取的特征来预测数据内容。2.3相关知识机器学习到的特征特征是识别图片内容所需要的关键信息,比如猫与狗的识别,机器实际上是在学习提取五官、纹理、轮廓等,然后将这些提取的特征进行比较来进行预测(猫或狗)2.3相关知识监督学习让计算机“看”大量的手写体数字样本,并利用某种算法对计算机进行训练,使其自动学习到这些数字隐含的特征信息。不过在将数字样本给计算机“看”之前,需要先对每个样本进行标注(也叫标签)。将每个类别的数字图片标注出来,相当于告诉计算机这些数字是什么,让它们自己去学习(提取)其中的特征,这个过程称为训练。2.3相关知识监督学习在识别猫狗图片时,用数字0代表猫,数字1代表狗,然后将标注后的数据进行训练,当计算机识别出猫时就会输出0,识别出狗时则会输出1。2.3相关知识监督学习训练用的数据和待预测的数据必须具有相似的规律。我们可以输入不同水果的图片训练一个能识别水果的模型,水果的类别也仅限于模型已经见过的类别,但并不能用来识别手写体数字。2.3相关知识无监督学习无监督学习模型的输入数据集是不同类型的动物图片,并且这些图片是没有任何标签信息的,也就是说模型并不知道图片中的动物是什么。此时,无监督学习的任务是自行识别动物的特征,根据不同动物之间的相似性将具有相同特征的动物聚集到同一组中,这个过程也称为聚类。2.3相关知识04项目实施数据集展示30张用于垃圾分类的图像,这此图像此时是没有任何标签的,需要我们自己根据图像中物体的材质将这些垃圾分为金属、玻璃、塑料3类。——“垃圾分类数据”标注2.4项目实施打开EasyDL平台进入EasyDL平台:/easydl/,我们是要为图像数据增加标签信息,用于后续的分类任务,所以这里选择“图像分类”。——“垃圾分类数据”标注2.4项目实施创建数据集点击右侧的“数据总览”,可以看到还没有任何数据集,于是点击“创建数据集”按钮。——“垃圾分类数据”标注2.4项目实施填写数据集信息在数据集名称一栏填写“垃圾分类”,其它信息可选择默认值。——“垃圾分类数据”标注2.4项目实施上传数据集点击“创建并导入”按钮,来到导入图片页面,导入方式一栏选择“本地导入”和“上传图片”,然后选择30张垃圾图片,完成后开始导入,此时根据数据集的大小,会等待一段时间对数据进行导入。——“垃圾分类数据”标注2.4项目实施标注图片导入成功后,我们点击右侧的“在线标注”来给图片添加标签信息。此时我们可以浏览每张导入的图片,然后根据自己的判断,在页面左边给图片添加你认为正确的标签信息。——“垃圾分类数据”标注2.4项目实施选择扩充方法对图片的扩充有多种方法,通过选择各种不同的增强算子来实现,在增强算子一栏选择“FlipLR”,该算子可以将数据集中的图片进行左右翻转来扩展原有的图片数量。——“垃圾分类数据”标注2.4项目实施查看效果扩充完成后,查看数据集V2版本的内容,我们发现数据集的数量由原来的30张变成了60张,因为每张图片都进行了一次左右翻转,数量变成了原来的2倍。——“垃圾分类数据”标注2.4项目实施05项目拓展(1)如果部分数据标签出现了错误,机器学习还能正常工作吗?(2)给图像做标签时,用1来标签猫,用0来标签狗,如果反过来,用0标签猫,用1标签狗,机器还能正常学习吗?2.5项目拓展06项目小结机器学习就是利用算法,使得机器能够从大量数据中学习并自动改进其预测和决策能力,包括多种不同类型的学习方法,如监督学习、无监督学习等,而深度学习更加专注于使用深度神经网络。在机器学习中,数据是至关重要的,通过大量的数据训练,机器能够逐渐掌握某种规律或模式,进而对新的数据进行预测和分类。2.6项目小结07项目练习一、选择题
1. 深度学习中的核心概念是什么?(
)。
A. 机器学习B. 神经网络C. 人工智能D. 计算机
2. 用机器学习来解决实际任务时,会面对多种多样的数据形式,这些数据不包括(
)。A. 语音B. 文本C. 图像D. 算法3. 机器学习在进行手写体数字识别时,输入的数据类型是哪种?(
)A. 文字B. 数字C. 图像D. 声音2.7项目练习一、选择题
4. 在机器学习流程中,数据在进行特征提取之前,要先经过哪个步骤?(
)
A. 预处理B. 特征转换C. 预测D. 学习
5. 监督学习与无监督学习的差别,主要表现在什么方面?(
)A. 数据是否相似B. 是否需要训练C. 是否为深度学习D. 数据是否有标
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030包装检测仪器市场投资前景分析及供需格局研究研究报告
- 2025-2030办公用品产业规划专项研究报告
- 2025-2030再生钢市场市场现状供需分析及投资评估规划分析研究报告
- 2025-2030全球及中国金融领域的大数据IT支出行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030全球及中国电子病历(EMR)行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030全球及中国汽车丝网清洗产品行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030全球及中国β1肾上腺素受体激动剂行业市场现状供需分析及投资评估规划分析研究报告
- 2025-2030儿童牙刷产品入市调查研究报告
- 2025-2030信贷风险行业风险投资发展分析及投资融资策略研究报告
- 2025-2030保健产品入市调查研究报告
- 儿童牙齿分龄护理方案
- 最优控制理论课件
- 苍虬阁诗集完整版本
- 2023-2024学年广东省深圳市宝安区七年级(下)期中英语试卷
- DB43T 2558-2023 城镇低效用地识别技术指南
- 任务2 比亚迪·秦混合动力汽车控制系统构造与检修
- 人教版小学英语三起PEP常用表达法(三四年级共4册)
- 高速公路隧道机电工程施工组织设计方案方案
- 拖挂式房车商业发展计划书
- 09S304卫生设备安装图集
- 护士长招聘笔试题与参考答案(某世界500强集团)2024年
评论
0/150
提交评论