《机器学习算法与应用》课件-第一章 准备_第1页
《机器学习算法与应用》课件-第一章 准备_第2页
《机器学习算法与应用》课件-第一章 准备_第3页
《机器学习算法与应用》课件-第一章 准备_第4页
《机器学习算法与应用》课件-第一章 准备_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章机器学习算法与应用01机器学习简介添加相关标题文字添加相关标题文字添加相关标题文字添加相关标题文字机器学习简介人工智能应用在哪里呢?无人驾驶汽车是智能汽车的一种,也称为轮式移动机器人,主要依靠车内以计算机系统为主的智能驾驶控制器来实现无人驾驶。无人驾驶中涉及的技术包含多个方面,例如计算机视觉、自动控制技术等。美国、英国、德国等发达国家从20世纪70年代开始就投入到无人驾驶汽车的研究中,中国从20世纪80年代起也开始了无人驾驶汽车的研究。例如,Google的GoogleX实验室正在积极研发无人驾驶汽车GoogleDriverlessCar,百度也已启动了“百度无人驾驶汽车”研发计划,其自主研发的无人驾驶汽车Apollo还曾亮相2018年央视春晚/video/BV14s4y1i7rg/?spm_id_from=333.337.search-card.all.click&vd_source=1c017a7bb5bf576a61625cd62367a647机器学习简介人工智能应用在哪里呢?人脸识别系统的研究始于20世纪60年代,之后,随着计算机技术和光学成像技术的发展,人脸识别技术水平在20世纪80年代得到不断提高。在20世纪90年代后期,人脸识别技术进入初级应用阶段。目前,人脸识别技术已广泛应用于多个领域,如金融、司法、公安、边检、航天、电力、教育、医疗等。有一个关于人脸识别技术应用的有趣案例:张学友获封“逃犯克星”,因为警方利用人脸识别技术在其演唱会上多次抓到了在逃人员。/video/BV1ou41187iD/?spm_id_from=333.337.search-card.all.click&vd_source=1c017a7bb5bf576a61625cd62367a647机器学习简介人工智能应用在哪里呢?机器翻译技术在促进政治、经济、文化交流等方面的价值凸显,也给人们的生活带来了许多便利。例如我们在阅读英文文献时,可以方便地通过有道翻译、Google翻译等网站将英文转换为中文,免去了查字典的麻烦,提高了学习和工作的效率。/video/BV1bx411X7rJ/?spm_id_from=trigger_reload&vd_source=1c017a7bb5bf576a61625cd62367a647机器学习简介人工智能应用在哪里呢?声纹识别的工作过程为,系统采集说话人的声纹信息并将其录入数据库,当说话人再次说话时,系统会采集这段声纹信息并自动与数据库中已有的声纹信息做对比,从而识别出说话人的身份。相比于传统的身份识别方法(如钥匙、证件),声纹识别具有抗遗忘、可远程的鉴权特点,在现有算法优化和随机密码的技术手段下,声纹也能有效防录音、防合成,因此安全性高、响应迅速且识别精准。同时,相较于人脸识别、虹膜识别等生物特征识别技术,声纹识别技术具有可通过电话信道、网络信道等方式采集用户的声纹特征的特点,因此其在远程身份确认上极具优势。机器学习简介人工智能的起源图灵测试(TheTuringtest)由艾伦·麦席森·图灵发明,指测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。进行多次测试后,如果机器让平均每个参与者做出超过30%的误判,那么这台机器就通过了测试,并被认为具有人类智能。图灵测试一词来源于计算机科学和密码学的先驱艾伦·麦席森·图灵写于1950年的一篇论文《计算机器与智能》,其中30%是图灵对2000年时的机器思考能力的一个预测,目前我们已远远落后于这个预测。机器学习简介人工智能的起源1956年8月,在美国汉诺斯小镇宁静的达特茅斯学院中,约翰·麦卡锡(JohnMcCarthy)、马文·闵斯基(MarvinMinsky,人工智能与认知学专家)、克劳德·香农(ClaudeShannon,信息论的创始人)、艾伦·纽厄尔(AllenNewell,计算机科学家)、赫伯特·西蒙(HerbertSimon,诺贝尔经济学奖得主)等科学家正聚在一起,讨论着一个完全不食人间烟火的主题:用机器来模仿人类学习以及其他方面的智能。会议足足开了两个月的时间,虽然大家没有达成普遍的共识,但是却为会议讨论的内容起了一个名字:人工智能。因此,1956年也就成为了人工智能元年。机器学习简介1、起步发展期:1956年—20世纪60年代初人工智能概念提出后,相继取得了一批令人瞩目的研究成果,如机器定理证明、跳棋程序等,掀起人工智能发展的第一个高潮。2、反思发展期:20世纪60年代—70年代初人工智能发展初期的突破性进展大大提升了人们对人工智能期望,人们开始尝试更具挑战性的任务,并提出了一些不切实际的研发目标。然而,接二连三的失败和预期目标落空使人工智能发展走入低谷。3、应用发展期:20世纪70年代初—80年代中20世纪70年代出现的专家系统模拟人类专家的知识和经验解决特定领域的问题,实现了人工智能从理论研究走向实际应用、从一般推理策略探讨转向运用专门知识的重大突破。专家系统在医疗、化学、地质等领域取得成功,推动人工智能走入应用发展的新高潮。机器学习简介4、低迷发展期:20世纪80年代中—90年代中随着人工智能的应用规模不断扩大,专家系统存在的应用领域狭窄、缺乏常识性知识、知识获取困难、推理方法单一、缺乏分布式功能、难以与现有数据库兼容等问题逐渐暴露出来。5、稳步发展期:20世纪90年代中—2010年由于网络技术特别是互联网技术的发展,加速了人工智能的创新研究,促使人工智能技术进一步走向实用化。深蓝战胜国际象棋冠军6、蓬勃发展期:2011年至今随着大数据、云计算、互联网、物联网等信息技术的发展,泛在感知数据和图形处理器等计算平台推动以深度神经网络为代表的人工智能技术飞速发展,大幅跨越了科学与应用之间的“技术鸿沟”,诸如图像分类、语音识别、知识问答、人机对弈、无人驾驶等人工智能技术实现了从“不能用、不好用”到“可以用”的技术突破,迎来爆发式增长新高潮。机器学习简介机器学习计算机视觉语音识别文本挖掘、分类机器翻译机器人机器学习简介人工智能机器学习深度学习机器学习是人工智能的一种实现途径深度学习是机器学习的一个方法发展而来机器学习简介人工智能发展三要素数据、算法、计算力02机器学习工作流程添加相关标题文字添加相关标题文字添加相关标题文字添加相关标题文字机器学习简介什么是机器学习?机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。机器学习简介机器学习工作流程。1.获取数据2.数据基本处理3.特征工程4.机器学习(模型训练)5.模型评估结果达到要求,上线服务没有达到要求,重新上面步骤机器学习简介获取到的数据集介绍目标值特征值机器学习简介获取到的数据集介绍数据类型构成:数据类型一:特征值+目标值(目标值是连续的和离散的)数据类型二:只有特征值,没有目标值数据分割:机器学习一般的数据集会划分为两个部分:训练数据:用于训练,构建模型测试数据:在模型检验时使用,用于评估模型是否有效机器学习简介数据基本处理即对数据进行缺失值、去除异常值等处理机器学习简介特征工程特征工程包含

特征提取

特征预处理

特征降维机器学习简介特征工程机器学习简介特征工程03算法分类添加相关标题文字添加相关标题文字添加相关标题文字添加相关标题文字机器学习算法1.监督学习输入数据是由输入特征和目标值所组成

函数的输出可以是一个连续的值(称为回归)

或是输出是有限个离散值(称作分类)回归问题分类问题机器学习算法2.无监督学习输入数据是由输入特征值组成,没有目标值输入数据没有被标记,也没有确定的结果。样本数据类别未知;

需要根据样本间的现实性对样本进行类别划分机器学习算法3.半监督学习训练集数据同事包含有标记样本数据和未标记样本数据04常用工具添加相关标题文字添加相关标题文字添加相关标题文字添加相关标题文字常用工具matplotlibMatplotlib是Python的绘图库。它可与NumPy一起使用,提供了一种有效的MatLab开源替代方案。它也可以和图形工具包一起使用.1.绘制折线图plt.plot(X,Y)2.绘制散点图plt.scatter(X,Y)常用工具matplotlibMatplotlib是Python的绘图库。它可与NumPy一起使用,提供了一种有效的MatLab开源替代方案。它也可以和图形工具包一起使用.练习1:创建画布,并将以下坐标绘制在折线图、散点图中

x123y456常用工具matplotlib练习2:画出某城市11点到12点之间内每分钟的温度变化折线图,温度范围在15-20之间(温度数值随机产生)常用工具Numpy库np.arange()函数用于创建等差数组,可以指定起始值、终止值和步长。2.

np.linspace()函数用于创建等间隔数组,可以指定起始值、终止值和数组长度。3.

np.random.rand()函数用于创建随机数组,数组元素为0到1之间的随机数。常用工具Matplotlib与Numpy练习3:随机生成10个坐标点,绘制一个散点图常用工具pandaspandas是基于NumPy的一种工具,该工具是为解决数据分析任务而创建的。Pandas纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。Series类似一维数组的数据结构,他能保存任何类型的数据。主要由一组数据和与之相关的索引两部分构成。常用工具pandas.Series(data,index,dtype)参数说明:data:一组数据(ndarray类型)。index:数据索引标签,如果不指定,默认从0开始。dtype:数据类型,默认会自己判断。importpandasaspda=[1,2,3]myvar=pd.Series(a)print(myvar)importpandasaspda=["Google","Runoob","Wiki"]myvar=pd.Series(a,index=["x","y","z"])print(myvar)常用工具DataFrame类似于二维数组或者表格的对象,既有行索引,又有列索引行索引,表明不同行,横向索引,叫index,0轴,axis=0列索引,表明不同列

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论