版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章
初认识人工智能
《人工智能应用概论(第2版)》RengongZhinengYingyongGailun
第1章:初识人工智能.pptx第2章:人工智能在经济社会生活中的应用.pptx第3章:机器学习.pptx第4章:神经网络与深度学习.pptx第5章:智能语音.pptx第6章:自然语言处理.pptx第7章_知识表示.pptx第8章:计算机视觉应用.pptx第9章:人工智能未来及职业发展规划.pptx第10章:人工智能的展望与争论.pptx全套可编辑PPT课件Part0101人工智能的定义及发展历程Part02022023年是人工智能重要的发展历程一年Part0303生成式AI的发展与分析目
录content163Part01人工智能的定义及发展历程1.1课程导入我们人类已经进入人工智能时代1.1课程导入2018年11月7日,在第五届世界互联网大会上,由搜狗与新华社合作开发的全球首个全仿真智能合成主持人——“AI合成主播(ArtificialIntelligence)”正式亮相。它根据所提供的文字,就能准确无误地播送新闻,可以模拟人类说话时的声音、嘴唇动作和表情,并且将三者自然匹配,逼真程度几乎能以假乱真。我们人类已经进入人工智能时代—AI合成主播1.2人工智能的定义人工智能是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新技术科学。人工智能,或称AI,作为科技革命和产业变革的关键驱动力,其定义和研究范围已广泛渗透至多个领域,包括机器学习、深度学习、机器人、自然语言处理等。1.2人工智能的定义【企业】科大讯飞将人工智能定义为一种能够理解、分析和执行任务的智能系统,特别强调其在自然语言理解和跨领域知识的应用能力。1.2人工智能的定义人工智能(Al)产业是指以人工智能关键技术为核心的、由基础支撑和应用场景组成的、覆盖领域极为广阔的行业群。分类介绍对于人工智能的智能程度,分为弱人工智能(ANI)、强人工智能(AGI)和超强人工智能(ASI)。弱人工智能是指专注于且只能解决单个特定领域问题的人工智能。强人工智能是指能够胜任人类所有工作的人工智能。超强人工智能是指在科学创造力、智能和社交能力等每一个方面都比人类大脑聪明的人工智能。1.3人工智能的核心要素◆核心要素人工智能三大核心要素包括算法、算力和数据。其背后的支撑技术分别为大数据技术、深度学习技术以及Al芯片技术。1.3人工智能的发展历程人工智能从20世纪50年代到21世纪的发展历程,包括教授、机器学习和深度学习等关键技术阶段。1.3人工智能的发展历程-达特莫斯(Dartmouth)学会“人工智能”一词在1956年美国计算机协会组织的达特莫斯(Dartmouth)学会上提出,提出者是约翰•麦卡锡(JohnMcCarthy)、马文•明斯基(MarvinMinsky)、纳撒尼尔•罗切斯特(NathanilelRochester)、克劳德•香农(ClaudeShannon)4位年轻学者。1.3人工智能的发展历程-图灵测试图灵测试是由计算机科学和密码学的先驱阿兰·麦席森·图灵于1950年在他的论文《计算机器与智能》中提出的一种检测机器智能的方法。图灵注意到“智能”这一概念难以确切定义,因此提出了这种通过对话来评估机器智能的方法。图灵测试的核心是通过对话判断机器是否能够模仿人类的智能表现。如果超过30%的测试者认为回答来自人类,那么这台机器即被视为通过了测试。1.3人工智能的发展历程人工智能从20世纪50-80年的作品:跳棋计算机程序、拟人机器人和推理计算机机器人1.3人工智能的发展历程人工智能2000年-2020年发展中著名作品。如拟人机器人、AlphaGo及其后续版本在与人类顶尖围棋高手的对弈中取得了一系列引人注目的胜利,成为人工智能领域的一个里程碑事件。1.3人工智能的发展历程人工智能进入大模型时代。国内有很多AI大模型,其中一些是由科技公司开发的,比如科大讯飞、腾讯、百度、阿里等。这些公司都在积极开发自己的AI技术,以提升其产品和服务的智能化水平。此外,还有一些国内的高校和研究机构也在开展AI领域的研究工作。Part022023年是人工智能重要的发展历程一年3.12023年人工智能产业大事记总览2023年成为人工智能发展历程中值得被载入史册的一年3.2中国人工智能产业规模盘点3.3中国人工智能产业全景深度解析图谱3.4人工智能技术及产业发展相关政策分析3.4人工智能技术迭代图3.3人工智能改变社会生活【课堂思考】1.人工智能的出现,我们未来在生活、文化、工作方面会有什么样的变化?2.谈谈你对人工智能正面评价和负面评价Part03生成式AI的发展与分析3.1预训练大模型优化底层模型训推与理解产出3.2中国生成式AI落地场景多维分析4.3大模型在云、边、端落地对物联网技术体系的影响与塑造谢谢THANKS第二章
人工智能在经济社会生活中的应用
《人工智能应用概论(第2版)》RengongZhinengYingyongGailun
Part0101智慧交通Part0202智慧零售
Part0303智慧安防目
录contentPart0404智慧政务Part01智慧交通1.1智慧交通的概念智慧交通系统(IntelligentTransportationSystem,ITS),指的是在较完善的基础设施(包括道路、港口、机场和通信)之上将先进的信息技术、数据通信传输技术、电子传感技术、电子控制技术以及计算机处理技术等有效地集成运用于整个交通运输管理体系,从而建立起一种在大范围、全方位发挥作用的实时、准确、高效的综合运输和管理系统。1.2智慧交通现状【行业痛点】(1)违法取证类型众多,数量庞大。违法类型众多,数量庞大,高达1.4亿张/年。(2)人工审核任务重,效率低下。人工审核任务重,任务超负荷导致大量图片直接丢机动车违法事故频发,早高峰违法高发,加剧城市违法取证质量较低,数据利用率低,废片多弃拥堵。(3)违法事故行为识别不及时。人工审核效率低,超过50%的案件因过期无法处理。非机动车事故伤亡率高,占到总体事故总数的约40%。1.3智慧交通的算法解决方案【解决方案】基于AI视觉分析技术,算法自适应强,可兼容市面主流厂商违法取证设备,提高无效图片剔除率,每秒钟分析数量≥2张;每台设备每天处理≥5万张,剔除准确率≥98%,实现证据采集标准化,证据剔除自动化,流程监管常态化,助力全国各地交管部门开启智慧执法新时代.1.4智慧交通的三大应用场景1.4智慧交通的三大应用场景1.4智慧交通的三大应用场景1.4智慧交通的真实案例极视角公司智慧交通案例:【客户痛点】违法取证数据量每年几何级数的增长,传统人工审核工作量庞大。废片率高,审核效率低下。【算法要求】极视角算法自适应强,可兼容市面主流厂商违法取证设备拍摄的图片数据,且具有异常自愈功能,针对异常情况自动重启算法,保障长效稳定运行【运营成效】Part02智慧零售2.1智慧零售的概念智慧零售的核心是以消费者为中心的零售活动的生态化,生产设计、物流仓储、集中采购、场景售卖、服务活动、经营管理、资金流转等环节都逐渐融入数据化和智能化的平台,最终达到零售商效益优化,消费者体验优化,实现万物互联、智能决策的自主商业。2.1智能定价、选品[选品]就是通过数据分析选出哪些商品或者哪些型号,应该进货,或值得生产.[定价]就是通过数据分析决定每一件商品的最合适的出厂价格或零售价格。监测竞品的系列商品价格波动,判断是否有降价营销行为。通过计算机和大数据智能开展的选品和定价,对生产商和零售商都是强有力的“武器”。计算机系统定期自动地推荐进货商品和更新建议价格,可以帮助对己方产品和市场竞品在功能、价格、销售情况等方面有实时和全面的掌握,以期及时地调整市场定价策略,使产品在市场上随时保持着竞争优势2.2智慧选址科学选址根据区域内核心人群分析进行基于数据的选址决策,脱离单纯的主观经验判断。且实时方案,即对该区域的人口属性、客户画像进行动态捕捉,实时更新。智慧选址是通过机器学习与建模,为新店选址提供决策。其主要功能包括:通过一段时间(一周、半个月、一个月)内不同时间段人口热力分布,进行热力图打分,了解各店面人流综合值;选定人群(按年龄、性别、收入、职业、支付偏好划分)的某段时期不同时间段客流热力图区域评分,划定目标区域;比对现有门店数量及潜在客户区域,提供可以增开门店的热区建议。2.3智慧零售系统智慧零售AI解决方案,基于算力服务器、前端采集摄像头等基础设施,将视频流进行图像处理,并对算法进行管理、迭代,通过应用客流统计、行为识别等多种AI算法,实现门店智能监控,帮助改善经营策略,优化人员配置。如极视角公司案例。2.4智慧选址科学选址根据区域内核心人群分析进行基于数据的选址决策,脱离单纯的主观经验判断。且实时方案,即对该区域的人口属性、客户画像进行动态捕捉,实时更新。智慧选址是通过机器学习与建模,为新店选址提供决策。其主要功能包括:通过一段时间(一周、半个月、一个月)内不同时间段人口热力分布,进行热力图打分,了解各店面人流综合值;选定人群(按年龄、性别、收入、职业、支付偏好划分)的某段时期不同时间段客流热力图区域评分,划定目标区域;比对现有门店数量及潜在客户区域,提供可以增开门店的热区建议。2.4智慧零售应用案例——美团大脑美团NLP中心开始构建大规模的餐饮娱乐知识图谱——美团大脑,它将充分挖掘关联各个场景数据,用AI技术让机器“阅读”用户评论数据,理解用户在菜品、价格、服务、环境等方面的喜好,挖掘人、店、商品、标签之间的知识关联,从而构建出一个“智慧大脑”。Part03智慧安防3.1智慧安防的概念智慧安防是基于泛在监控、泛在网络和泛在计算技术实现全域监控、智能预警、防范和高效应急救援功能为一体的综合实时智能安防体系。基于AI视觉分析技术,支持对已有摄像头改造升级,通过部署AI视觉算法,对人、车、物、环境等不安全行为或状态进行24小时智能化监控,可联动多系统与硬件设备,统一集中管理,主动识别预警,防患于未然3.2智慧安防相关技术算法、算力、数据作为智慧安防发展的三大要素。在产品落地时主要体现为视频结构化(对视频数据的识别和提取)、生物识别(指纹识别、人脸识别)等、物体特征识别(车牌识别系统)。视频结构化生物识别物体特征识别生物识别技术通过结合计算机、光学、声学、生物传感器和生物统计学原理等高科技手段,将人体的生理或行为特征收集起来,进行数字化处理,并与数据库中的特征模板进行比对,以确定个体身份。视频结构化技术通过对视频内容进行时空分割、特征提取和对象识别,将非结构化的视频数据转化为有意义的文本或可视化图形信息。通过分析监控视频中的行人、车辆等目标,为公安实战提供有价值的情报。物体特征识别通常包括图像预处理、特征提取、分类器设计等步骤,以提高识别的准确性。物体特征识别在多个领域得到广泛应用,如人脸识别、自动驾驶、智能安防等。3.3智慧安防应用随着AI技术在安防领域中的大规模应用,基于检测、跟踪、识别三大主流方向,绝大部分安防产品都有落地的使用场景。从目前发展情况来看,智慧安防产业发展趋向于两极化:更加偏重于宏观的智慧城市大安防化与更加侧重于微观的民用服务微安防化,较为典型的是公安、司法和监狱等警用场景和日常贴近生活的民用场景。以海康威视2017年破获某个抢劫案为例,从大量的视频图像中找到嫌疑人,需要对来自500多个监控点的长达250个小时的视频进行分析,如果采用人力查阅,至少需要30天时间,但如果采用基于深度学习的视频分析技术,仅需不到5秒。根据国家统计局数据,从2012年起,依靠智能视频监控系统,公安受理和查处的案件数量都有大幅度减少,预警维稳成效显著。而在破获案件精度和效率方面,AI技术让安防精度趋近100%,但因为外界因素误报率难以达到0;3.4智慧安防产业情况智慧安防在社会有着广泛应用,图2-13所示智慧安防产业。对于场景划分可以按照警用需求划分为“点”“线”“面”“后台”四个维度的布防,主要特点是利用智慧安防产品在识别和分析上的优势,做到预警和管控。智慧交通、智慧园区、智能楼宇、平安城市。3.5智慧安防应用企业案例3.6智慧安防发展历程【拓展】2009年,AI技术开始在多行业初步应用,其中,安防监控是AI最先大规模产生商业价值的领域,也成为许多AI技术研发公司的切入点。2005年开始的平安城市建设,到2011年启动的智慧城市建设,以及后续提出的“天网工程”“雪亮工程”等安防重点项目,AI在安防领域中不断渗透,智能安防产品运用于实体事件的需求。现阶段,传统安防企业和智慧安防领域新兴公司都开始注重安防产品在城市建设上的应用。Part03智慧政务4.1智慧政务概念党的二十大报告指出,“坚持把发展经济的着力点放在实体经济上,推进新型工业化,加快建设制造强国、质量强国、航天强国、交通强国、网络强国、数字中国。”目前通用的智慧政务的架构方案不仅包括基础网络部署,更涵盖了立体安全规划、政务云计算建设、政府协同办公在内的方方面。4.2智慧政务关键技术云计算:云计算提供了可伸缩的计算资源和数据存储,是智慧政务的基础平台。通过构建政务云,政府能够实现跨部门、跨地区的资源共享与协同办公,提高行政效率。例如,上海市电子政务云架构就包括政务云管理体系、安全体系以及大数据框架,实现了从基础设施到业务应用的全方位支持。大数据:大数据分析技术在智慧政务中主要应用于数据采集、治理和共享。通过整合各类政务数据,建立统一的数据平台,政府能够进行精准管理和服务。例如,全国一体化大数据中心便归集了来自不同部门和地区的数据,通过模型算法加工形成主题库,最终用于政务决策和应用。物联网:泛在物联网技术实现了全域全量数据采集。通过部署各种传感器和终端设备,政府可以实时监控和管理城市设施、交通、环保等各个方面,提升城市治理水平。例如,智慧城市服务中的各种便民功能,如生活缴费、预约挂号等,。人工智能:人工智能技术在智慧政务中的应用主要包括语音识别、人脸识别、自然语言处理等。这些技术不仅提高了服务的响应速度和准确性,还通过自学习和自适应能力,不断提升政务服务质量。例如,深圳市宝安区行政服务大厅利用5G技术,实现了远程视频办理和智能机器人服务,大幅提升政务服务的智能化和便捷性。区块链:区块链技术在智慧政务中主要用于数据可信共享交换和统一身份认证。它通过分布式账本和加密技术,确保数据的安全和可靠流通,有效解决了信息孤岛问题。例如,北京市目录区块链系统利用区块链技术管理全市各部门的数据资源,实现了数据“盘得清”、“管得住”、“用得好”的目标。4.2智慧政务应用场景--智能办公智能办公系统对公务员的办公行为有记忆功能,能够根据公务员的职责、偏好、使用频率等,对用户界面、系统功能等进行自动优化。智能办公系统有自动提醒功能,如代办件提醒、会议通知提醒等,公务员无须查询就知道哪些事情需要处。虚拟政务助理。虚拟政务助理是一种对人们的需求有深层理解且功能强大的软件应用。虚拟个人助理通过人为命令或主动发现人的需求,经过全面分析,执行最能满足需求的服务,将人类从杂事中彻底解放出来。目前市场上成熟的产品有华为小艺、苹果Siri等。智能会议。政府由于其工作的特殊性,重大事项均需要靠开会来集思广益、集体决策和安排部署,开会是政府工作人员的一项必备工作。以往政府会议通知需要靠人工电话一一通知确认,靠人工进行会议记录并形成会议纪要,耗时耗。而人工智能就能提供一个高效的解决方案:选定会议主题和参加人员以后,虚拟会议助理将第一时间主动联系会议参加人员确认是否参加会议,会议开始则自动接通视频会议以及拨通远程参会人员电话。会议进行中,虚拟会议助理自动将语音转化为文字记录,并辅助政府工作人员生成会议纪要4.2智慧政务应用场景智能监管-湖南智慧政务区块链科技有限公司的不动产监管案例。2021年4月,国家税务总局发票电子化改革(金税四期)工作领导小组办公室下发《关于开展税务区块链应用验证试点工作通知》(税总金四便函〔2021〕28号),明确湖南娄底为全国不动产业务场景4个试点地区之一。在总局统一指挥下,探索将区块链技术深度应用到房地产交易生命周期全环节,大幅度缩短不动产交易办理时间,显著改善营商环境。4.2智慧政务应用场景智能监管-湖南智慧政务区块链科技有限公司的数字民政平台。按照“精细、精准、精确”识别要求,建立基于区块链底层平台的民政信息交互平台,实现民政部门与劳动、财税、工商、住建、公安、车管、金融管理等部门信息的比对,解决低贫困户家庭收入核实难的问题、防止“骗吃低保”等不公平现象的出现。
【课堂练习与讨论】(1)人工智能如何赋能智慧交通?(2)人工智能给旅游行业带来了哪些巨大变革?(3)智能时代来临,金融领域将迎来哪些变化?(4)你了解哪些智慧零售的具体案例?(5)智慧安防的主要技术有哪些?(6)你认为目前我国智慧政务建设存在什么问谢谢THANKS第三章
机器学习
《人工智能应用概论(第2版)》RengongZhinengYingyongGailun
Part0101机器学习概念Part0202机器学习的工作原理及算法Part0303机器学习分类目
录contentPart01机器学习概念
【课程导入】人类学习与机器学习相同与相异1.1机器学习的定义机器学习是一门多学科交叉专业,涵盖概率论知识、统计学知识、近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。机器学习已广泛应用于数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序语音和手写识别、游戏和机器人等领域。1.2机器学习的原理机器学习与人类学习模式相似,如古代诸葛亮夜观天象实现草船借箭、牛顿被苹果砸发现“万有引力”、中国古人发现自然规律的“二十四气节”,春耕秋收。机器学习是一种使计算机能够从数据中学习并做出决策的技术。它通过训练模型来识别数据中的模式和规律,从而实现对未知数据的预测和分类。如人脸识别、猫狗识别、农作物病虫害识别、电路版上瑕疵识别等。1.3机器学习的地位机器学习在人工智能学科体系,乃至计算机科学体系中都占有举足轻重的地位。1.4机器学习的发展历程机器学习发展过程也是人工智能发展的过程,从IBM西洋跳棋人机PK到深度学习神经网络谷歌的阿尔法狗,再到最近的Ai大模型出现。1.5机器学习的分类机器学习是一个比较宽泛的概念,主要包括监督学习、无监督学习、强化学习等。1.6机器学习的算法分类Scikit-learn是机器学习领域中最知名的Python库之一,在学习机器学习的过程中,必绕不开Scikit-learn。Scikit-learn提供了一幅清晰的路线图给大家做算法选择。1.7【课堂练习】【课堂思考】简述机器学习与人类学习有什么相同之处?Part02机器学习的工作原理及算法2.1线性回归算法线性回归算法是一种通过属性的线性组合来拟合图中的点,找到一条直线或者一个平面或者更高维的超平面,使得预测值与真实值之间的误差最小化。线性回归的基础概念涉及到统计学和机器学习领域,它利用称为线性回归方程的最小平方函数对一个或多个自变量和一个因变量之间的关系进行建模。2.1线性回归算法【案例】探索学习时长与分数之间的关系。某门课程中学生学习时长(天数)与期末考试分数统计表如表3-2所示。【问题】找出一根线拟合图中的点2.1线性回归算法(1)拟合图中的点有无数条直线,哪条直线是最好拟合图中的点。(2)计算出每个点分别到每条线上的误差之和(3)误差最小的就是最佳的拟合线,该线就是我们的要找的线(方程),该方程是我们的模型。2.2K最近邻分类算法K最近邻(k-NearestNeighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:在特征空间中,如果一个样本附近的k个最近(即特征空间中最邻近)样本的大多数属于某一个类别,则该样本也属于这个类别。如果K=3,绿色圆点的最近的3个邻居是2个红色小三角形和1个蓝色小正方形,少数从属于多数,基于统计的方法,判定绿色的这个待分类点属于红色的三角形一类。如果K=5,绿色圆点的最近的5个邻居是2个红色三角形和3个蓝色的正方形,还是少数从属于多数,基于统计的方法,判定绿色的这个待分类点属于蓝色的正方形一类。2.2K最近邻分类算法
【做一做】使用无监督学习对10000篇新闻报到分析,对其新闻内容特征进行提取,K1科技类、游戏类K2、汽车类K3。请问下黑色点是属于哪个区域?属于哪些新闻?如何分析K1K2K3?2.3决策树算法决策树分类算法的关键就是根据“先验数据”构造一棵最佳的决策树,用以预测未知数据的类别。决策树是一个树结构(可以是二叉树或非二叉树)。其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果。信用等级决策树算法模型2.4支持向量机SVM算法SVM想要的就是找到各类样本点到超平面的距离最远,也就是找到最大间隔超平面。【案例】使用SVM算法完成水果识别分类。比如红色表示“苹果”,黄色表示“猕猴桃”,那么如何找到一个平面最大化的将两类群体分开,如右图所示,分开有很多种方式,左侧也可以分开,右侧也能分开。但明显的,右侧会“分的更开”,因而如何寻找到这样的一个空间平面,让标签项各类别最为明显的分开,此算法过程即为支持向量机。将点分开时,离平面最近的点要尽可能的远,比如右侧时A点和B点离平面最近,那么算法需要想办法让该类点尽可能地远离平面,这样就称为“分的更好”。左侧时挨着平面最近的两个点离平面太近,所以右侧的分类更好。SVM算法完成水果识别分类2.4支持向量机SVM算法SVM想要的就是找到各类样本点到超平面的距离最远,也就是找到最大间隔超平面(多维)。Part03机器学习分类3.1监督学习【知识回顾】机器学习是一种使计算机能够从数据中学习并做出决策的技术。它通过训练模型来识别数据中的模式和规律,从而实现对未知数据的预测和分类。监督学习(supervisedlearning)是机器学习的一类,给机器学习的训练数据打上标签。房价预测模型:是根据房子的特征来预测房子价格。收集10个房子样本,样本的特征包括有地区、房子大小、年龄等共13个特征,10个房子的房价,作为标签。先将房子13个特征和标签作为值,放入SVM或者决策树算法,由电脑来计算,计算误差最小的方程。我们把这个过程称为监督学习。3.1监督学习监督学习分为回归和分类。回归的预测结果是连续性的,比如房价预测、路程花费时间预测、股价走势预测。监督学习分为回归和分类。分类的预测结果是离散的,比如肿瘤是良性/恶性,邮件是垃圾邮件/非垃圾邮件,天气时好还是坏。3.2无监督学习无监督学习是机器学习中的一种重要方法,与监督学习相对应。它的目标是从无标签的数据中发现隐藏的结构和模式,而不需要预先定义的目标变量。无监督学习的核心思想是通过对数据的统计特性和相似性进行分析,来发现数据中的潜在结构和模式。无监督学习可以分为两类问题:聚类和降维。聚类问题是将数据分成不同的组或簇,使得同一组内的数据相似度高,不同组之间的相似度低。降维问题是将高维数据映射到低维空间,以减少特征维度和数据复杂性。3.2无监督学习电商平台对客户的浏览痕迹、购买数量等特征进行学习分类。Google新闻按照内容结构的不同分成财经,娱乐,体育等不同的标签,这就是无监督学习中的聚类3.3强化学习在强化学习中,智能体(Agent)与环境(Environment)交互,智能体根据环境状态进行决策并执行动作,环境根据智能体的动作给予奖励或者惩罚。强化学习目标是让智能体学习到最优策略,使得累积奖励最大化。强化学习的原理五子棋人机博弈谢谢THANKS第四章
神经网络与深度学习
《人工智能应用概论(第2版)》RengongZhinengYingyongGailun
Part0101神经网络与深度学习概念Part0202
深度学习原理目
录contentPart0303卷积神经网络
【课程导入】现实中,我们的大脑接收眼睛或耳朵传递来的数据(输入源),会通过一层层的神经元去解析数据(神经元),然后得到我们对于所见的判断(输出源)。对整个实现过程的抽象理解如图4-2所示Part01神经网络与深度学习概念4.1.1生物神经元(Biologicalneuron)人工神经网络是受到人类大脑结构的启发而创造出来的。生物神经元是神经系统的基本功能单元,负责接收、处理和传递信息。人类大脑中包含大约860亿个神经元,它们通过复杂的网络相互连接,实现各种神经功能。生物神经元的结构包括细胞体、树突、轴突和突触。以下是具体介绍:细胞体:细胞体是神经元的主要部分,包含细胞核、细胞质和细胞膜。它是神经元的代谢中心,维持细胞的生命活动。树突:树突是从细胞体向外延伸的分支纤维,主要作用是接收来自其他神经元的信号。一个神经元可以有多个树突,这使得神经元能从多个源头接收信号。轴突:轴突是一条长的纤维,从细胞体延伸出来,负责将信号从细胞体传递到其他神经元或组织。一个神经元只有一个轴突,其长度可从几微米到一米不等。突触:突触是神经元之间传递信息的连接点,通常是轴突末端与其他神经元的树突或细胞体相接触的部分。在这里,神经递质被释放,从而将信号从一个神经元传递到另一个神经元。4神经网络是一种模拟人脑神经元结构的计算模型。人工神经网络(ANN)由神经元(圆圈)和权重w(直线)两部分组成,分为输入层、隐藏层、输出层。其中,输入层相当于输入元,隐藏层相当于人工神经网络输出层相当于输出源。三层之间的神经元相互连接,和权重组(w1,w2)经过前向算法和反馈算法的数学运算,最终将结果以“激活码”的方式输出,这与生物(人类)神经元中的突触十分相似。输入层是神经网络与外界数据的接口,负责接收并传输输入数据到网络中。隐藏层通过非线性变换和特征提取来加工输入数据。输出层将神经网络的处理结果转换为外界可以理解的格式。4.1.2人工神经网络(ArtificialNeuralNetworks)4神经网络是深度学习的基础,而深度学习是神经网络的一种特殊形式。深度学习是一种特殊的机器学习方法,采用多层神经网络来学习数据的高级特征。每一层网络都从前一层的输出中提取更复杂的信息,如自动驾驶。4.1.3深度学习(DeepLearning)如:自动驾驶中,将摄像头、雷达、GPS、速度数据集放入到输入层,经过多层神经网络层计算,最终输出层输出方向、刹车、加速参数,实现自动驾驶的效果。4八大深度学习神经网络:CNN卷积神经网络(图像识别与分类)、RNN循环神经()、GAN对抗神经网络(生成式AI,生成新图片)、LSTM长短期(天气预测)、Transformer神经网络(自然语言处理)。4.1.3深度学习(DeepLearning)4传统机器学习和深度学习算法的主要区别在于特征。传统机器学习算法中,我们需要手工编码特征;在深度学习算法中,特征由算法自动完成,但耗时且需要海量数据。4.1.4深度学习(DeepLearning)与机器学习Part02神经网络技术原理4感知器,也可翻译为感知机(神经元),是FrankRosenblatt在1957年就职于Cornell航空实验室时所发明的一种人工神经网络,被视为一种最简单形式的前馈式人工神经网络,是一种二元线性分类器。工作机制:输入层I*W(I1*W1+I2*W2+I3*W3+......)求和sum,将sum放入到f(X)激活函数,如果大于阈值T则为1,否则为0。如使用感知层识别西瓜和香蕉。4.2.1感知机模型-单层感知层1.假设西瓜和香蕉都仅有两个特征(feature):形状和颜色,特征x1代表输入颜色,特征x2代表形状;2.进一步简化,我们把权重w1和w2默认值都为1,阈值θ(亦称偏值——bias)设置为0;3.感知器输出为“1”,代表判定为“西瓜”,而输出为“0”,代表判定为“香蕉”4多层感知机(MLP,MultilayerPerceptron)除了输入输出层,它中间可以有多个隐层。最简单的MLP只含一个隐层,即三层的结构,层与层之间是全连接的。输入层是神经网络与外界数据的接口,负责接收并传输输入数据到网络中。隐藏层通过非线性变换和特征提取来加工输入数据。输出层将神经网络的处理结果转换为外界可以理解的格式。4.2.1感知机模型-多层感知机44.2.2深度神经网络(DeepNeuralNetworks)【深度学习工作原理】深度学习是不停更改实验因素的参数,让预测值接近真实值的过程。深度学习的过程首先是输入层接收数据,经过隐藏层的前向算法(数据变换)得到一个预测值,预测值与真实目标值代入损失函数,使用反馈算法计算出最小的损失值,然后把损失值放入优化器中来有方向性地更改权重值,这样就完成了一次学习过程。不断循环以上过程更改参数,让预测值接近真实目标值,这就是深度学习的过程。44.2.3深度学习核心算法-前向传播前向传播用来计算预测值y。在神经网络中,信息从上一个神经元直接流转到下一个神经元,直到输出,最终得到在当前参数下的损失函数的过程,称为前向传播算法。(类似学生做试题写答案)44.2.3深度学习核心算法-反向传播算法反向传播算法是计算预测输出与真实标签之间的误差。反向传播是一种基于微积分中链式法则的算法,用于计算神经网络中各层权重和偏差的梯度。其核心思想是从输出层开始,逐层向输入层逆向传播误差,并计算每个参数的梯度。这一过程利用了前向传播中保存的中间结果,避免重复计算,提高了训练效率。44.2.3深度学习核心算法-梯度下降梯度下降的过程可把求解损失函数最小值的过程看成“站在山坡某处去寻找山坡的最低点”。我们并不知道最低点的确切位置,梯度下降的策略是每次向“下坡路”的方向走一小步,经过长时间地走“下坡路”,最后停留的位置也大概率在最低点附近。我们选这个“下坡路”的方向为梯度方向的负方向,因为每个点的梯度负方向是在该点处函数下坡最陡的方向,如图4-7所示。在计算出梯度后,使用梯度下降算法更新网络参数。更新规则为:新参数=旧参数-学习率*梯度,使得每次更新的参数其误差缩小最快。44.2.4深度学习应用场景-信贷场景下客户信用评分信贷评分卡模型(见图4-8)是当前最常见的金融风控手段之一,在信贷场景下客户贷前申请、贷中调额、贷后催收等贷款生命周期的主要环节中已经被普遍应用。它主要是根据客户的各种属性和行为数据,建设信用评分模型,基于模型判断是否给予授信以及授信的额度,从而识别和减少金融业务中的交易风险。在对客户进行信用评分时,核心难点在于突发事件等因素可能导致模型效果不稳定,因此需要能有效快速进行模型自迭代的完整循环。输入客户特征数据违约1/不违约0CHiME-6被称为“史上最难的语音识别任务”4深度学习在图像和物体识别方面的能力远远超过了人类CHiME-6“史上最难的语音识别任务”科大讯飞多场景语音识别大赛上夺冠。4.2.4深度学习应用场景CHiME-6被称为“史上最难的语音识别任务”4深度学习可以应用到医疗临床检测与诊断各个环节中4.2.4深度学习应用场景CHiME-6被称为“史上最难的语音识别任务”4深度学习加速推进智慧城市建设4.2.4深度学习应用场景Part03卷积神经网络卷积神经网络通过卷积、激活、池化等操作层层递进地处理图像数据,最终通过全连接层输出结果。这种结构使得CNN在计算机视觉等领域表现出色,成为深度学习的重要工具。4.3.1深度学习经典网络-卷积神经网络卷积层是完成图像特征提取池化层是图像降维(32*32像素
降维到5*5)全连接层是图像分类将图片8放入输入层经过Layer1卷积层提取图片特征经过Layer1池化层图片降维14*14经过Layer2卷积层提取图片特征经过Layer2池化层图片降维5*5经过全连接神经网络层完成图片分类,最终输出预测值y‘。卷积神经网络通过卷积、激活、池化等操作层层递进地处理图像数据,主要是特征提取。最终通过全连接层输出结果。这种结构使得CNN在计算机视觉等领域表现出色,成为深度学习的重要工具。4.3.2深度学习经典网络-卷积层卷积神经网络特征提取池化层在卷积神经网络(CNN)中的主要作用是通过降低特征图的空间维度来减少参数数量和计算量,同时保留重要信息以增强特征的不变性。池化层方式有2*2最大池化、2*2平均池化、2*2随机池化。4.3.3深度学习经典网络-池化层全连接层在卷积神经网络(CNN)中的主要作用是将前层(如卷积层和池化层)提取的特征进行整合,并将这些特征映射到样本标记空间,从而实现分类或回归任务。全连接层通常位于CNN的最后几层,每个神经元都与前一层的所有神经元相连。4.3.4深度学习经典网络-全连接层全连接层Part03神经网络模型TensorFlow是谷歌推出的深度学习开源框架,并且发布了TensorFlow游乐场。有了TensorFlow游乐场,我们在浏览器中就可以训练自己的神经网络,还有好看的图像让我们更直观地了解神经网络的主要功能以及计算流程。/4.4.1TensorFlow游乐场TensorFlow游乐场的左侧提供了四个不同的数据集(见图4-10)来测试神经网络。每组数据,都是不同形态分布的一群点,如图4-11所示,分别为高斯分布(Gaussian)、异或(XOR)、圆形(Circle)、螺旋形(Spiral),每一个点都自带两个特征.4.4.2数据集输入层隐藏层输出层训练次数神经网络训练流程图。初始化神经网络,使用前向传播获得预测值,使用反向传播更新变量,是否达到目标,如果不达到,则继续训练,一次类推。直到训练次数结束。4.4.3训练过程谢谢THANKS第五章
智能语音
《人工智能应用概论(第2版)》RengongZhinengYingyongGailun
Part0101智能语音介绍Part0202智能语音技术应用Part0303智能语音体验目
录content[课程导入】“智能问答机器人”基于深度学习的自然语言处理(NLP)技术,帮助提升客服体验及服务效率,实现24小时无须等候智能服务,通过上下文多轮问答,实现用户问题解决率超90%;“AI外呼机器人”通过自研语音技术(TTS)的植入,实现个性化拟人声音服务,人机交流更亲切自然;【思考题】机器是如何实现识别人类说话,将语音转换成文字的?Part01智能语音介绍5.1智能语音技术概况除了语音导航、智能音箱、语音输入法等我们日常生活中的常见应用场景,只要把语音识别理解成“获取人类语言中的信息”,把语音合成理解成“让人类通过声音获取信息”,再把声纹识别、关键词唤醒等理解成可供选择的“功能”,将它们与不同载体、场景结合,就会形成各种各样的产品。5.1.1语音识别语音识别让机器识别人说出的话,即将语音转换成相应的文本内容(见图5-1),然后根据内容信息执行人的某种意图。语音识别又称言语识别,这项任务涉及将输入声学信号与存储在计算机内存的词表(语音、音节、词等)相匹配,而匹配个别语词的标准技术则要用输入信号与预存的波形(或波形特征/参数)相比较(模型匹配),相当于给机器装上了“耳朵”。5.1.1语音识别语音识别让机器识别人说出的话,即将语音转换成相应的文本内容(见图5-1),然后根据内容信息执行人的某种意图。语音识别又称言语识别,这项任务涉及将输入声学信号与存储在计算机内存的词表(语音、音节、词等)相匹配,而匹配个别语词的标准技术则要用输入信号与预存的波形(或波形特征/参数)相比较(模型匹配),相当于给机器装上了“耳朵”。5.1.1语音识别语音识别系统本质上是一种模式识别系统,包括特征提取、模式匹配、参考模型库等三个基本单元,它的基本结构如下图所示:5.1.1语音识别声学模型在进行语音识别之前我们要做不少准备工作。先用大量声音数据训练一个声学模型(见图5-3),用来将声音转换为声学符号。我们将要识别的语音按照一定时间间隔切割成彼此重叠、很小很小的段落,再通过声学模型将这些小片段识别成对应的语音状态。这些语音状态是声母、韵母的组成部分,能很好地对语音进行描述。5.1.1语音识别语言模型(LanguageModel,简称LM)是一个用于建模自然语言(即人们日常使用的语言)的概率模型。简单来说,语言模型的任务是评估一个给定的词序列(即一个句子)在真实世界中出现的概率。5.1.2语音合成语音合成(TexttoSpeech,TTS)技术,又称文语转换技术,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴(见图5-6)。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,即让机器像人一样开口说话。5.1.3声纹识别人们可以靠声音判断对方是谁,声音同样可以被用来证明“你是你”.和面容、指纹一样,人类的发声器官千差万别,发出的声音也不尽相同(见图5-10)。人声的这种特质被称为声纹(见图5-11)。5.1.3声纹识别事实上,录制和播放的过程会让声音衰减失真,与真人的声音相差甚远,很容易鉴别。或者干脆从产品设计层面出发,要求用户在规定时间内说出一组随机数字,或者与人脸识别、指纹识别等其他识别手段相结合,从而提升安全性(见图5-15).Part02智能语音技术应用5.2智能语音技术应用除了语音导航、智能音箱、语音输入法等我们日常生活中的常见应用场景,只要把语音识别理解成“获取人类语言中的信息”,把语音合成理解成“让人类通过声音获取信息”,再把声纹识别、关键词唤醒等理解成可供选择的“功能”,将它们与不同载体、场景结合,就会形成各种各样的产品。5.2.1酒店虚拟前台酒店前台工作人员每天都要拨打和接听大量的电话,经常出现接打不及时、处理问题没耐心、影响现场接待和客房周转等问题。基于人工智能技术的酒店虚拟前台可以实现前台电话智能接打,能够自动完成酒店的到店确认、退房确认、咨询和客需服务等工作,可同时接打多人电话,瞬间完成业务处理,实现全程无人化,带来高效智能的前台服务,从而提升前台业务效率,提高客房周转能力,解决人手不足和成本攀升等问题。5.2.2语音质检考虑到复杂业务处理或客户习惯喜好,目前仍配有人工客服接打客户电话,而为了提升客户服务水平,往往需要进行语音质检。传统的质检是采用人工抽检方式,质检覆盖率低且无法准确定位问题工单。人工听录音的质检方式,需要长时间集中精力,听取大量的无效信息,导致成本高,效率低,工作强度大。同时大量未质检的工单中的有效内容如客户诉求信息、服务信息等未能得到充分挖掘利用。而借助智能语音技术可大幅提高质检效率,充分发挥电话数据价值。5.2.3智能音箱酒店场合下的公共设施的操作可以采用语音控制来避免接触。5.2.4智能音箱智能音箱不仅是音箱,还是新一代的人机交互入口。它以蓝牙音箱的形式集播放网络音乐、查询各类信息、语音娱乐互动甚至控制智能家电等功能于一身。Part03智能语音体验5.3.2语音合成国内外不少人工智能头部企业建设了自己的人工智能开放平台,供外部使用。如科大讯飞的讯飞开放平台(见图5-26)、百度的百度AI开放图5-26讯飞开放平台“语音合成”测试界面平台(见图5-27)、阿里云的阿里灵杰平台(见图5-28)等。请大家访问这三家企业的人工智能开放平台,比较三家平台的“语音合成”AI能力实现效果。5.2.3探索与思考(1)在讯飞输入法中说古诗、说文言文、说当下流行语,观察其识别率如何。从声学模型和语言模型角度思考,语音识别准确率与哪些因素相关?(2)在使用讯飞输入法进行语音输入时,距离手机麦克风远近、周围环境安静程度对语音识别率有多大影响?除此,还有哪些外在环境因素会影响识别率?(3)讯飞输入法支持的方言里,有没有你家乡的方言?若增加一种方言,你认为可能要做哪些工作?(4)我们在运用语音合成技术时,除了法律法规之外,还应该遵守哪些道德规范?(5)除了本章介绍的智能语音技术,性别年龄识别、歌曲识别、对话情绪识别、语音审核等也是智能语音领域的技术。你能否结合你的专业对应的工作岗位,思考这些语音技术有哪些应用场景?(6)你认为智能语音交互会成为人机交互的主流方式吗?为什么?阅读延展谢谢THANKS第六章自然语言处理
《人工智能应用概论(第2版)》RengongZhinengYingyongGailun
Part0101自然语言处理概论Part0202自然语言处理技术原理
Part0303自然语言处理的应用场景
目
录contentPart0404自然语言处理的典型实践案例【案例导入】打开翻译软件,将中文“三人行,必有我师焉”翻译成英文,看看哪家的翻译效果更好。Part01自然语言处理概论6.1.1自然语言处理定义自然语言处理(NaturalLanguageProcessing,NLP)研究的是能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。而用自然语言与计算机进行通信,有着十分重要的实际应用意义,也有着革命性的理论意义。实现人机间自然语言通信意味着要使计算机既能理解自然语言文本的意义,又能以自然语言文本来表达给定的意图、思想等;前者称为自然语言理解,后者称为自然语言生成。自然语言处理主要应用于机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、中文OCR等方面。6.1.2自然语言处理发展历程1950年,图灵提出了著名的“图灵测试”,这一般被认为是自然语言处理思想的开端。20世纪50年代到70年代,自然语言处理主要采用基于规则的方法。研究院认为自然语言处理的过程和人类学习认知一门语言的过程是类似的,所以他们基于这个观点来进行研究。这一阶段虽然解决了一些简单的问题,但是无法从根本上将自然语言处理实用化。20世纪80年代以后,贾里尼克和他所在的IBM华生实验室是推动这一转变的关键,他们采用基于统计的方法,将当时的语音识别率从70%提升到90%,从实验室走向实际应用。从2008年到现在,引入深度学习来做自然语言处理研究,由最初的词向量到2013年的word2vec,将深度学习与自然语言处理的结合推向了高潮,并在机器翻译、问答系统、阅读理解等领域取得了一定成功。RNN成为自然语言处理最常用的方法之一后,Transformer、BERT、GNN等模型相继引发了一轮又一轮的热潮。6.1.3自然语言处理未来展望1)更优的算法。人工智能发展的三要素(数据、计算能力和算法)中,与自然语言处理研究者最相关的就是算法设计。2)语言的深度分析。未来语言中的难题还需要关注语义理解,从大规模网络数据中,通过深入的语义分析,结合语言学理论,发现语义产生与理解的规律,研究数据背后隐藏的模式,扩充和完善已有的知识模型,使语义表示更加准确.语言理解需要理性与经验的结合,理性是先验的,而经验可以扩充知识,因此需要充分利用世界知识和语言学理论指导先进技术来理解语义。3)多学科的交叉。在理解语义的问题上,需要寻找一个合适的模型。在模型的探索中,需要充分借鉴语言哲学、认知科学和脑科学领域的研究成果,从认知的角度去发现语义的产生与理解,有可能会为语言理解建立更好的模型。在科技创新的今天,多学科的交叉可以更好地促进自然语言处理的发展。6.1.4自然语言处理整体体系Part02自然语言处理技术原理6.2.1自然语言处理整体框架自然语言处理整体框架:包括三部分内容信息、自然语言技术、知识库。其过程是(1)需要构建一个知识库,包含实体、概念及它们之间的关系。(2)通过自然语言模型来理解和处理文本数据。(3)根据知识库推理得出信息,实现问题回答、文本分类等功能。这一过程涉及数据预处理、特征提取和模型应用等关键步骤,旨在让计算机更好地理解人类语言。6.2.2自然语言处理技术从研究内容来看,自然语言处理技术包括语法分析、语义分析、篇章理解,机器翻译、语音识别及文语转换、信息检索、信息抽取与过滤、文本分类与聚类、舆情分析和观点挖掘等等.。6.2.3自然语言处理关键技术1-分词等分词、词性标注、句法分析、命名实体识别(1)分词模块负责将输入的汉字序列切分成单词序列,在该例子中经过分词的输出是“我/爱/自然语言处理”。(2)词性标注模块负责为分词结果中的每个单词标注一个词性,如名词、动词、形容词、连词、副词、标点符号等。(3)依存句法分析模块负责预测句子中单词与单词间的依存关系,确定句子的句法结构,包括主、谓、宾、定、补、状等,并用树状结构来表示整句的句法结构。(4)命名实体识别模块负责从文本中识别出具有特定意义的实体,如人名、地名、机构名、专有名词等。6.2.4自然语言处理关键技术2-消除语言歧义人类的语言多元且复杂,言语交流中同一个句子通常不止一种含义,自然语言处理的难题之一就是消除语言歧义(见图6-5),即消除如词法分析、句法分析、语义分析等过程中存在的歧义问题,简称消歧。6.2.4自然语言处理关键技术2-消除语言歧义第一,语言中充满了歧义,这主要体现在词法、句法及语义三个层次上。歧义的产生是由于自然语言所描述的对象——人类活动非常复杂,而语言的词汇和句法规则又是有限的,这就造成同一种语言形式可能具有多种含义。第二,消除歧义所需要的知识在获取、表达以及运用上存在困难。由于语言处理的复杂性,因此合适的语言处理方法和模型难以设计。从上述两个主要困难可以看出,自然语言处理这个难题的根源是人类语言的复杂性和语言描述的外部世界的复杂性。为解决语义歧义问题,目前常见的算法策略有基于贝叶斯分类、基于信息论、基于词典等消歧算法。消除语言歧义的基本过程如图6-6所示。图6-6消除语言歧义的基本过程6.2自然语言处理的应用场景自然语言理解和自然语言生成是自然语言处理的两大任务,如图6-7所示。接下来我们从这两大任务去了解自然语言处理的应用场景。Part03自然语言处理应用场景6.3.1应用场景自然语言理解(NaturalLanguageUnderstanding,NLU)和自然语言生成(NaturalLanguageGeneration,NLG)是自然语言处理的两大任务,如图6-7所示。接下来我们从这两大任务去了解自然语言处理的应用场景。6.3.2智能问答智能问答系统通常分为知识型机器人、闲聊型机器人和任务型机器人(客服机器人)。知识型机器人主要用于解决用户的问题,例如商品购买咨询、商品退货咨询等;闲聊型机器人主要用于深入地与用户进行无目的交流;任务型机器人(客服机器人)主要用于完成用户的某些特定任务,例如买机票、话费充值或者天气咨询。6.3.3智能写作近年自然语言处理模型性能的不断突破,促使其从规则、模板写作发展到了以神经网络模型为核心的智能写作,从辅助记者创作逐步走向自动化写作,应用场景也从模板化的资讯类数据报告,深入分析报告、诗歌创作、长故事文本创作、广告营销文本写作等更丰富、复杂的内容形式,贯穿信息监管、素材采集、文本编辑、文本创作、修改优化、敏感信息审核等多项业务环节。6.3.4文本情感分析情感分析作为一种常见的自然语言处理方法的应用,可以从大量数据中识别和吸收相关信息,而且可以理解更深层次的含义。例如:企业分析消费者对产品的反馈信息,或者检测在线评论中的差评信息等。通过情感分析,可以挖掘产品在各个维度的优劣势,明确如何改进产品。如对外卖评价进行情感分析,分析菜品口味、送达时间、送餐态度、菜品丰富度等多个维度的用户情感指数,从而从各个维度上改进外卖服务。6.3.4文本情感分析1、基于情感词典的情感分类方法先对文本进行分词和停用词处理等预处理,再利用事先构建好的情感词典,对文本进行字符串匹配,从而挖掘正面和负面信息。情感词典包含积极词语、消极词语、否定词、程度副词表四部分。6.3.4文本情感分析2、基于词典的文本匹配算法相对简单。遍历语句中分词后的词语,如果词语命中词典,则进行相应权重的处理。积极词语权重为加法,消极词语权重为减法,否定词权重取相反数,程度副词权重则和它修饰的词语权重相乘,如图6-9所示。利用最终输出的权重值,可以区分是积极、消极还是中性情感。6.3.5市场上较前沿的自然语言模型【OpenAI】ChatGPT(ChatGenerativePre-trainedTransformer)是OpenAI研发的一款聊天机器人程序,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够基于在预训练阶段所见的模式和统计规律来生成回答,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成写邮件、视频脚本、文案、代码、论文等任务。【科大讯飞】讯飞星火认知大模型是。该模型具有七大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模交互。该模型开放半年内用户数就高达上千万。2.文心一言文心一言是百度全新一代知识增强大语言模型,是文心大模型家族的新成员,能够与人对话互动、回答问题、协助创作,高效便捷地帮助人们获取信息、知识和灵感。【百度】文心一言从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势。开放首日,文心一言共计回复网友超3000万个问题。【腾讯】混元大模型腾讯混元大模型是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模,预训练语料超2万亿tokens,具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力。Part03自然语言处理的典型实践案例6.4.1聊天机器人ElizaEliza是最早的人机对话程序,是世界上第一个真正意义上的聊天机器人。下面我们来运行程序,体验和Eliza聊天。(1)按照如下网址,下载eliza.pyPython程序文件。(2)假定下载的文件放置在F盘的根目录。打开CMD窗口,进入F盘目录。(3)执行Python命令,运行eliza.py程序。(4)开始与Eliza聊天,如图6-11所示。【探索与思考】(1)拿出自己的手机,观察手机的哪些功能或者手机中哪款App的功能是与自然语言处理相关的;这些功能使用起来效果如何,还存在哪些不足?(2)“图灵测试”和“中文屋问题”都涉及机器的语言理解,试问这种语言理解和人类的语言理解是否一样?机器智能和生物智能有什么区别?(3)从“不管黑猫白猫,捉到老鼠就是好猫”的实用角度给人工智能下定义,即若某个程序做了和人相似的有智能的事,那它就具有智能。对于这样的定义,你是否接受?谢谢THANKS
第七章
知识表示《人工智能应用概论(第2版)》RengongZhinengYingyongGailunPart0101知识表示的概念及发展历程Part0202知识表示的各种方法Part0303知识表示的应用场景Part01知识表示的概念及发展历程
【课程导入】机场智能机器人的应用场景从该案例中可以看出,智能机器人理解客人所说的问题后,能够准确地把问题的解决方法展示给客人看。【思考题】机器为什么能够像人一样做出智能行为和逻辑判断呢?7.1知识的概念和特征1、相对正确性在一定的条件及环境下,知识是正确的。2、不确定性由于现实世界的复杂性,知识并不总是只有“真”与“假”这两种状态,在“真”与“假”之间还存在许多中间状态,即存在为“真”的程度问题。3、可表示性与可利用性知识可以用适当形式表示出来,如用语言、文字、图形、神经网络等,这样才能被存储、传播。每个人每天都在利用自己掌握的知识来解决各种问题。知识的特征知识的概念知识是人们在长期的生活及社会实践中、在科学研究及实验中,积累起来的对客观世界的认识与经验。人工智能的知识:“规则”——用“如果……,则……”表示的关联形式,反映了信息间的某种因果关系;“事实”——通过多个信息的关联,得出事物的客观特征。7.2知识表示的概念知识表示(KnowledgeRepresentation)就是将人类知识形式化或者模型化。知识表示的目的是让计算机储存和运用人类的知识。7.3知识表示的发展历程Part02知识表示的各种方法7.4知识表示的方法7.4知识表示的方法一阶谓词逻辑表示法是一种重要的知识表示方法,它以数理逻辑为基础,是到目前为止能够表达人类思维活动规律的一种最精准的形式语言。对事实性知识,一阶谓词逻辑表示法通常用合取符号(∧)和析取符号(∨)连接形成的谓词公式来表示。例如:对事实性知识“张三是学生,李四也是学生”,可以表示为:ISSTUDENT(张三)∧ISSTUDENT(李四)这里,ISSTUDENT(x)是一个谓词,表示x是学生。对规则性知识,一阶谓词逻辑表示法通常用蕴涵符号(→)连接形成的谓词公式(即蕴涵式)来表示。例如:对于规则“如果x,则y”,可以用下列的谓词公式表示:x→y7.4知识表示的方法(3)根据所要表达的知识的语义,用适当的连接符号将各个谓词连接起来,形成谓词公式。user(Li,201),user(Wang,202),user(Zhao,203),user(Zhang,204)
→telephone(590,201),telephone(591,202),telephone(592,203)telephone(593,204)(1)定义谓词及个体,确定每个谓词及个体的确切含义。租户:user。电话号码:telephone。(2)根据所要表达的事物或概念,为每个谓词中的变元赋以特定的值。租户与对应的房号:(Li,201),(Wang,202),(Zhao,203),(Zhang,204)。房号与对应的电话号码:(590,201),(591,202),(592,203),(593,204)人类智能可识别的知识一阶谓词逻辑表示法进行知识表示的过程人工智能可识别的知识表示7.4知识表示的方法产生式表示法适合表示规则性知识和事实性知识。P→Q或者:IFPTHENQ如果前提P被满足,则可推出结论Q或执行Q所规定的操作。格式含义举例1:表示规则性知识举例2:表示事实性知识7.4知识表示的方法框架表示法:框架是一种描述对象属性的数据结构。格式举例1:表示教师的数据结构举例2:表示教职工的数据结构7.4知识表示的方法框架表示法之框架网络:用框架名作为槽值,建立框架间的横向联系,用继承槽建立框架间的纵向联系。像这样具有横向与纵向联系的一组框架称为框架网络。框架网络示例如下图所示。框架系统中求解问题的核心思想是匹配与填槽。小结:框架表示法的基本过程框架表示法7.4知识表示的方法“动物能吃、能运动;鸟是一种动物,鸟有翅膀、会飞;鱼是一种动物,鱼生活在水中、会游泳”。“狗能吃,会跑”语义网络表示法多元关系网络知识含义一元关系网络知识含义7.4知识表示的方法可表示事件和动作的语义网络可表示情况和动作的语义网络“小黑这只燕子从春天到秋天一直占有一个巢”。例如:“我给他一本书作为礼物”。语义网络表示法知识含义知识含义7.4知识表示的方法脚本表示法使用一种特定的编程语言或脚本语言来表示实体、属性和关系。脚本表示法的特点:制作一杯咖啡的过程被分解为了一系列的原子动作,这些动作按照特定的顺序组织起来,形成了一个完整的制作咖啡的流程。这种方法使得知识表示既清晰又易于理解,特别适合于表示那些步骤固定、流程化的操作或活动。举例:制作一杯咖啡定义原子动作定义进入条件、角色、道具、使用原子动作表示场景,明确结局Part03知识表示的应用场景7.5知识表示的应用场景知识图谱技术最先应用于搜索,最初由谷歌提出。(1)语义搜索:实现Web从网页链接向概念链接转变,支持用户按主题而不是字符搜索。(2)关系搜索:获取两个实体之间的关系,例如公司之间的关系、人物之间的关系等。(3)结构化展现:以图形化的方式向用户展示经过分类整理的结构化知识,从而使用户从人工过滤网页寻找答案的模式中解脱出来。场景1:搜索7.5知识表示的应用场景从具体应用场景来看,当前智能对话系统应答的典型内容有三种:(1)任务型(2)问答型(3)闲聊型场景2:智能对话系统7.5知识表示的应用场景(1)知识图谱问答(2)表格问答(3)文本问答(4)社区问答问答型机器人的知识来源7.5知识表示的应用场景基于知识图谱的商品推荐7.5知识表示的应用场景辅助信贷审核可以基于知识图谱数据进行统一查询,全面掌握客户信息,避免由于系统、数据等孤立造成的信息不一致导致信用重复使用、信息不完整等问题。7.5知识表示的应用场景中医药知识平台可以针对中医药知识体系进行系统梳理、建模和展示;以图形可视化方式展示核心概念之间的关系;辅助中医专家厘清学术发展脉络,浏览中医知识,发现知识点之间的联系。与阅读文献等手段相比,中医药知识平台可大幅度节约知识检索获取时间。7.5知识表示的应用场景建立知识图谱,用于识别老虎、金钱豹、斑马、长颈鹿、鸵鸟、企鹅、信天翁这七种动物的识别系统。如:识别下图中包含哪些动物?7.5知识表示的应用场景2、设计匹配过程根据系统规则库来检索动物已知的信息为动物特征:黑色斑点、长脖子、长腿、分泌乳汁、有蹄。这是什么动物?1、获取知识表示库3、程序运行结果探索与思考(1)知识怎么被表示?(2)为什么不同阶段会有不同的知识表示概念模型产生?(3)知识表示在人工智能发展过程中有哪些作用?本章总结知识表示是对知识的一种描述,或者是对知识的一组约定,是一种计算机可以接受的用于描述知识的数据结构。它是机器通往智能的基础,使得机器可以像人一样运用知识。知识具有相对正确性、不确定性、可表示性与可利用性的特点。根据不同划分标准,知识可以分为不同的类别。例如:按确定性分类,知识可分为确定性知识、不确定性知识。谢谢THANKS第八章
计算机视觉
《人工智能应用概论(第2版)》RengongZhinengYingyongGailun
Part0101计算机视觉技术概述Part0202计算机视觉的工作原理Part0303计算机视觉的典型实践案例目
录contentPart01计算机视觉技术概述尝试过大型超市刷脸支付吗?你有关注/体验现在智能汽车的自动驾驶么?【课程导入】【生活案例】微信公众号,搜索“讯飞Ai体验栈”,身份证识别、银行卡识别、颜值分析、速算题批改【课程导入】1.1计算机视觉的概念计算机视觉是人工智能的一个分支,是使用计算机模仿人类视觉系统的一门科学。它是用计算机代替人眼,使用图像处理技术、深度学习算法进一步对目标进行识别、跟踪和测量等。这涉及开发能够处理和理解图像和视频的算法、模型和系统,使机器能够从视觉数据中“看到”和提取有用的信息,并应用于从简单的图像识别(计算机视觉领域最为经典的研究问题,莫过于猫狗分类了)到复杂的场景理解(如自动驾驶汽车识别路上的行人和障碍物)的各种任务。1.2计算机视觉的发展计算机视觉的概念可以追溯到20世纪60年代,主要集中在基本的图像处理和模式识别。近十年来,深度学习的兴起极大地推动了计算机视觉技术的发展,特别是卷积神经网络(CNNs),在图像识别和分类等任务中取得了革命性的进展,这使得计算机视觉应用变得更加广泛和强大。1.2计算机视觉的发展随着GPT-4V、Gemini等大模型的惊艳亮相,更是使得计算机视觉的能力表现跃上了新台阶。1.2计算机视觉的发展随着GPT-4V、Gemini等大模型的惊艳亮相,更是使得计算机视觉的能力表现跃上了新台阶。1.2计算机视觉主要技术步骤计算机视觉技术的主要步骤包括图像预处理、特征提取、特征选择、(图像识别、目标检测和图像分割)等。这些步骤共同构成了计算机视觉处理流程的核心,使得机器能够理解并解释视觉信息,从而实现各种复杂的任务。图像预处理特征提取特征选择图像识别目标检测图像分割1.3计算机视觉主要技术步骤图像预处理是计算机视觉技术的第一步,旨在提高图像质量和可处理性。常见的预处理操作包括灰度化、二值化和滤波等。例如,灰度化是将彩色图像转换为灰度图像的过程。特征提取
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江苏省淮安市(2024年-2025年小学六年级语文)部编版阶段练习((上下)学期)试卷及答案
- 2024北京怀柔高一(上)期末语文试卷及答案
- 内蒙古呼伦贝尔市(2024年-2025年小学六年级语文)统编版质量测试(下学期)试卷及答案
- 湖南省湘潭市(2024年-2025年小学六年级语文)统编版随堂测试(下学期)试卷及答案
- 廊坊燕京职业技术学院《生态恢复原理与实践》2023-2024学年第一学期期末试卷
- 兰州资源环境职业技术大学《嵌入式系统原理与应用技术》2023-2024学年第一学期期末试卷
- 2025年甘孜从业资格证应用能力考些啥
- 兰州现代职业学院《公共经济学原理》2023-2024学年第一学期期末试卷
- 2025年四平货运从业资格证考试题及答案
- 2025年雅安货运从业资格证模拟考试题库
- 杭州奥泰生物技术股份有限公司IVD研发中心建设项目环境影响报告表
- 标识牌单元工程施工质量验收评定表
- 内科护理学-第二章-呼吸系统疾病病人的护理试题
- GB/T 43232-2023紧固件轴向应力超声测量方法
- 血液透析的医疗质量管理与持续改进
- 铬安全周知卡、职业危害告知卡、理化特性表
- 部编小语必读整本书《西游记》主要情节赏析
- 企业工会工作制度规章制度
- 公路工程随机抽样一览表(路基路面现场测试随机选点方法自动计算)
- 学生矛盾纠纷化解记录表
- 人教版六年级数学上册 (数与形(1))数学广角教学课件
评论
0/150
提交评论