《人工智能训练师》学习计算机科学体系机器学习人工智能相关领域关系图(含职业技能等级证书考试重点知识)_第1页
《人工智能训练师》学习计算机科学体系机器学习人工智能相关领域关系图(含职业技能等级证书考试重点知识)_第2页
《人工智能训练师》学习计算机科学体系机器学习人工智能相关领域关系图(含职业技能等级证书考试重点知识)_第3页
《人工智能训练师》学习计算机科学体系机器学习人工智能相关领域关系图(含职业技能等级证书考试重点知识)_第4页
《人工智能训练师》学习计算机科学体系机器学习人工智能相关领域关系图(含职业技能等级证书考试重点知识)_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《人工智能训练师》学习计算机科学体系,机器学习,人工智能相关领域关系图(含职业技能等级证书考试重点知识)一、什么是人工智能训练师?2020年3月,人力资源社会保障部与国家市场监管总局、国家统计局联合向社会发布了人工智能训练师、智能制造工程技术人员等16个新职业,这是自2015年版《中华人民共和国职业分类大典》颁布以来发布的第二批新职业。2021年11月,国家人社部发布《人工智能训练师》职业技能标准,人工智能训练师国标由此诞生。国标中对人工智能训练师的职业定义为:使用智能训练软件,在人工智能产品实际使用过程中进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业的人员。二、什么是职业技能等级证书?是经人力资源社会保障部门备案的用人单位和社会培训评价组织在备案职业(工种)范围内依据国家职业技能标准和备案的评价规范对劳动者进行职业技能等级认定,对经认定合格者颁发职业技能等级证书。三、职业技能等级证书分几个等级?职业技能等级原则上分为5个等级,由低到高分别是五级至一级:五级、四级、三级、二级、一级。四、职业技能等级证书效用如何?(1)职称评定:职业技能等级证书虽不直接对应职称证书,但可以申报相应职称。在国企、央企一些单位,学历、工作年限、是否拥有职业技能等级证书都是职称评定的标准。(2)积分落户:①申请人才引进居住证提供社保证明与职业技能等级证书,可以申请人才引进居住证,在孩子教育、家人医疗福利等方面享受便利。②累计落户积分拥有职业技能证书可获得积分落户加分。职业技能等级证书分为五个等级,不同等级加的分值不同,分值越高落户的优势就越大。(3)与薪资挂钩职业技能等级证书是专业的象征,是对专业技术能力的肯定,可增加职业竞争力。不仅如此,在有些国企单位,拥有初级职业技能等级证(最低等级)的职工,月薪涨幅在100-300元之间(等级越高涨幅越大,与每个企业薪酬标准有关)。人工智能是什么?真的会“意识觉醒”,甚至反抗人类吗?人工智能与5G通信网络有怎样的关联?如今的5G智能机器人是不是正在和人类“抢饭碗”?5G技术催生的新职业——AI训练师又是干什么的?随着AI人工智能渗入日常生活,AI“觉醒”的消息,也常常激起热烈讨论。总台央广中国之声携手中国科协青少年科技中心,推出全媒体科普栏目——大师课堂《科学家讲科学》。20位院士名家畅谈热点事件,为公众科普答疑。

人工智能真能“觉醒”?也会“反抗”?邬贺铨认为,人工智能是需要人为训练的,自己不会产生意识。“有意识也是训练时人为灌输的。有人担心机器人会反抗人类,那可能是人类在机器人的程序设计上出现了漏洞,激发了它对立的动作,导致变成‘反抗’,实际上并不是有意识的反抗。”他还指出,产生这一漏洞的原因在于人在训练机器人时未考虑伦理问题。“不是指机器人要学习伦理,而是训练机器人的人要学习伦理。机器人本身没有好恶之分,是人给它带来的。”5G+机器人会让人失业?邬贺铨称机器人并非5G独有。“只不过因为5G的高带宽、低时延,让5G机器人更‘耳聪目明’,配合云计算、人工智能技术的发展,机器人的能力更强了。但是这个能力还是由人赋予的,没有人提升大数据以及人工智能技术,机器人也不会变得聪明。我认为人与机器人将来是互补的。”有人预测在未来20年内,机器人会取代一些没有感情交流的、重复性的工作,而这些工作目前占人类工作的70%。针对“会不会有大量人失业”的疑问和担心,邬贺铨回应说,在未来人类社会更期待用机器人干一些重复性和危险性较高的、劳动条件较恶劣的工作。“这些工作是否会占到70%?我觉得可能没这么高的比例,很多工作仍然需要人参与。”AI训练师是什么新奇职业?随着一些岗位被机器替代,一些新的岗位应运而生。邬贺铨举例说,大数据挖掘前需要进行清洗标注,目前这些工作大部分还是要依靠人。“人社部曾定义这种工作为AI训练师,并且预计大概在2022年,全中国这类职业可能需要200万人。”邬贺铨解释道,“比如AI训练师会进行智能驾驶的训练。智能驾驶中需要让汽车自动识别马路,但如果只是将视频单纯地传给计算机,计算机无法识别,需要人工在视频中将道路框出,再交由计算机,计算机多次接受此类信息后,才能逐渐学会在视频和照片中识别出道路。”邬贺铨还以“人脸识别”举例:“计算机一开始是无法识别人脸的,需要人工标注人脸图像,标注出哪里是眼、哪里是鼻、哪里是嘴,一个人脸可能要标150个点。此外,AI训练师还会训练人工智能客服,回答问题不能太机械,必须体会客户的感情,这也需要事前训练。”邬贺铨认为,在未来,机器人担任老师和律师等是有可能的,但存在不足。“中小学可能还不太合适。中小学是希望老师与学生互动的,老师通过观察孩子听课的表情,判断对方的理解的能力,所以纯粹由机器人上课是有不足的。另外,让机器人判案子理论上可以,但律师也不仅仅是法庭上的工作,还有翻看案卷、做调研等。”“人工智能的发展会使我们的社会越来越智能化,但仍处于人类可控制的范围内,并不是说要超越人类。”邬贺铨说。5G+AI,还有哪些新玩法?邬贺铨介绍说,5G的特点之一是高运动速度。“冬奥会高山滑雪时速250公里,如果在运动员的头盔和雪橇上装5G设备,将信号传到外边,观众就可以获得运动员在滑雪过程中对高度、难度、温度和速度的感受。在以往转播体育比赛时,场外观众只能跟随导播切换的画面观看比赛。5G可以把运动场上16个机位的信号同时传出,再合成一个360度的视频,场外观众也可以获得同场内观众一样的观看体验。”5G不仅能合成视频,还能合成CT照片。“在新冠肺炎的检测中,很多时候需要靠肺部的CT影像来定性确诊。一个肺部可能有上百张CT照片,医生一张张看很耗时间,可以通过大数据人工智能把300张CT照片合成为一个肺。”除了应用于医学领域,5G还能应用于日常消费。“如何判断在电商平台选中的衣服是否合身?可以用手机拍一张全身照,将衣服虚拟化地套在身上,甚至可以同时比较穿什么颜色好看,这也是5G+AR的一种应用。”大连接物联网?一平方公里100万个传感器联网邬贺铨说,到今年4月底,中国已经建设的5G基站约有161万个。他预计按照目前的进度,到今年年底大概要建200万个。“中国现在4G基站有590万个,从一定意义上说,5G基站数不会少于4G基站数。按照每年新建200万个基站的速度,5G基站的建设还需要几年。”对于5G网络,人们更关心其安全问题。邬贺铨表示,在3G、4G原有的基础上,5G增加了一些安全功能,主要是增加了网络访问的安全性。“5G去除了基于手机用户识别码的非法定位的危险,增加了用户数据完整性的保护,有效降低了漫游区域的欺骗风险,增强了运营商之间连接的安全性,提升了抵御分布式拒绝服务攻击的能力,可以说兼顾了低时延的可靠性和安全性。”同时,5G不仅仅是通信,还拓展了物联网能力。邬贺铨表示,与4G相比,5G在多项性能上提升了1—2个数量级。“5G的峰值速率提高到了每秒100兆比特,大连接物联网可以做到每平方公里100万个传感器联网。可以说,1G到4G的应用面向消费者,5G扩展到工业互联网和智慧城市的应用。”邬贺铨说,5G作为数字经济的基础设施和新动能的引擎,与传统行业的生产运营技术的结合、智能社会经济的数字化转型,推动了智能社会和产业数字化的发展,展现了广阔应用前景与效益。核心概念梳理一、“人工智能”的定义(注意名词解释)人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。

人工智能技术将使新闻生产更加高效便捷,受众行为分析更加精准,媒体传播效果更加优化,它对新闻的内容生产、议题设置、运作方式等带来革命性的影响。(比较经典、学术的一段话,记住!)二、人工智能带来全新的新闻生产2015年9月,腾讯财经推出了自动化新闻写作机器人“Dreamwriter”,用时一分钟写出了第一篇报道;11月,新华社写稿机器人“快笔小新”正式上岗,可以写体育赛事中英文稿件和财经信息稿;2016年3月,韩国写稿机器人上岗,仅0.3秒就写出一篇股市行情的新闻稿。(简单记住这几个例子,论述题中可援引)计算机自动生成的机器人新闻,尽管在国内尚属新鲜事,但是国外几年前就已成为现实,机器人早已开始协助写稿、编辑、校对等。路透社、美联社、《纽约时报》、《洛杉矶时报》、雅虎、赫芬顿邮报等传统媒体和互联网公司都已纷纷采用机器人生产新闻。

随着人工智能技术的逐渐成熟,机器人的计算能力和学习能力不断提升,传统新闻生产的方式将逐渐被颠覆。过去依靠专业记者生产内容(PGC)的手工模式,继走向“专业生产+用户生产”(PGC+UGC)的Web2.0模式后,又将走向Web3.0新阶段:算法生成内容(AAC)与PGC和UGC三者鼎立。(这三个专业名词,务必都掌握,写进答案会很加分)新华社副社长刘思扬6月在圣彼得堡国际经济论坛讨论人工智能对新闻业影响时认为,未来人工智能至少会从内容生产和消费两端对媒体发展带来变革。人工智能与物联网、大数据深度结合,将催生真正意义上的“精准媒体”,在图像识别、视频处理、跨文本翻译、数据库激活等领域,推动媒体融合快速发展。短期而言,体育报道、财经报道、房地产分析报告、民意调查、市场调研报告等比较容易实现标准化生产的领域,人工智能的应用会迅速普及推广。

三、人工智能带来全新的议题设置传统媒体的议题设置,主要取决于当时的新闻热点、宣传管理部门的指令、媒体同行的选择和编辑记者的经验。但是,人工智能技术出现后,媒体议题设置和编排分发的旧有规则被打破了。算法推荐新闻,以及受众之间的相互推荐,逐渐开始争夺内容分发的主导权。人工智能技术的核心是数据挖掘。媒体的受众分析将比以往更精准,内容的聚合与分发,将更加精准化、智能化、对象化、个性化。通过大数据挖掘技术、个人信息行为追踪,新闻机构可以做到为用户智能推荐,实现个性化的新闻定制。全球新闻生产从人工整合向技术整合的趋势愈加明显,人工智能向传媒领域进军已成潮流。人工智能技术宣告了个性化新闻时代的全面到来。针对每个订阅用户的专属评论和定制化报道,已经成为现实。1.首先,人工智能技术使得“用户画像”更清晰,可以为用户量身定做内容。过去,“一点对多点”的、千篇一律的生产模式将转变为个性化、对象化、差异化的内容生产模式。大数据技术可以对受众进行详尽的统计分析。“你在看手机时,手机也在看着你”,互联网巨头悄然地收集着用户所有行为数据——除一般性的用户数据(如性别、年龄、地域分布、情感倾向、注意力偏好、行为喜好、渠道偏好、消费能力、生活轨迹、关系圈、终端匹配等),还有产品数据(如产品形态、产品资费、渠道、品牌、类型和终端要求等),以及网络能力数据(如网络功能、利用率、效率等)。新闻客户端“一点资讯”的创始人郑朝晖曾坦言:“比阅读重要的是阅读者的行为”。2.其次,人工智能技术可以为受众进行场景化适配,这是传统议题设置望尘莫及的。在不同时段、不同地理位置,用户对新闻的需求都不同,机器人可以在后台实时调整。如此,就不会出现将传统媒体内容照搬到PC端,PC端内容复制到手机端,将白天信息需求视为和夜晚等同的窘境。

与场景时代相关的有五大因素:大数据、移动设备、社交媒体、传感器和定位系统,它们都和内容生产关联起来。“从哪来—现在哪—去哪里”三个阶段,用户接收的内容都不一样。如受众走路或运动时,可以通过谷歌眼镜、智能手环等可穿戴设备,接收短小精悍的突发新闻;受众在等车候机时,可以通过手机接收碎片化、趣味化的内容,受众在临睡前,可以接收娱乐类、情感类的内容。

3.最后,人工智能技术使媒体更加社交化,更加注重对社交媒体数据的收集和挖掘。对媒体来说,没有大数据,一切都将成为无源之水、无本之木。未来媒体的竞争力,取决于其数据挖掘的能力,而非简单的叙事能力。过去的议题设置,片面追求新闻热点,忽略多元化用户的需求。而人工智能时代的内容选择,取决于兴趣引擎以及长尾理论。今日头条的竞争对手“一点资讯”也深谙此道。它通过微博绑定,推测出用户的兴趣爱好。用户使用时间越久,基于兴趣引擎的媒介工具会越来越懂用户,在频道内容和排序上会更符合其胃口。

四、传统媒体如何应对人工智能(简答题/论述题的最爱)1.首先,传统媒体不能一味沉溺于“内容为王”的路径依赖,而要考虑“内容+技术+渠道+市场+人才”的全产业链运作。片面强调“内容为王”,对科技发展视而不见,最终会导致传统媒体的彻底边缘化,丧失主流舆论阵地。2.其次,传统媒体除了培养“全能型记者”,还要引进软件算法工程师。一方面,媒体需要复合型的人才队伍,需要记者掌握多元化的知识结构,使其除了必备传统“报台网”的采访、编辑和写作技巧,懂得文字、图片、音频、视频的制作技能,还要懂得微博、微信、客户端等新媒体平台的发稿流程。另一方面,媒体队伍需要专门的算法工程师。媒体队伍的知识结构,不能局限于中文、新闻、传播等文科领域,还需要大量的IT人才,满足TMT(Technology/Media/Telecom)、ICT(InformationandCommunicationsTechnology)产业的融合趋势。

3.最后,面对人工智能技术的步步紧逼,传统媒体不能画地为牢,需要打破藩篱,既要开展传统媒体与新媒体的一体化运营,也要做好内容集成服务商,在媒体聚合平台安营扎寨(如媒体公众运营号),还可以主动聚合自媒体(如发五、“机器人”新闻(一)机器人新闻的定义新闻机器人是人工智能技术在新闻业得以应用的产物,主要指机器利用计算机程序对相应的数据信息进行抓取,自动生成新闻文本,目前已在欧美主流媒体的财经、体育、天气类新闻报道中得到运用,最早运用于体育报道领域。“机器人写手新闻”不同于早期纯粹的信息收集、抓取程序,而是在数据收集、处理的基础之上自动生成完整的新闻样式。“机器人写手新闻”是在特定的计算机程序系统的基础上,对信息内容进行抓取、分析后自动形成完整的新闻报道的新的生产方式。“机器人写手新闻”的成果是完整的新闻报道,“机器人写手新闻”的最大特征是自动化的新闻生成,在技术研发阶段以后,人工的参与不对新闻生成产生决定性影响。(二)机器人新闻对传统新闻生产的影响1.新闻信息来源的变化新闻机器人的生产模式将从基于互联网数据抓取的断点式自动生成模式,逐渐转换到基于物联网持续性数据抓取的自动生成模式。“机器人写手新闻”信息多来自互联网数据,包括特定第三方的信息推送、基于社交网络的传感新闻、信息搜索强度和频度的统计分析等数据信息。“机器人写手新闻”的出现,使得物联网中传感器采集的数据(包括移动互联网中的地理位置数据)、社会化媒体中的用户生产内容(UGC)以及新媒体中的各种用户数据被更为广泛而深入地应用。新闻信息的来源不再只依靠记者、依靠人力的发掘,而增加了信息系统的直接抓取。在此过程中,记者的角色将逐渐弱化,新闻信息自动化采集的比重逐渐增加。2.新闻生产主体的人机转变传统的新闻生产主体是自然人,但是“机器人写手新闻”的生产主体是计算机程序,而不是自然人。在“机器人写手新闻”生成过程中,因其依托计算机技术的特殊属性,除了前期的技术开发以及最后点击“确认发布”按钮,人并没有过多地参与新闻生产的主要环节。新闻生产主体的转变,某种程度上将记者从烦琐的信息收集过程中解放出来。记者的主要作用不再体现在“信息提供”上,而在信息的深度挖掘和解析上。随着计算机技术的进一步升级以及“机器人写手新闻”的大范围应用,在今后的新闻生产中,记者将会从“信息提供者”转变为“信息解释者”、“信息核查者”等多重角色,这也将成为新闻媒体和记者需要应对的一种挑战。3.新闻生产速度的提高新闻的时效性是新闻的生命力所在,包括“新”和“快”两个方面:新,即新鲜、新颖、新生;快,即要求写稿和发稿速度快。基于计算机系统软件生成的“机器人写手新闻”,在信息抓取及文本生成方面的速度都是人工所不能及的,这不仅有利于媒体抢占新闻资源,而且还可以节省大量人力。4.新闻生产流程的减少在新闻事件发生和新闻报道发布“0时差”的今天,新闻行业被要求用更高效的方式为受众提供信息,“机器人写手新闻”将传统新闻生产的采、写、编、排等过程融合在一起,化繁为简,形成了从“数据抓取”到“文稿生成”的两步式新闻生产方式,大大缩减了传统的新闻生产流程,优化了整个新闻生产体系。在信息抓取方面,基于特定抓取程序的计算机系统比人力更高效地收集到可用信息,减少了人力检索收集、阅读、裁定的过程,在减少生产流程的同时,更是对人一定程度的解放和对人力资源的节省。5.新闻报道方式和内容的转变不同于传统的新闻报道,“机器人写手新闻”在固定的文本模板中嵌入不同的数据信息,按照标准的报道模式对特定领域的信息进行报道,在报道方式上呈现出固定化、模式化的特点。另外,“机器人写手新闻”在报道内容上讲求报道的广泛和全面,更倾向于提供大量的信息,而无法直接生成精确、详细的深度报道,即“机器人写手新闻”主要是报道"what",告诉受众发生什么事情,而不是解释和说明事件背后的意义。(三)“机器人”新闻存在的问题(核心考点,务必掌握)1.新闻写作的模式化“机器人写手新闻”以缺少具体数据的新闻模板为基础,由于技术的局限性,基于代码编程的系统和软件目前只能提供固定的新闻模板,因此,“机器人写手”只能按照固定套路进行新闻生产,新闻写作呈现固定化、模式化。这种方式更多地运用在体育、财经、灾难事件报道中,在深度报道等领域无法适用。另外,“机器人写手新闻”的组成是确定的模板以及变动的数据,在速度化生产的同时,还带来了新闻生产批量化、同质化问题,同一领域、同一类型的新闻报道文本极为相似,而唯一的变化就是其中的一些数据。2.缺失的新闻敏感度机器人写新闻同样存在新闻敏感度缺失的问题,机器毕竟是机器,尽管美联社表示机器人写作软件按照程序使用不同语气的能力越来越强,但新闻毕竟出自机器人之手,它不具备对新闻线索进行挖掘的观察能力,也不具备对新闻事件进行取舍的决断能力,而这两种能力是新闻敏感度的重要体现。3.冰冷的新闻温度机器本身没有办法判断情绪,它们只是单纯地从数据库中抽取形容词,用法正确与否暂且不论,与“手工打造”的饱含情感、责任和人文诸因素的新闻稿相比,从机器人手中传递出来的新闻虽然是新鲜的却是冰凉的。4.数据收集对个人隐私的侵犯“机器人写手新闻”基于互联网和物联网数据采写新闻,对用户的隐私安全有一定隐患。由于当前网络监管的不完善,“机器人写手新闻”在利用物联网技术采集信息,以及对社会化媒体中的用户生产内容、新媒体用户数据进行采集时极有可能侵犯个人隐私。如何把握新闻报道所需要的资源与个人隐私之间的界限,这将是对媒介伦理的一个挑战。5.新闻报道不平等的加剧“机器人写手新闻”的应用需要经济、技术等多方面的支持,在短时间内并非所有的媒体机构都能够利用“机器人写手”完成新闻报道。有能力使用这一先进技术的媒体机构可以率先享受技术变革带来的便捷,并可以节省出大量的人力和物力,以利于其发展。这种运用的不平等在某种程度上也会加剧媒体间的竞争,给部分媒体带来更大的生存、变革压力。另外,不同发展水平的国家和地区对机器人写手的使用情况也会不同,很可能进一步加剧地区之间新闻报道的不平等现象。“机器人写手新闻”最先运用成功的都是欧美发达国家媒体,依托于强大的经济和技术支持,先进发达国家比其他地区更早、更快、更好地运用新的报道方式,由此加大了国家和地区之间新闻报道的不平等。考察偏向解析:从近几年的真题中不难发现,人工智能相关考点多以简答、论述等形式出现,分值很高,崽崽们一定要特别关注。除了对人工智能的含义、特点、现状等有基本的了解外,崽崽们尤其要关注人工智能给新闻传播业带来的影响(利弊两个方面),并将人工智能与算法、机器人新闻、信息茧房等考点结合起来理解,做到有点有面,举一反三。相关论文拓展1.

智媒化:未来媒体浪潮——新媒体发展趋势报告(2016)—彭兰《国际新闻界》(拓展阅读)2.

人工智能技术对新闻生产的影响与再造—梁智勇、郑俊婷《中国记者》(深度阅读)3.

智能化:未来传播模式创新的核心逻辑—兼论“人工智能+媒体”的基本运作范式—喻国明、兰美娜、李玮《新闻与写作》(深度细读)4.

试论人工智能技术范式下的传媒变革与发展——一种对于传媒未来技术创新逻辑的探析—喻国明、姚飞《新闻界》(深度细读)5.

机器人新闻写作的局限与不足——基于腾讯财经写作机器人Dreamwriter作品的分析——陈力丹《新闻记者》(理解即可)6.

机器人写作对未来新闻生产的深远影响——兼评新华社的“快笔小新”——王悦《新闻与写作》(深度阅读)7.机器人新闻:一种基于大数据的新闻生产模式——孙瑛《编辑之友》(深度阅读)8.

智能媒体的现实图景与未来想象——以新闻领域的变化为例——张磊《郑州大学学报》(理解发散)9.

智能化:未来传播模式创新的核心逻辑——兼论“人工智能+媒体”的基本运作范式——喻国明《新闻与写作》(深度细读)人工智能作为计算机科学的一个分支旨在创造可以解决计算问题,以及像动物和人类一样思考与交流的人造系统。人工智能领域开始变得正式源于AlanTuring这位人工智能先驱提出了图灵试验,以回答这样一个终极问题:“计算机能够思考吗?”计算机科学体系计算机科学是系统性研究信息与计算的理论基础以及它们在计算机系统中如何实现与应用的实用技术的学科。它通常被形容为对那些创造、描述以及转换信息的算法处理的系统研究。分支学科脉络划分如下理论电脑科学数据结构和算法计算理论信息论与编码理论编程语言和编译器形式化方法计算机系统计算机体系结构与计算机工程操作系统并发、并行与分布式系统计算机网络计算机安全和密码学数据库计算机应用技术计算机图形学科学计算多媒体技术人工智能软件工程人工智能人工智能(英语:ArtificialIntelligence,缩写为AI)亦称智械、机器智能,指由人制造出来的机器所表现出来的智能。通常人工智能是指通过普通计算机程序来呈现人类智能的技术。该词也指出研究这样的智能系统是否能够实现,以及如何实现。同时,通过医学、神经科学、机器人学及统计学等的进步,常态预测则认为人类的无数职业也逐渐被其取代人工智能分支学科划分如下机器学习计算机视觉图像处理模式识别数据挖掘演化计算知识表示和自动推理自然语言处理机器人学机器学习机器学习是人工智能的一个分支。人工智能的研究历史有着一条从以“推理”为重点,到以“知识”为重点,再到以“学习”为重点的自然、清晰的脉络。机器学习是实现人工智能的一个途径,即以机器学习为手段解决人工智能中的问题机器学习在近30多年已发展为一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多推论问题属于无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法机器学习有下面几种定义机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能机器学习是对能通过经验自动改进的计算机算法的研究机器学习是用数据或以往的经验,以此优化计算机程序的性能标准一种经常引用的英文定义是

AcomputerprogramissaidtolearnfromexperienceEwithrespecttosomeclassoftasksTandperformancemeasureP,ifitsperformanceattasksinT,asmeasuredbyP,improveswithexperienceE机器学习可以分成下面几种类别有监督学习从给定的训练数据集中学习出一个函数,当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求是包括输入和输出,也可以说是特征和目标。训练集中的目标是由人标注的。常见的监督学习算法包括回归分析和统计分类回归分析(英语:RegressionAnalysis)是一种统计学上分析数据的方法,目的在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模型以便观察特定变量来预测研究者感兴趣的变量。更具体的来说,回归分析可以帮助人们了解在只有一个自变量变化时因变量的变化量。一般来说,通过回归分析我们可以由给出的自变量估计因变量的条件期望统计分类

是机器学习非常重要的一个组成部分,它的目标是根据已知样本的某些特征,判断一个新的样本属于哪种已知的样本类。分类是监督学习的一个实例,根据已知训练集提供的样本,通过计算选择特征参数,创建判别函数以对样本进行的分类无监督学习是一种自组织的HEBBY学习的类型,它帮助在没有预先存在标签的情况下找到数据集中先前未知的模式。它也被称为自组织,允许对给定输入的概率密度进行建模。常见的无监督学习算法有生成对抗网络(GAN)、聚类分析生成对抗网络(英语:GenerativeAdversarialNetwork,简称GAN)是非监督式学习的一种方法,通过让两个神经网络相互博弈的方式进行学习。该方法由伊恩·古德费洛等人于2014年提出。生成对抗网络由一个生成网络与一个判别网络组成,生成网络从潜在空间(latentspace)中随机取样作为输入,其输出结果需要尽量模仿训练集中的真实样本;判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来,而生成网络则要尽可能地欺骗判别网络。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实聚类分析(英语:Clusteranalysis)亦称为群集分析,是对于统计数据分析的一门技术。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集(subset),这样让在同一个子集中的成员对象都有相似的一些属性。一般把数据聚类归纳为一种非监督式学习有监督学习和非监督学习的差别就是训练集目标是否人标注。他们都有训练集且都有输入和输出半监督学习介于监督学习与无监督学习之间增强学习机器为了达成目标,随着环境的变动,而逐步调整其行为,并评估每一个行动之后所到的回馈是正向的或负向的具体的机器学习算法有构造间隔理论分布:聚类分析和模式识别人工神经网络感知器决策树支持向量机集成学习AdaBoost降维与度量学习聚类贝叶斯分类器构造条件概率:回归分析和统计分类高斯过程回归线性判别分析最近邻居法径向基函数核通过再生模型构造概率密度函数最大期望算法概率图模型贝叶斯网Markov随机场GenerativeTopographicMapping近似推断技术马尔可夫链蒙特卡罗方法变分法最优化神经网络生物神经网络(BiologicalNeuralNetworks)

一般指生物的神经元、细胞、触点等组成的网络,用于产生生物的意识,帮助生物进行思考和行动人工神经网络(英语:ArtificialNeuralNetwork,ANN),简称神经网络(NeuralNetwork,NN)或类神经网络,在机器学习和认知科学领域,是一种模仿生物神经网络(动物的中枢神经系统,特别是大脑)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统,通俗的讲就是具备学习功能现代神经网络是一种非线性统计性数据建模工具,神经网络通常是通过一个基于数学统计学类型的学习方法

(LearningMethod)

得以优化,所以也是数学统计学方法的一种实际应用,通过统计学的标准数学方法我们能够得到大量的可以用函数来表达的局部结构空间,另一方面在人工智能学的人工感知领域,我们通过数学统计学的应用可以来做人工感知方面的决定问题

(也就是说通过统计学的方法,人工神经网络能够类似人一样具有简单的决定能力和简单的判断能力),这种方法比起正式的逻辑学推理演算更具有优势感知器

(英语:Perceptron)

是FrankRosenblatt在1957年就职于康奈尔航空实验室

(CornellAeronauticalLaboratory)

时所发明的一种人工神经网络。FrankRosenblatt

给出了相应的感知机学习算法,常用的有感知机学习、最小二乘法和梯度下降法。譬如,感知机利用梯度下降法对损失函数进行极小化,求出可将训练数据进行线性划分的分离超平面,从而求得感知机模型感知机是生物神经细胞的简单抽象,神经细胞结构大致可分为:树突、突触、细胞体及轴突。单个神经细胞可被视为一种只有两种状态的机器——激动时为‘是’,而未激动时为‘否’。神经细胞的状态取决于从其它的神经细胞收到的输入信号量,及突触的强度(抑制或加强);

当信号量总和超过了某个阈值时,细胞体就会激动,产生电脉冲;

电脉冲沿着轴突并通过突触传递到其它神经元。为了模拟神经细胞行为,与之对应的感知机基础概念被提出,如权量(突触)、偏置(阈值)及激活函数(细胞体)在人工神经网络领域中,感知机也被指为单层的人工神经网络,以区别于较复杂的多层感知机(MultilayerPerceptron)。作为一种二元线性分类器,(单层)感知机可说是最简单的前向人工神经网络形式。尽管结构简单,感知机能够学习并解决相当复杂的问题。感知机主要的本质缺陷是它不能处理线性不可分问题神经细胞结构示意图感知机是一种模式识别算法,用简单的加减法实现了两层的计算机学习网络。罗森布拉特也用数学符号描述了基本感知机里没有的回路,例如异或回路,这种回路一直无法被神经网络处理,直到保罗·韦伯斯(1975)创造的反向传播算法有效地解决了异或的问题,还有更普遍的训练多层神经网络的问题人工神经网络的组成结构

(Architecture)

指定了网络中的变量和它们的拓扑关系。例如,神经网络中的变量可以是神经元连接的权重

(weights)

和神经元的激励值

(activitiesoftheneurons)激励函数

(ActivationRule)

大部分神经网络模型具有一个短时间尺度的动力学规则,来定义神经元如何根据其他神经元的活动来改变自己的激励值。一般激励函数依赖于网络中的权重(即该网络的参数)学习规则

(LearningRule)

指定了网络中的权重如何随着时间推进而调整。这一般被看做是一种长时间尺度的动力学规则。一般情况下,学习规则依赖于神经元的激励值,它也可能依赖于监督者提供的目标值和当前权重的值。例如,用于手写识别的一个神经网络,有一组输入神经元;

输入神经元会被输入图像的数据所激发;

在激励值被加权并通过一个函数

(由网络的设计者确定)

后,这些神经元的激励值被传递到其他神经元;

这个过程不断重复,直到输出神经元被激发;

最后,输出神经元的激励值决定了识别出来的是哪个字母神经元神经元示意图a1~an为输入向量的各个分量w1~wn为神经元各个突触的权值b为偏置f为传递函数,通常为非线性函数。一般有traingd(),tansig(),hardlim()。以下默认为hardlim()t为神经元输出数学表示式一个神经元的功能是求得输入向量与权向量的内积后,经一个非线性传递函数得到一个标量结果。单个神经元的作用

把一个n维向量空间用一个超平面分割成两部分(称之为判断边界),给定一个输入向量,神经元可以判断出这个向量位于超平面的哪一边该超平面的方程学习过程通过训练样本的校正,对各个层的权重进行校正

(learning)

而创建模型的过程,称为自动学习过程

(trainingalgorithm)。具体的学习方法则因网络结构和模型不同而不同,常用反向传播算法

(Backpropagation/倒传递/逆传播,以output利用一次微分Deltarule来修正weight)

来验证人工神经网络的两种分类方式依学习策略

(Algorithm)

分类监督式学习网络

(SupervisedLearningNetwork)无监督式学习网络

(UnsupervisedLearningNetwork)混合式学习网络

(HybridLearningNetwork)联想式学习网络

(AssociateLearningNetwork)最适化学习网络

(OptimizationApplicationNetwork)依网络架构(Connectionism)分类前馈神经网络

(FeedForwardNetwork)循环神经网络

(RecurrentNetwork)强化式架构

(ReinforcementNetwork)深度学习深度学习

(DeepLearning)

是机器学习的分支,是一种以人工神经网络为架构,对数据进行表征学习的算法。深度学习的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征在机器学习中,特征学习或表征学习是学习一个特征的技术的集合:将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习人工智能相关领域关系图深度学习的概念基于样本数据通过一定的训练方法得到包含多个层级的深度网络结构的机器学习过程。深度学习所得到的深度网络结构包含大量的单一元素(神经元),每个神经元与大量其他神经元相连接,神经元间的连接强度(权值)在学习过程中修改并决定网络的功能。通过深度学习得到的深度网络结构符合深度神经网络的特征,因此深度网络就是深层次的神经网络,即深度神经网络(DNN)传统机器学习机器学习的本质是从数据中构造算法深度学习是机器学习中的一种特殊算法,一种在数据中学习多层次抽象的算法深度学习深度学习=特征学习,效果优于其他机器学习方法特征学习可以被分为两类监督特征学习

从被标记的数据中学习特征监督字典学习神经网络无监督特征学习κ-平均算法主要成分分析独立成分分析局部线性嵌入算法无监督字典学习深度学习框架深度神经网络

(DNN)

是一种判别模型,可以使用反向传播算法进行训练,具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力卷积神经网络

(CNN)

由一个或多个卷积层和顶端的全连通层

(对应经典的神经网络)

组成,同时也包括关联权重和池化层深度置信网络

(DBN)

神经网络的一种。既可以用于非监督学习,类似于一个自编码机;也可以用于监督学习,作为分类器来使用循环神经网络

(RNN)

是一类以序列

(sequence)

数据为输入,在序列的演进方向进行递归

(recursion)

且所有节点

(循环单元)

按链式连接的递归神经网络深度学习的基础是机器学习中的分散表示

(distributedrepresentation)。分散表示假定观测值是由不同因子相互作用生成。在此基础上,深度学习进一步假定这一相互作用的过程可分为

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论