《自然语言处理》课程教学大纲_第1页
《自然语言处理》课程教学大纲_第2页
《自然语言处理》课程教学大纲_第3页
《自然语言处理》课程教学大纲_第4页
《自然语言处理》课程教学大纲_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《自然语言处理》教学大纲课程名称:自然语言处理课程编号:2311英文名称:NaturalLanguageProcessing学时:32学时(理论授课16+实验16) 学分:3学分开课学期:第6学期适用专业:数据科学与大数据技术专业课程类别:理论课课程性质:选修课先修课程:高等数学,线性代数,概率论与数理统计,数据结构,算法设计与分析,机器学习一、课程的性质及任务《自然语言处理》课程是数据科学与大数据技术专业学生的专业方向与拓展课,自然语言处理是计算机科学领域以及人工智能领域的一个重要研究方向,是数据科学与大数据技术专业的选修课程。本课程研究用计算机来处理、理解一节运用人类语言(中文),达到人与计算机之间进行有效通讯,是一个包含数学、计算机科学、语言学等多学科交叉的课程。通过本课程的学习,使学生能够了解自然语言处理技术的发展历程、技术特点和当前的研究现状;能够掌握自然语言处理技术的算法基础,包括常用的机器学习算法;掌握和应用基于统计学习方法的自然语言处理技术;理解和应用基于深度学习的自然语言处理技术。依据河北工程大学数据科学与大数据技术专业专业培养计划,本课程需要培养学生的能力是:能够运用数学和自然科学的基本概念、原理和数据科学与大数据技术的专业知识,识别和判断复杂工程问题的关键环节;(毕业要求指标2-1)能够基于数据科学相关科学原理和数学模型方法正确表达大数据应用领域的复杂工程问题;(毕业要求指标2-2)掌握大数据工程设计和产品开发全周期、全流程的基本设计/开发方法和技术,了解影响设计目标和技术方案的各种因素;(毕业要求指标3-1)能够对采集到的实验数据进行整理、分析和解释,并能通过信息综合、算法设计得出有效结论。(毕业要求指标4-3)掌握基本的大数据开发环境的配置和应用,熟练掌握软件开发语言(如Python、Java语言等),并能够运用集成开发环境进行复杂程序设计;(毕业要求指标5-1)二、课程目标与要求2.1课程目标1、了解自然语言处理的概念和发展历程,了解其发展现状和发展趋势,掌握自然语言处理必备的知识和技术基础。2、掌握自然语言处理常见任务的相关理论方法和编程技术,包括中文分词算法,关键词提取算法,词向量技术,文本分类算法,文本信息抽取算法,机器阅读理解算法,文本生成和摘要算法。了解对话系统和当前的相关方法。3、针对复杂工程问题,能够综合运用所学的自然语言处理算法和实践技能进行问题分析、模型选择与优化,并设计具体方案解决实际问题,对方案进行测试评估。4、在课程讲解过程中,引入思政环节,提升学生的思政水平,培养学生正确的马列主义观、爱国精神、科学探索精神与工匠精神等。5、在课程实施过程中,充分锻炼学生的创新精神、创业意识和创新创业能力。

测控电路课程教学大纲PAGE16PAGE3372.2课程目标与毕业要求对应关系课程目标毕业要求二级指标毕业要求12345●●●●2-1能够运用数学和自然科学的基本概念、原理和数据科学与大数据技术的专业知识,识别和判断复杂工程问题的关键环节。2.问题分析能力:掌握统计与机器学习的基本方法,能够综合运用数学、自然科学和数据科学的基本原理,对复杂的工程系统,识别问题、描述问题并通过文献研究分析与大数据相关的工程问题,以获得有效结论。●●2-2能够基于数据科学相关科学原理和数学模型方法正确表达大数据应用领域的复杂工程问题。●●●3-1掌握大数据工程设计和产品开发全周期、全流程的基本设计/开发方法和技术,了解影响设计目标和技术方案的各种因素。3.设计/开发解决方案能力:能够设计出大数据应用领域的复杂工程问题的解决方案,具有数据采集、处理、分析、挖掘的能力,并能够在设计环节中体现创新意识,考虑社会、健康、安全、法律、文化以及环境等多维度协同发展因素。●●4-3能够对采集到的实验数据进行整理、分析和解释,并能通过信息综合、算法设计得出有效结论。4.工程技术研究能力:能够基于数据科学与大数据技术原理并采用科学方法对大数据应用领域的复杂工程问题进行研究,包括设计实验、分析与解释数据、并通过信息综合得到合理有效的结论。●●5-1掌握基本的大数据开发环境的配置和应用,熟练掌握软件开发语言(如Python、Java语言等),并能够运用集成开发环境进行复杂程序设计。5.使用现代工具能力:能够针对大数据应用领域的复杂工程问题,开发、选择与使用恰当的技术、资源、现代信息技术工具,包括对大数据应用领域的复杂工程问题的预测与仿真,并能够理解其局限性。2.3课程目标与培养环节对应矩阵序号课程目标理论教学课内实验课后作业1了解自然语言处理的概念和发展历程,了解其发展现状和发展趋势,掌握自然语言处理必备的知识和技术基础。HL2掌握自然语言处理常见任务的相关理论方法和编程技术,包括中文分词算法,关键词提取算法,词向量技术,文本分类算法,文本信息抽取算法,机器阅读理解算法,文本生成和摘要算法。了解对话系统和当前的相关方法。HML3针对复杂工程问题,能够综合运用所学的自然语言处理算法和实践技能进行问题分析、模型选择与优化,并设计具体方案解决实际问题,对方案进行测试评估。HML4在课程讲解过程中,引入思政环节,提升学生的思政水平,培养学生正确的马列主义观、爱国精神、科学探索精神与工匠精神等。HL5在课程实施过程中,充分锻炼学生的创新精神、创业意识和创新创业能力。HML注:H表示该能力的在此环节重点培养;M表示该能力在此环节有应用要求;L表示该能力在此环节有所涉及。时间序列分析课程教学大纲PAGE2PAGE3492.4目标达成度的评价课程目标1主要通过理论教学环节进行培养,在课后作业中有所涉及。主要通过课堂测试、课后作业和期末考查中概念性、原理性题目进行考核。目标达成综合以上内容进行评价。课程目标2、3、5主要通过理论教学环节、课后作业进行培养,在课内实验有应用要求。主要通过课堂测试,课后作业和期末考查中对自然语言处理常见任务的相关理论方法和编程技术进行考核,在实验中体现为能根据实际语料库实现自然语言的分析和应用。目标达成综合以上内容进行评价。课程目标4主要通过理论教学环节进行培养,在课后作业有所涉及。主要通过课堂表现、课后作业和期末论文报告中概念性、原理性题目进行考核。目标达成综合以上内容进行评价。三、教学方法及手段本课程由理论教学和实验共两部分组成。1、理论教学:围绕本门课程的基本概念、基本原理和基本技术,采用案例式教学、情景式教学、互动式教学等教学方法,并辅以网络教学资源等进行授课。2、实验:用情境式教学法设计各种实验资源和项目,学生根据教师给定的实验指导书、实验讲解视频以及实操例题等各种学习资源,加强对于各种机器学习算法的理解与掌握,然后通过实操练习项目使学生能够把所学的知识和技能举一反三,融会贯通。同时,通过实验报告的撰写,培养学生文档撰写能力、问题分析与表述能力。四、课程的基本内容与教学要求第1章自然语言处理概述[教学目的与要求]:使学生了解自然语言处理的概念和发展历程,了解其发展现状和发展趋势。[本章主要内容]:1.1自然语言处理的定义(支撑课程目标1)1.2自然语言处理的应用领域(支撑课程目标1)1.3自然语言处理的发展历程(支撑课程目标1)1.4自然语言处理的研究现状和发展趋势(支撑课程目标1)1.5自然语言处理的知识和技术储备(支撑课程目标1)[本章重点]:对自然语言处理的定义和研究内容的理解自然语言发展历程中的技术发展综述[本章难点]:自然语言处理的技术更迭和趋势[本章思政教学内容]:中文自然语言处理难题与成果介绍中文自然语言处理的特点,遇到的难题,以及在中文自然语言处理研究中涌现出来的杰出人物,启发学生对母语的热爱和自豪感,激发学生向前辈学习,积极投身到中文自然语言处理的学习和研究中。第2章Python语言基础和机器学习常见算法[教学目的与要求]:掌握自然语言处理的编程和算法基础。[本章主要内容]:2.1Python编程基础(支撑课程目标2、4)2.2机器学习算法基础(支撑课程目标2、4)2.3深度学习框架PyTorch(支撑课程目标2、4)[本章重点]:机器学习算法[本章难点]:结合Python语言的机器学习算法编程技术。第3章中文分词[教学目的与要求]:掌握常见的中文分词算法。[本章主要内容]:3.1基于词表的分词算法(支撑课程目标2、4)3.2基于统计模型的分词算法(支撑课程目标2、4)3.3基于序列标注的分词算法(支撑课程目标2、4)3.4中文分词工具(支撑课程目标2、4)[本章重点]:基于统计模型的分词算法。基于序列标注的分词算法。[本章难点]:基于序列标注的分词算法。[本章思政教学内容]:介绍中文分词工具并讲解国内研究机构在中文分词研究上的贡献通过介绍并扩展哈工大LTP、中科院计算所NLPIR、清华大学THULAC和jieba等优秀的中文分词工具,进一步增强学生的民族语言和文化的自信,激发学生技术报国的热情。第4章关键词提取[教学目的与要求]:掌握常见的关键词提取算法。[本章主要内容]:4.1TextRank关键词提取算法(支撑课程目标2)4.2TF-IDF关键词提取算法(支撑课程目标2)[本章重点]:TextRank关键词提取算法。TextRank关键词提取算法。[本章难点]:不同关键词提取算法的原理解析第5章词向量技术[教学目的与要求]:了解词向量技术的发展历程,掌握Word2vec、BERT等词向量模型。[本章主要内容]:5.1词向量技术发展历程(支撑课程目标2)5.2Word2vec(支撑课程目标2)5.3注意力机制(支撑课程目标2)5.4深度学习概述(支撑课程目标2)5.5BERT预训练模型(支撑课程目标2)[本章重点]:Word2vec。BERT预训练模型。[本章难点]:注意力机制。BERT预训练模型。第6章文本分类[教学目的与要求]:了解文本分类任务,掌握常见的文本分类算法。[本章主要内容]:6.1基于统计方法的文本分类(支撑课程目标2)6.2基于深度学习的文本分类(支撑课程目标2)6.3开放领域文本分类(支撑课程目标2)[本章重点]:基于统计方法的文本分类。基于深度学习的文本分类。[本章难点]:算法的理论理解。算法的编程实践。第7章文本信息抽取[教学目的与要求]:了解文本信息抽取任务,掌握命名实体识别、关系抽取和事件抽取的常见模型。[本章主要内容]:7.1命名实体识别(支撑课程目标2)7.2实体关系抽取(支撑课程目标2)7.3事件抽取(支撑课程目标2)[本章重点]:基于BiLSTM+CRF的命名实体识别方法。基于PCNN的关系抽取方法。基于动态多池化卷积神经网络的事件检测模型[本章难点]:算法原理理解。算法编程实践。第8章机器阅读理解[教学目的与要求]:了解机器阅读理解任务,掌握机器阅读理解的常见模型。[本章主要内容]:8.1机器阅读理解发展历程(支撑课程目标2)8.2抽取式阅读理解(支撑课程目标2)8.3选择式阅读理解(支撑课程目标2)[本章重点]:抽取式BiDAF模型。选择题式CoMatch模型。[本章难点]:算法原理理解。算法编程实践。第9章文本生成与文本摘要[教学目的与要求]:了解文本生成与摘要任务,掌握文本摘要的常见模型。[本章主要内容]:9.1文本生成与文本摘要概述(支撑课程目标2)9.2抽取式文本摘要(支撑课程目标2)9.3生成式文本摘要(支撑课程目标2)9.4文本摘要案例(支撑课程目标2)[本章重点]:抽取式文本摘要相关模型。生成式文本摘要相关模型。[本章难点]:算法原理理解。算法编程实践。第10章对话系统[教学目的与要求]:了解对话系统任务和常见方法。[本章主要内容]:10.1任务型对话系统原理与方法(支撑课程目标2)10.2闲聊式对话系统原理与方法(支撑课程目标2)10.3基于Pytorch框架的对话系统实战(支撑课程目标2)[本章重点]:任务型对话系统原理与方法。闲聊式对话系统原理与方法。[本章难点]:算法原理理解。算法编程实践。五、课内实验5.1本课程实验教学的地位和作用自然语言处理实验是巩固和扩展课程理论知识的必要环节。5.2教学基本要求通过综合型实验,使学生进一步理解并掌握自然语言处理算法;能够基于具体实例要求,选择和设计相关自然语言处理算法并编程实现算法,测试评估算法性能。5.3实验内容及要求综合型实验由学生根据实验要求独立完成。实验共8个实践主题,每个主题2学时,共计16学时。(1)中文分词实验(2)关键词提取实验(3)文本分类实验(4)命名实体识别实验(5)关系抽取实验(6)机器阅读理解实验(7)文本摘要实验(8)对话系统实验5.4教学文件及教学形式教学文件:教材自带程序代码。教学形式主要包括:预习、课堂指导与实验操作、撰写实验报告。实验报告学生自拟。实验报告包括:描述实验目的、实验用设备及工具,绘详细叙述实验步骤,要有完整的实验数据和用图表表示的实验结果,以理论联系实际为出发点,总结实验中出现的问题及解决方法。5.5实验项目及学时分配序号实验项目实验学时实验类型实验类别实验性质1中文分词实验2验证专业必修2关键词提取实验2验证专业必修3文本分类实验2验证专业必修4命名实体识别实验2验证专业必修5关系抽取实验2验证专业必修6机器阅读理解实验2验证专业必修7文本摘要实验2验证专业必修8对话系统实验2验证专业必修5.6本课程实验用到的仪器设备计算机六、课程学时分配教学课次教学内容教学环节与计划时数教学环节计划时数1自然语言处理概述理论课22Python语言基础和机器学习常见算法;中文分词算法理论课23关键词提取理论课24词向量技术理论课25文本分类理论课26文本信息抽取理论课27文本信息抽取理论课28文本生成与文本摘要;对话系统理论课29中文分词实验实验课210关键词提取实验实验课211文本分类实验实验课212命名实体识别实验实验课213关系抽取实验实验课214机器阅读理解实验实验课215文本摘要实验实验课216对话系统实验实验课2七、课程考核与成绩评定7.1考核方式考核环节包括课程学习过程考核和期末课程总结,其中课程过程考核占总成绩的30%,分别由课堂表现、课后作业、实验情况进行评定;期末课程总结成绩占总成绩的70%。各环节的比重如下。考核环节比重合计过程考核(平时成绩)课堂表现10%30%作业10%实验10%期末成绩期末测试70%70%总计100%100%7.2考核内容及要求本课程为考试课。考核内容及分值分配如下。考核方式考核内容分值课程目标总分值期末考核70%自然语言处理概述2~4目标1、4100分Python语言基础和机器学习常见算法;中文分词算法2~5目标1、2、4关键词提取5~15目标2词向量技术5~15目标2文本分类5~10目标2文本信息抽取10~20目标2文本信息抽取5~15目标2文本生成与文本摘要;对话系统15~30目标2过程考核30%课堂表现课堂测试、出勤情况10目标2、3、515分课后作业作业完成情况10目标2、3、515分实验实验出勤、实验表现及实验报告10目标2、3、510分7.3成绩评定1.课堂表现课堂表现总分10分,由课堂测试与课堂出勤情况评定。其中,课堂测试满分7分,以客观题(填空、选择、判断)为主,每学期随堂测试15~20次,每次测试1~2道题目,每答错一道题目扣0.5分(直到扣满10分为止);课堂出勤满分7分,缺勤一次扣1分,迟到或请假扣0.5分。2.课后作业课后作业总分10分,由作业完成情况评定。每学期布置作业5次,每次作业占2分,评分标准如下;评分标准分值标准描述课后作业2能够按时认真完成作业、作业态度认真、书写清楚、分析计算正确。1能够按时完成作业、作业态度较好、书写较清楚、分析计算基本正确0不交作业或作业态度不认真、抄袭他人作业3.实验成绩实验成绩占所学课程的10%,即10分。根据学生的实验表现及实验报告结果,进行综合评定。具体评分标准如下表所示。评分标准分值标准描述实验表现(5)5无迟到、早退现象,态度端正,与同组同学配合认真完成实验电路硬件连接及调试,实验结束后,按要求整理工作台。4有迟到、早退现象或实验过程不够认真。3有迟到、早退现象且实验过程不认真。1有迟到、早退现象,实验过程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论