Python自然语言处理PPT1附录 教学大纲_第1页
Python自然语言处理PPT1附录 教学大纲_第2页
Python自然语言处理PPT1附录 教学大纲_第3页
Python自然语言处理PPT1附录 教学大纲_第4页
Python自然语言处理PPT1附录 教学大纲_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE5附录教学大纲课程名称:python自然语言处理适用专业:计算机科学与技术、软件工程、人工智能、大数据等专业先修课程:概率论与数理统计、Python程序设计语言总学时:56学时授课学时:30学时实验(上机)学时:26学时一、课程简介本教材包括自然语言处理概述、Python语言简述、Python数据类型、Python流程控制、Python函数、Python数据分析、Sklearn和NLTK、语料清洗、特征工程、中文分词、文本分类、文本聚类、指标评价、信息提取和情感分析。二、课程内容及要求第1章自然语言处理概述(2学时)主要内容:1人工智能发展历程 2自然语言处理 3机器学习算法4自然语言处理相关库5.语料库基本要求:了解人工智能发展历程、自然语言处理相关内容;机器学习算法相关概念;了解基于Python与自然语言处理的关系;了解语料库的相关概念。重点:自然语言处理相关内容、机器学习算法难点:基于Python的相关库第2章Python语言简介(2学时)主要内容:1.python简介2.Python解释器3python编辑器4代码书写规则基本要求:了解python简介、熟悉Python解释器、掌握python编辑器、了解代码书写规则重点:掌握python编辑器、了解代码书写规则难点:掌握python编辑器第3章Python数据类型(4学时)主要内容:1.常量、变量和表达式2.基本数据类型3.运算符与表达式4.列表5.元组6.字符串7.字典8.集合基本要求:理解数据类型的概念、作用以及Python语言的基本数据类型;掌握常量、变量基本概念;掌握Python语言各类运算符的含义、运算符的优先级和结合性、表达式的构成以及表达式的求解过程。掌握序列基础知识;熟练掌握列表的定义、常用操作和常用函数;熟练掌握元组的定义和常用操作;熟练掌握字典的定义和常用操作;掌握字符串格式化、字符串截取的方法;理解与字符串相关的重要内置方法。熟练掌握字典的定义和常用操作;熟练掌握集合的定义和常用操作。重点:数据类型的作用、变量的定义,各类运算符以及构成的表达式的求解。序列、列表、元组的定义和常用操作。字典、集合的定义和常用操作。难点:运算符的优先级和结合性。列表常用函数的应用,字符串的应用。字典及集合的应用。第4章Python流程控制(4学时)主要内容:1.数据输入与输出2.顺序结构3.单分支选择结构4.双分支选择结构5.多分支选择结构6.while循环结构7.for语句结构8.循环的嵌套基本要求:掌握程序的三种基本结构;掌握顺序结构程序设计;熟练掌握Python语言中输入输出格式的规则和用法。熟练掌握if语句的三种形式和用法以及if语句的嵌套使用;掌握分支结构的应用。熟练掌握循环结构while、for语句的规则和用法;熟悉continue、break、pass语句的用法;掌握循环结构的嵌套规则。重点:数据的输入输出。if语句的三种形式和使用方法。while、for语句的规则和用法;循环结构的应用。难点:格式化输出的规则和用法。分支结构的应用。循环的嵌套。第5章Python函数(4学时)主要内容:1.函数声明与调用2.函数传参3.lambda函数4.递归函数基本要求:理解函数的作用;熟练掌握函数定义和函数调用的规则和用法;掌握函数参数传递的规则和用法;lambda函数;理解函数的嵌套和递归调用。重点:函数的作用、定义和调用;参数分类。难点:函数的参数传递、递归调用。第6章Python数据分析(4学时)1.科学计算2.Numpy3Scipy4matplotlib5Pandas6Seaborn 基本要求:了解科学计算的基本概念;掌握Numpy、Scipy、matplotlib、Pandas、Seaborn的函数使用方法 重点:Numpy、Scipy、matplotlib和Pandas难点:Numpy、matplotlib和Pandas第7章Sklearn和NLTK(4学时)主要内容:1.Sklearn2基于Sklearn机器学习3.NLTK4NlTK语料库5NlTK文本分类 基本要求:了解Sklearn的基本功能,数据集,了解基于Sklearn机器学习流程。了解NLTK的基本功能、NLTK语料库以及NL文本分类。重点:Sklearn与NLTK难点:Sklearn与NLTK第8章语料清洗(4学时)主要内容:1数据清洗方法1.1缺失值清洗 1.2异常值清洗 1.3重复值清洗2数据转换3missingno4词云基本要求:了解数据清洗,掌握缺失值、异常值和重复值的处理方法;掌握missingno和词云使用方法重点:数据转换、数据清洗难点:缺失值、异常值和重复值清洗方法第9章特征工程(4学时)主要内容:1特征预处理 1.1规范化 1.2标准化 1.3鲁棒化 1.4正则化2独热编码3CountVectorizer4TF-IDF基本要求:了解特征预处理,掌握规范化和标准化的处理方法。掌握独热编码、CountVectorizer和TF-IDF基本原理和使用方法重点:特征工程预处理、独热编码难点:独热编码、CountVectorizer、TF-IDF第10章中文分词(4学时)主要内容: 1常见中文分词方法1.1基于规则和词表方法1.2基于统计方法 2Jieba分词库 3HanLP分词库 基本要求:了解常见中文分词方法,掌握Jieba分词库和HanLP分词库。重点:Jieba分词库和HanLP分词库难点:Jieba分词库和HanLP分词库第11章文本分类(4学时)主要内容:1历史回顾2贝叶斯定理 3朴素贝叶斯分类 3.1GaussianNB类 3.2MultinomialNB类 3.3BernoulliNB类 4支持向量机4.1线性核函数 4.2多项式核函数 4.3高斯核函数5贝叶斯进行垃圾邮件分类基本要求:了解文本分类的历史回顾、文本分类的相关方法;掌握贝叶斯定理、朴素贝叶斯分类;了解支持向量机原理,掌握线性核函数、多项式核函数和高斯核函数。重点:贝叶斯定理、朴素贝叶斯分类难点:朴素贝叶斯分类、支持向量机分类第12章文本聚类(4学时)主要内容:1文本聚类步骤2主成分分析 3Kmeans算法步骤 4Kmeans评估指标4.1调整兰德系数4.2轮廓系数5掌握Kmeans进行英文和中文聚类 基本要求:了解文本聚类步骤,掌握主成分分析、掌握Kmeans算法步骤,掌握调整兰德系数和轮廓系数、掌握Kmeans进行英文和中文聚类 重点:聚类算法、主成分分析、k-means算法步骤难点:主成分分析、K-means算法流程,Kmeans进行英文和中文聚类第13章指标评价(4学时)主要内容:1混淆矩阵2准确率3精确率4召回率5F1score6ROC曲线7AUC面积8分类评估报告9中文分词的指标10未登录词和登录词召回率基本要求:掌握混淆矩阵、准确率、精确率与召回率、F1score、ROC曲线、AUC面积和分类评估报告,中文分词的指标、未登录词和登录词召回率重点:混淆矩阵和分类评估报告难点:混淆矩阵、精确率与召回率、ROC曲线、AUC面积,中文分词的指标、未登录词和登录词召回率第14章信息提取(4学时)主要内容: 1相关概念 1.1信息 1.2信息熵 1.3互信息 2正则表达式 2.1基本语法 2.2re模块 3命名实体 4马尔可夫模型 基本要求:了解信息提取的相关概念,如信息、信息熵、互信息等。掌握正则表达式的基本语法和re模块。了解命名实体和马尔可夫模型的特点和使用方式。重点:正则表达式的基本语法和re模块、马尔可夫模型难点:正则表达式的基本语法和re模块 第15章情感分析(4学时)主要内容:1情感分析概述2基于情感词典方法 3textblob 3.1分句和分词 3.2词性标注 3.3情感分析 4snownlp 4.1分词 4.2词性标注 4.3断句 4.4情绪判断 5小说人物情感分析6电影影评情感分析基本要求:了解情感分析概念、了解基于情感词典的文本匹配算法、掌握textblob和snownlp、掌握小说人物和电影影评情感分析重点:掌握textblob和snownlp难点:掌握textblob和snownlp、掌握小说人物和电影影评情感分析三、教学安排及学时分配教学环节及学时主要内容学时分配讲课习题课实验小计自然语言处理概述22Python语言简介22Python数据类型224Python流程控制224Python函数224Python数据分析224Sklearn和NLTK224语料清洗224特征工程224中文分词224文本分类224文本聚类224指标评价224信息提取224情感分析224302656四、考核方式最终成绩由课堂成绩、实验成绩和期末大作业组成:(1)课堂成绩:30%。主要考核课堂和翻转课堂表现,课后作业完成情况。(2)实验成绩:30%,包括课堂小测、实验报告等,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论