




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Python数据科学基础与实践教学大纲课程名称:Python数据科学英文名称:Python Data Sience学时学分:57课时,3学分适用专业:数据科学相关专业课程简介:Python编程语言本身简洁,优美,跨平台,功能超级强大,是人工智能时代最 流行的编程语言,也是美国主流大学最受欢迎入门编程语言。美计算机科学系ToplO中有8 家Top39中24家,在编程入门课程中教授Python。三家最大的M00C网络课程服务商edX、 Coursera和Udacity也全都提供了 Python入门编程语言。Python数据科学课程以实践应用任务为导向,全面实践数据分析、数据挖掘与文 本挖掘的流程与
2、python数据分析库、数据挖掘库、文本挖掘功能的应用。内容涵盖python 编程基础、python数据科学生态系统的numpy数值计算、pandas数据预处理与数据分析、 matplotlib数据可视化、使用scikitTearn构建基本数据挖掘模型、python中文文本处理 (分词、词频统计、词云)、文本情感分析、主题模型等。有条件的单位,可以介绍深度学 习的入门知识,并基于pytorch进行实践。教学目标:(一)教学目的1、掌握python编程基础(如同学有基础的话,可直接从python范儿编程开始讲解)。2、掌握python数据科学生态系统包的应用:numpy、pandas matpl
3、otlib等。3、掌握scikitTearn构建基本的数据挖掘模型。4、掌握python中文文本挖掘的理论与技术。5、掌握深度学习的基本概念、原来与深度学习常用模型的应用(有条件的单位)。(二)能力目标1、基本的编程能力,能够使用python进行基本的数据采集与处理。2、基本的数据分析能力,能够使用python来解决实际的数据分析问题。3、基本的数据挖掘能力,能够使用python实现决策树模型、最近邻、贝叶斯、神经网络、 集成学习模型等基本的数据挖掘任务c4、基本的中文文本挖掘能力,能够使用python进行中文文本特征提取、分类、聚类、情感 分析观点挖掘以及主题模型等任务。教学方式:建议采用直
4、接边讲解边操作的教学方式(可以在机房或同学们携带笔记本电脑 在教室);以教师知识讲解、案例教学、学生讨论和上机实验相结合的教学方式。考核方式:本课程的考核采用考查方式,成绩采用百分制,成绩的评定包含平时成绩和期 末成绩。平时成绩以课堂发言、平时作业判定,占总成绩的50%;期末考试主要采用重点知 识考试、案例分析和实践工程的形式,占总成绩的50%。教材及参考文献:.Python数据科学基础与实践,王仁武,(北京)人民邮电出版社,出版时间:2021 年11月。.Python数据挖掘:概念、方法与实践,美梅甘斯夸尔,(北京)机械工业出版 社,出版时间:2017年05月。任课教师:xxx (57课时)
5、主要章节内容:1、数据科学概述(2课时)数据科学的概念以及如何学习数据科学,数据科学家的概念以及数据科学家应具备的能 力,python与数据科学以及python常用的数据科学包。Python jupyter notebook的开发 环境安装与简单使用。2、Python基础知识(7课时)常量、变量、字符串处理、列表/元组/字典、编程语法、函数、模块、异常处理、文件 读写、python范儿编程。(如果同学们有python基础编程知识,可以简单复习一下,然后 从python范儿编程开始教学)3、Python 常用数据库学库:numpy pandas matplotlib (9 课时)Numpy数值计
6、算、Pandas数据预处理pandas数据分析、matplotlib数据可视化4、python数据获取(6课时)数据及其类型,数据获取方法、网络爬虫基础、request+lxml+xpath selenium、正那么 表达式等。5、python数据分析(9课时)数据分析基础,描述性统计分析,主成分分析、回归分析等。6、python数据挖掘(12课时)数据挖掘概述、分类算法评估、Scikit-learn. C5.0/CART决策树、贝叶斯分类器、人工神 经网络。7、python文本挖掘(9课时)文本挖掘概述、中文分词、词云、词向量,文本分类与情感分析、主题模型等。8、综合应用与案例分析(3课时)
7、小组工程汇报与讨论分析。有条件的单位,例如能安排4学时的,可以增加深度学习的内容。大纲撰写人:Python与数据分析实务教学大纲课程名称:Python与数据分析实务英文名称:Python and Data Analysis Practice学时学分:36课时,2学分适用专业学位类别(领域):图情专业、情报学、工商管理课程简介:Python编程语言本身简洁,优美,跨平台,功能超级强大,是人工智能时代最 流行的编程语言,也是美国主流大学最受欢迎入门编程语言。美计算机科学系ToplO中有8 家Top39中24家,在编程入门课程中教授Python。三家最大的M00C网络课程服务商edX、 Course
8、ra和Udacity也全都提供了 Python入门编程语言。Python与数据分析实务课程以实践应用任务为导向,全面实践数据分析与数据挖 掘的流程与python数据分析库的应用。内容涵盖pylhon编程基础、python数据科学生态 系统的numpy数值计算、pandas数据预处理与数据分析、matplotlib数据可视化、使用 scikitTearn构建基本数据挖掘模型、python中文文本处理(分词、词频统计、词云)、 文本情感分析等。教学目标:(一)教学目的1、掌握python编程基础。2、掌握python数据科学生态系统包的应用:numpy pandas matplotlib等。3、掌
9、握scikit-learn构建基本的数据挖掘模型。4、掌握python中文文本挖掘的理论与技术。(二)能力目标1、基本的编程能力,能够使用python进行基本的数据采集与处理。2、基本的数据采集处理、数据分析能力,能够使用python来解决实际的数据分析问题。3、基本的数据挖掘能力,能够使用python实现决策树模型、最近邻、贝叶斯、神经网络、 集成学习模型等基本的数据挖掘任务。4、基本的中文文本挖掘能力,能够使用python进行中文文本特征提取、分类、聚类、情感 分析与观点挖掘等任务。教学方式:采用上机讲授与实验教学相结合;以教师知识讲解、案例教学、学生讨论和上 机实验相结合的教学方式。考核
10、方式:本课程的考核采用考查方式,成绩采用百分制,成绩的评定包含平时成绩和期末成绩。平时成绩以课堂发言、平时作业判定,占总成绩的40版 期末考试主要采用重点知识考试、案例分析和实践工程的形式,占总成绩的60虬教材及参考文献:.Python数据分析与应用,黄红梅、张良均,(北京)人民邮电出版社,出版时间:2018年04月。.Python与数据科学,王仁武,(上海)华东师范大学出版社,出版时间:2016年03月。.Python数据挖掘:概念、方法与实践,美梅甘斯夸尔,(北京)机械工业出 版社,出版时间:2017年05月。任课教师:王仁武(36课时)主要章节内容:1、Python基础知识(8课时)常量
11、、变量、字符串处理、列表/元组/字典、编程语法、函数、模块2、IPython 基础:numpy、matplotlib pandas (10 课时)Numpy数值计算、matplotlib数据可视化Pandas数据预处理、pandas数据分析3、python数据采集(6课时)网络爬虫基础、request、bs4 lxml xpath selenium、正那么表达式等。4、scikitTearn分类预测(4课时)Scikit-learn. C5.O/CART决策树、KNN分类器、贝叶斯分类器、ANN、集成学习、分类 各类评估方法。5、python文本应用(4课时)中文分词、词云、词向量、情感分析等
12、。6、综合应用与案例分析(4课时)小组工程汇报与讨论分析大纲撰写人:文本挖掘教学大纲课程名称:文本挖掘英文名称:Text Mining学时学分:36课时,2学分适用专业学位类别(领域):应用统计专业硕士、图情专业硕士、情报学硕士课程简介:文本挖掘课程将向学习者介绍文本处理、文本分析与文本挖掘的基础知识, 注重理论联系实际,全部知识点都使用python进行实验,在jupyter notebook环境下实践。 课程共分五个局部,首先介绍了文本挖掘的基本概念、特点、应用范围,详细阐述文本的特 征提取、语言模型以及文本表示,进一步介绍python的jupyer notebook开发环境以及基 础包nu
13、mpy、pandas的应用,并实验利用python处理文本(分词、词云、词向量、词的相 似度计算等);第二局部介绍使用python如何编写采集文本信息的网络爬虫程序、详细介 绍对文本操纵的正那么表达式(搜索文本)以及文本清洗等;第三局部介绍文本分析与文本 挖掘中python机器学习包的使用以及深度学习卷积神经网络与循环神经网络的基础知识; 第四局部介绍目前最重要的两大深度学习开发框架之一上升势头最猛的pytorch的基础知 识,应知应会的内容,以便为后续的文本挖掘应用打好基础;第五局部介绍基于深度学习的 文本挖掘的应用,例如文本的分类,文本的情感分析与观点挖掘,文本序列分析中的命名实 体识别、
14、实体关系抽取等。课程内容与教学安排比拟重视操作实践,学员通过学习,掌握课程相关知识后,可以直 接走向应用实践。教学目标:(一)教学目的1掌握文本挖掘的一些基本概念、原理及相关技术,特别是深度学习的方法技术。2、掌握如何用python编程方法来解决实际文本挖掘应用问题。3、了解文本挖掘国内外开展状况及开展方向,为相关科学研究打下一定的基础。(二)能力目标1、课程涉及一些重要且抽象的概念,例如:文本特征抽取、文本表示、语言模型、网络爬 虫、命名实体识别、关系抽取、主题模型、循环神经网络、情感分析与观点挖掘等。学员应 熟练掌握这些概念以及其中一些算法的原理及应用。2、学员应能掌握文本挖掘的编程方法,
15、例如使用Python等来解决实际应用问题,进一步 掌握目前文本挖掘必须具备的机器学习与深度学习的基本技术方法。3、学员应能掌握文本挖掘应用于企业运营管理的理念,能从商业需求和商业实战出发,达 到以业务为核心、以思路为重点、以技术为辅助的某领域文本挖掘高级人才。教学方式:采用课堂讲授与实践教学相结合;以教师知识讲解、实验教学、案例教学、学 生讨论和上机实验相结合的教学方式,其中实验教学占比拟大。考核方式:本课程的考核采用考查方式,成绩采用百分制,成绩的评定包含平时成绩和期 末成绩。平时成绩以课堂发言、平时个人作业、小组大作业判定,占总成绩的40%;期末考 试主要采用重点知识考试、案例分析和论文的
16、形式,占总成绩的60%。教材及参考文献:.自编讲义。.文本挖掘,美迈克尔W.贝瑞(Michael W. Berry),(北京)机械工业出版社, 出版时间:2019年。月。.文本分析与文本挖掘,姜维,(北京)科学出版社,出版时间:2019年10月。任课教师:王仁武(36课时)主要章节内容:1、文本挖掘概述与python开发环境(8课时)文本挖掘基本概念、特点与应用,文本特征提取,中文分词,语言模型,文本表示、文 本的量化:TFIDF、词向量等,文本相似度计算等;python jupyter notebook 开发环境 Anaconda 安装使用,jupyter notebook 基础,numpy、 pandas 基础。2、文本数据采集与处理(4课时)网络爬虫、正那么表达式、文本清洗等。3、文本挖掘中的机器学习与深度学习基础(8课时)Python机器学习包scikitTearn应用(常用
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年山东城市建设职业学院高职单招高职单招英语2016-2024历年频考点试题含答案解析
- 2025年宁波职业技术学院高职单招高职单招英语2016-2024历年频考点试题含答案解析
- 2025年天津国土资源和房屋职业学院高职单招(数学)历年真题考点含答案解析
- 消化内科护理带教老师总结
- Camtasia知识课件视频教
- 大学生思想教育
- 体育与健康课程标准
- 人教版数学小学六年级下册《第一课成正比例的量》习题
- 民办四川天一学院《设备安装课程实训》2023-2024学年第二学期期末试卷
- 哈尔滨北方航空职业技术学院《Hydraulics》2023-2024学年第二学期期末试卷
- 2025年4月自考13887经济学原理中级押题及答案
- 小学校长在月度教师会议总结发言:教学、管理、成长全回顾
- 公司事故隐患内部报告奖励制度
- 如何通过合理膳食安排促进婴幼儿成长发育
- JJF(纺织) 061-2024 圆盘取样器校准规范
- 智能健康养老服务人才培养创新与实践探索
- 人教版(2024)七年级下册生物期中复习必背知识点提纲
- 统编历史七年级下册(2024版)第8课-北宋的政治【课件】j
- 抖音陪跑合同范本
- 2025年度灰渣采购与运输一体化服务合同
- 城中村改造项目建设方案
评论
0/150
提交评论