《Python数据分析》实验教学大纲_第1页
《Python数据分析》实验教学大纲_第2页
《Python数据分析》实验教学大纲_第3页
《Python数据分析》实验教学大纲_第4页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

课程代码308000012课程名称Python数据分析适用专业软件工程先修课程Python语言程序设计实验性质非独立设课开设学期第5学期实验方式上机操作周数(学时)24学分1学分课程目标(1)职业规范与道德修养:通过学习Python数据分析的理论和实践知识,培养学生的社会责任意识。使学生意识到数据的安全性将直接影响到社会的利益和公共利益,作为数据分析师应该担负起相应的责任,并以人民的利益为中心,始终坚守法律法规、伦理道德和职业操守。(2)知识应用能力:能够运用Python有关数据分析的常用类库,对收集来的大量数据进行科学计算、统计分析和可视化绘图,从而提取出有用的信息,为科学、客观的决策提供积极性的帮助。(3)问题分析能力:能够根据Python数据分析的结果,发现可能存在的问题,预测未来发展的趋势,提出改进的方案以规避风险。(4)设计能力:能够设计符合企业或个人业务需求的数据分析方案,并能够在科学计算、统计分析和可视化绘图环节中体现创新意识,具备开发简单项目的能力。(5)沟通能力:能够和企业或个人业务方进行有效的沟通,了解业务部门的工作流程、评价标准等,从而在解读数据时能够更贴近业务的思路,对其提出的建议和需求提供更好的数据分析方案。(6)终身学习能力:能够跟踪大数据技术前沿,持续提高加工和应用数据的能力,不断拓展数据的应用方法,通过严谨的逻辑推理形成想要的决策支持和产品化的应用;提升职业素养,适应数据分析行业及相关职业发展。教学要求(1)能够理解数据分析技术体系和主要技术;(2)能够综合运用Python与数据分析基本知识对数据进行分析和可视化绘图;(3)掌握综合分析能力,解决专业相关实际问题;(4)通过讨论、实验实训、撰写报告等方式提升有效沟通;(5)理解并遵守数据分析领域的职业道德和规范。一、实验的性质、目的和任务1.实验性质本课程的实验性质是非独立设置实验课,在实验实训室中采用上机操作进行。2.主要目的本课程培养学生使用Python技术进行数据分析的能力。Python数据分析的主要库有:NumPy、Pandas、Matplotlib、jieba。3.主要任务(1)熟悉Python数据分析环境搭建。(2)掌握NumPy、Pandas、Matplotlib、jieba的主要函数作用和使用。(3)应用NumPy、Pandas、Matplotlib、jieba库解决实际问题。二、实验的基本内容和要求序号实验项目天数(学时数)实验属性内容与要求1Python数据分析环境搭建2验证性内容:(1)搭建Python数据分析环境;(2)使用相关开发工具完成简单程序的编写。要求:(1)掌握Python数据分析环境搭建;(2)掌握开发工具的基本使用。2科学计算库Numpy4验证性内容:(1)创建矩阵;(2)索引与切片;(3)数组操作;(4)数组运算;(5)线性代数运算。要求:(1)掌握NumPy数组的创建、操作;(2)掌握NumPy数组的索引和切片;(3)掌握NumPy数组的运算;(4)掌握NumPy数组的线性代数运算。3数据分析工具Pandas4验证性内容:(1)DataFrame的创建和行列操作;(2)DataFrame的高级索引;(3)Pandas数据运算;(4)统计函数;(5)层次划索引;(6)读写数据操作。要求:(1)掌握DataFrame数据结构的创建和基本使用;(2)掌握读写外部数据的方法;(3)掌握DataFrame的高级索引函数;(4)掌握Pandas的数据运算,包括算术运算、函数映射、排序、迭代等运算,以及统计函数。4数据预处理4验证性内容:(1)数据清洗:重复值清洗、缺失值清洗、检测异常值;(2)数据合并连接和重塑;(3)数据变换:虚拟变量、连续属性离散化、规范化。要求:(1)掌握重复值、缺失值和异常值的检测与处理方法,能够对大量数据进行清洗;(2)掌握数据的合并、连接和重塑,能够根据计算、分析需要对数据结构进行处理;(3)掌握常用数据变换的方法,能够根据分析需要和数据特点对数据进行变换。5数据聚合和分组运算2验证性内容:(1)通过groupby()方法将数据拆分成组;(2)数据聚合;(3)分组级运算。要求:(1)掌握groupby()方法,可以按照不同的规则进行分组;(2)掌握聚合操作,会使用统计方法和聚合方法聚合数据;(3)掌握其他分组级运算方法的使用。6数据可视化4验证性内容:(1)Matplotlib绘制图表;(2)Seaborn绘制统计图形;(3)Bokeh交互式可视化库。要求:(1)掌握Matplotlib绘制图表的常用方法,主要包括创建画布、创建单个和多个子图、添加和选中子图、添加各类标签、绘制常见图表、本地保存图形;(2)了解seaborn的基本使用。7时间序列分析2设计性内容:(1)时间序列的基本操作;(2)固定频率的时间序列;(3)时间周期及计算;(4)重采样;(5)数据统计-滑动窗口。要求:(1)能够创建时间序列对象;(2)能够使用时间戳索引和切片选取子集;(3)学会创建固定频率的时间序列,能够调整时间序列的频率;(4)掌握Period(时期),转换时期的频率;(5)掌握重采样,实现降采样和升采样;(6)熟悉滑动窗口的使用。8文本数据分析2设计性内容:(1)文本数据分析工具;(2)文本预处理;(3)文本情感分析;(4)文本相似度;(5)文本分类。要求:(1)掌握安装和使用NLTK与jieba工具的方法;(2)掌握文本预处理的流程;(3)能够用NLTK分析情感倾向;(4)能够结合NLTK与余弦相似度实现相似度分析;(5)能够结合NLTK与算法对文本进行分类。合计24三、主要仪器设备及材料多媒体计算机、、课程相关软件(Pycharm、Windows)。四、实验的考核办法实验考核内容主要分为:实验过程、实验代码和实验报告三部分。实验过程考核主要考查学生课程出勤、实验态度、实验任务完成情况、实验过程中分析问题和解决问题的能力等方面;实验代码考核主要考查学生编写代码的规范性、正确性和代码质量等方面;实验报告考核主要是考查实验报告内容的完整性、正确性和规范性等方面。以上三部分分别占三分之一的分数。五、指导书与参考资料指导书:《Python数据分析与应用(第2版)》,曾文权主编,\o"人民邮电出版社"人民邮电出版社,2022年8月第2版。参考资料:1、中国大学MOOC,Python数据分析/course/terms/1461654457.htm?from

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论