Python数据分析实战-从Excel轻松入门Pandas_第1页
Python数据分析实战-从Excel轻松入门Pandas_第2页
Python数据分析实战-从Excel轻松入门Pandas_第3页
Python数据分析实战-从Excel轻松入门Pandas_第4页
Python数据分析实战-从Excel轻松入门Pandas_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Python数据分析实战——从Excel轻松入门Pandas读书笔记模板01思维导图读书笔记作者介绍内容摘要目录分析精彩摘录目录0305020406思维导图实战数据表格技术处理数据结构数据表格第章案例技术处理记录表时间合并修改列排序本书关键字分析思维导图内容摘要内容摘要本书从零开始系统讲解了使用Pandas导入Excel数据,然后使用Pandas技术对数据做整理和分析,最后导出为不同形式的Excel文件。完整实现了数据的导入、处理、输出的处理流程。全书共10章。第1章为Pandas数据处理环境的搭建,第2章为使用Pandas对Excel数据读取与保存,第3章介绍与Pandas底层数据相关的NumPy库,第4章介绍了Pandas中DataFrame表格的增、删、改、查等常用操作,第5章介绍了对Series与DataFrame两种数据的运算、分支、遍历等处理,第6章介绍了字符串的各种清洗技术,第7章介绍时间戳与时间差数据的处理,第8章介绍Pandas中分层索引及与索引相关的操作,第9章介绍了对数据的分组处理及做数据透视表处理,第10章介绍了表格的数据结构转换,以及多表读取与保存。书中包含相应示例,不仅可以学会理论知识还可以灵活应用。读书笔记读书笔记从入门的角度,尤其在Excel的应用上,我觉得有它的实用性。基本上了解了pandas的主要数据处理的功能,配合案例很容易理解,是一本不错的工具书。目录分析1.2Python基础操作1.1Pandas环境配置第1章Pandas数据处理环境搭建1.1Pandas环境配置1.1.1安装Python发行版本Anaconda1.1.2程序编写工具JupyterNotebook1.2Python基础操作1.2.1变量1.2.2注释1.2.3代码缩进1.2.4数据结构1.2.5控制语句1.2.6函数2.1读取Excel文件数据2.2读取CSV文件数据2.3保存为Excel文件格式2.4保存为CSV文件格式2.5Pandas中表格的结构12345第2章Pandas中数据的存取2.5Pandas中表格的结构2.5.1DataFrame数据结构2.5.2Series数据结构3.1NumPy的定义3.2NumPy数组的创建与转换3.3NumPy数组的预处理3.4NumPy数组维度转换3.5Series数据的创建3.6DataFrame表格的创建010302040506第3章NumPy数据处理基石3.2NumPy数组的创建与转换3.2.1普通数组3.2.2序列数组3.2.3随机数组3.2.4转换数组3.3NumPy数组的预处理3.3.1类型转换3.3.2缺失值处理3.3.3重复值处理3.4NumPy数组维度转换3.4.1数组维度转换3.4.2数组合并3.6DataFrame表格的创建3.6.1使用NumPy数组创建DataFrame表格3.6.2使用Python列表创建DataFrame表格3.6.3使用Python字典创建DataFrame表格4.1表格属性获取与修改4.2表格的切片选择4.3添加表格的行和列4.4删除表格的行和列4.5表格数据的修改4.6巩固案例010302040506第4章表格管理技术4.1表格属性获取与修改4.1.1表格属性的获取4.1.2表格属性修改4.2表格的切片选择4.2.1切片法4.2.2筛选法4.2.3loc切片法4.2.4iloc切片法4.3添加表格的行和列4.3.1添加行4.3.2添加列4.4删除表格的行和列4.4.1删除行4.4.2删除列4.4.3删除有缺失值的行和列5.1数据运算处理5.2数据分支判断5.3数据遍历处理5.4数据统计处理5.5巩固案例12345第5章数据处理基础5.1数据运算处理5.1.1运算符与运算函数5.1.2Series与单值的运算5.1.3DataFrame与单值运算5.1.4Series与Series运算5.1.5DataFrame与DataFrame运算5.1.6DataFrame与Series运算5.1.7数据运算时的对齐特性5.2数据分支判断5.2.1条件判断处理1(mask()与where())5.2.2条件判断处理2(np.where())5.3数据遍历处理5.3.1遍历Series元素(map())5.3.2遍历DataFrame行和列(apply())5.3.3遍历DataFrame元素(applymap())5.4数据统计处理5.4.1聚合统计5.4.2逻辑统计5.4.3极值统计5.4.4排名统计5.5巩固案例5.5.1根据不同蔬菜的采购数量统计每天采购金额5.5.2筛选出成绩表中各科目均大于或等于100的记录5.5.3筛选出成绩表中各科目的和大于或等于300的记录5.5.4统计每个人各科目总分之和的排名5.5.5统计每个人所有考试科目的最优科目6.1正则6.2拆分6.3提取6.4查找第6章字符串清洗技术6.5替换6.6长度6.7重复6.8修剪6.9填充6.10去重010302040506第6章字符串清洗技术6.11排序6.12合并6.13扩展6.14巩固案例第6章字符串清洗技术6.1正则6.1.1正则表达式的导入与创建6.1.2正则表达式处理函数6.1.3正则表达式编写规则6.2拆分6.2.1普通拆分6.2.2正则拆分6.2.3拆分次数6.2.4拆为表格6.2.5实例应用6.3提取6.3.1将数据提取到列方向6.3.2将数据提取到行方向6.3.3实例应用6.4查找6.4.1查找位置6.4.2查找判断6.4.3查找数据6.4.4实例应用6.5替换6.5.1Series数据替换6.5.2DataFrame表格替换6.5.3实例应用6.9填充6.9.1元素填充6.9.2字符填充6.10去重6.10.1重复项判断6.10.2重复项删除6.11排序6.11.1单列排序6.11.2多列排序6.11.3自定义排序6.12合并6.12.1Series数据自身元素合并6.12.2Series数据与其他数据合并6.14巩固案例6.14.1筛选出分数中至少有3个大于或等于90分的记录6.14.2两表查询合并应用6.14.3给关键信息加掩码6.14.4提取文本型单价后与数量做求和统计6.14.5提取不重复名单6.14.6对文本中的多科目成绩排序7.1时间戳7.3巩固案例7.2时间差第7章日期和时间处理技术7.1时间戳7.1.1单个时间戳7.1.2时间戳序列7.1.3时间戳转换7.1.4时间戳信息获取7.2时间差7.2.1单个时间差7.2.2时间差序列7.2.3时间差信息获取7.2.4时间差偏移7.3巩固案例7.3.1根据出生日期计算年龄7.3.2将不规范日期整理为标准日期7.3.3根据开始时间到结束时间的时长计算金额7.3.4根据借书起始时间及租借天数计算归还日期8.1Pandas索引8.2分层索引的设置8.3分层索引设置的4种方法8.4文件导入导出时分层索引设置第8章高级索引技术8.5行索引与列数据的相互转换8.6分层索引切片8.7索引的修改8.8巩固案例第8章高级索引技术8.1Pandas索引8.1.1Series索引8.1.2DataFrame索引8.2分层索引的设置8.2.1Series的分层索引设置8.2.2DataFrame的分层索引设置8.5行索引与列数据的相互转换8.5.1列数据设置为行索引8.5.2行索引设置为列数据8.6分层索引切片8.6.1选择单行8.6.2选择单列8.6.3选择单值8.6.4选择多行多列8.6.5选择指定级别数据8.6.6筛选索引8.7索引的修改8.7.1索引重命名8.7.2索引重置8.7.3索引排序8.7.4索引层级交换8.7.5索引删除8.8巩固案例8.8.1筛选出下半年总销量大于上半年的记录8.8.2对文本型数字月份排序8.8.3根据分数返回等级设置索引9.1分组处理9.3巩固案例9.2数据透视表第9章数据汇总技术9.1分组处理9.1.1分组9.1.2聚合9.1.3转换9.1.4过滤9.1.5高级分组9.2数据透视表9.2.1指定索引方向分组聚合9.2.2多列执行单种聚合9.2.3单列执行多种聚合9.2.4多列执行多种聚合9.2.5指定列做指定聚合9.2.6行索引和列索引分组聚合9.2.7跟列数据长度相同的数组做分组9.2.8数据透视表缺失值处理9.2.9数据透视表的行和列总计设置9.3巩固案例9.3.1提取各分组的前两名记录9.3.2按条件筛选各分组的记录9.3.3提取各分组下的唯一值9.3.4分组批量拆分表格到Excel文件9.3.5将数据透视表拆分为Excel文件10.1表格方向转换10.2表格纵横拼接10.3表格数据存取10.4巩固案例第10章表格转换技术10.1表格方向转换10.1.1列索引数据转换成行索引数据10.1.2将行索引数据转换成列索引数据10.2表格纵横拼接10.2.1表格纵向拼接(初级)10.2.2表格纵向拼接(进阶)10.2.3表格横向拼接(初级)10.2.4表格横向拼接(进阶)10.3表格数据存取10.3.1批量读取10.3.2批量保存10.4巩固案例10.4.1多个工作表数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论