版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章Chapter4数据处理与应用1234.1常用表格数据处理4.2大数据处理4.3大数据的典型应用数据处理EXCEL表格处理数据处理Python编程处理numpy:科学计算的基础库scipy:高等数学,信号处理等pandas:数据处理与分析matplotlib:数据可视化编程处理数据pandas模块利用pandas模块处理数据
pandas是基于numpy的数据分析模块,提供了大量标准数据模型和高效操作大型数据集所需要的工具,
为Python数据分析提供了高性能,且易于使用的数据结构,即Series(一维结构)
和DataFrame(二维结构)导入:importpandasaspd编程处理数据Series利用pandas模块处理数据
Series:是一种一维的数据结构,由1个索引列(index)+1个数据列(value)组成,索引值默认是从0起递增的整数,Series的索引也可以指定,类型可以是字符串类型。索引列(标签)数据列(数据值)数据值类型编程处理数据Series利用pandas模块处理数据列表创建创建Series对象index指定索引名编程处理数据Series利用pandas模块处理数据创建Series对象字典创建index匹配字典键编程处理数据Series利用pandas模块处理数据创建Series对象某班计划购买秋季运动会的奖品,奖品数据如下:商品名称商品价格(元)购买数量水杯1515笔记本325闹钟2010计时器520利用列表创建一个Series对象s1存储商品价格利用字典创建一个Series对象s2存储购买数量pd.Series()创建Series结构数据,index指定索引名编程处理数据Series利用pandas模块处理数据查看Series属性值(对象.属性
)index:查看索引列values:查看数据列编程处理数据Series利用pandas模块处理数据访问Series对象数据位置索引标签索引编程处理数据Series利用pandas模块处理数据筛选查找符合条件的数据实例[逻辑表达式]编程处理数据Series利用pandas模块处理数据修改Series对象编程处理数据Series利用pandas模块处理数据A编程处理数据Series利用pandas模块处理数据计算索引值相同可以进行计算索引值不同如何计算?编程处理数据Series利用pandas模块处理数据计算NaN表示空,加减乘除任意值都为空编程处理数据DataFrame利用pandas模块处理数据
DataFrame:是一种二维(表格型)的数据结构,由1个索引列(index)和若干个数据列组成,同一个数据列数据类型相同,不同数据列可以是不同的类型(字符串型,整型,实型等)。DataFrame可以看作是共享同一个index的Series的集合编程处理数据DataFrame利用pandas模块处理数据索引(行标签)数据以行和列形式来表示每一列表示一个属性,每一行表示一个条目的信息列标签编程处理数据DataFrame利用pandas模块处理数据可以利用哪些数据模拟二维结构嵌套列表创建列表嵌套字典创建字典嵌套列表创建读取excel文件(csv文件)创建编程处理数据DataFrame利用pandas模块处理数据创建DataFrame对象嵌套列表创建嵌套列表长度必须相同columns,index参数可设定列索引,行索引编程处理数据DataFrame利用pandas模块处理数据创建DataFrame对象列表嵌套字典创建默认情况下,字典的键被认作列名columns,index参数可设定列索引,行索引编程处理数据DataFrame利用pandas模块处理数据创建DataFrame对象字典嵌套列表创建字典的键对应的值(列表)长度必须相同columns,index参数可设定列索引,行索引编程处理数据DataFrame利用pandas模块处理数据创建DataFrame对象读取excel文件(csv文件)创建pd.read_excel(“文件名.xlsx”)编程处理数据DataFrame利用pandas模块处理数据创建DataFrame对象选择指定列创建编程处理数据DataFrame利用pandas模块处理数据查看DataFrame属性(实例.属性)DataFrame常见属性df.index查看行索引df.columns查看列索引df.values查看值df.T行列转置编程处理数据DataFrame利用pandas模块处理数据读取”测试数据.xls”文件创建df1选择df1中的商品名称和价格生成新DataFrame对象df2查看df2的属性编程处理数据DataFrame利用pandas模块处理数据列操作基于列的访问df[列名]访问多个列时放在列表中编程处理数据DataFrame利用pandas模块处理数据列操作增加列df[列名]=[数据]插入列df.insert(位置,列名,数据)编程处理数据DataFrame利用pandas模块处理数据列操作修改列(重新赋值)df[列名]=[数据]删除列实例.drop()df.drop(列名,axis=1)drop函数(inplace=False)有返回值即生成一个新的删除后的DataFrame,原数据不变编程处理数据DataFrame利用pandas模块处理数据列操作增加一列成本价[2.5,4.0,1.5,5.0,3.8,2.0,5.0]计算金额列数据(价格*数量)删除“货号”列数据编程处理数据DataFrame利用pandas模块处理数据行操作基于行的访问切片访问df[i:j:k]编程处理数据DataFrame利用pandas模块处理数据位置索引访问标签索引访问df.loc[行名]df.iloc[i:j:k]编程处理数据DataFrame利用pandas模块处理数据位置索引访问访问特定值df.iloc[i:j:k,i:j:k]标签索引访问df.at[行名,列名]编程处理数据DataFrame利用pandas模块处理数据行操作基于行的访问访问符合条件的行(筛选)访问价格大于5的行实例[条件表达式]多个条件时用&(与)|(或)连接编程处理数据DataFrame利用pandas模块处理数据行操作增加行删除行df.append(数据)df.drop(行名)编程处理数据DataFrame利用pandas模块处理数据tail()访问后几行(默认5)head()访问前几行(默认5)编程处理数据DataFrame利用pandas模块处理数据行操作增加一行数据(薯片,4.0)访问前5行的数据查找h03行的价格筛选出价格大于5.0的行编程处理数据DataFrame利用pandas模块处理数据concat()编程处理数据DataFrame利用pandas模块处理数据concat()编程处理数据DataFrame利用pandas模块处理数据count()统计非空(NaN)数据项个数编程处理数据DataFrame利用pandas模块处理数据sum()和mean()均值max()最大值min()最小值describe()描述性统计编程处理数据DataFrame利用pandas模块处理数据groupby()分组编程处理数据DataFrame利用pandas模块处理数据sort_values排序编程处理数据DataFrame利用pandas模块处理数据sort_values排序编程处理数据DataFrame利用pandas模块处理数据统计技术的最高分,平均分分别统计两个班级的平均分(先分组,再计算)根据技术成绩排名,并显示前5名实例[列].max()实例[列].mean()实例.g
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度新能源汽车出口产品购销合同范本4篇
- 2025年度枣树种植基地绿色认证与市场拓展合同4篇
- 2025年度体育场馆场地租赁合同终止及运营权转让协议3篇
- 2025年度体育用品代理销售与售后服务协议4篇
- 2024通信信息保密协议1
- 2025年度智能化厂房整体转让合同书3篇
- 2024-2030年中国RNA聚合酶行业市场全景监测及投资策略研究报告
- 2025年度互联网数据中心服务合同模板2篇
- 2025不锈钢管道系统安装与维护服务合同3篇
- 2024运输公司车辆全面保险合同6篇
- 大唐电厂采购合同范例
- 国潮风中国风2025蛇年大吉蛇年模板
- GB/T 18724-2024印刷技术印刷品与印刷油墨耐各种试剂性的测定
- IEC 62368-1标准解读-中文
- 15J403-1-楼梯栏杆栏板(一)
- 2024年中考语文名句名篇默写分类汇编(解析版全国)
- 新煤矿防治水细则解读
- 故障诊断技术的国内外发展现状
- 医院领导班子集体议事决策制度
- 解读2024年《学纪、知纪、明纪、守纪》全文课件
- 农机维修市场前景分析
评论
0/150
提交评论