版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章使用pandas进行数据对象构建和数据运算
任务4.3数据运算
算术运算和自动对齐
布尔运算
关系运算
排序运算
汇总类统计
唯一去重和按值计数
相关系数和协方差算术运算和自动对齐Series、DataFrame和NumPy数组一样,也是向量化运算,而且支持大多数NumPy多维数组的方法Series、DataFrame和多维数组运算的主要区别:Series、DataFrame之间的操作会自动基于标签对齐数据,包括行标签和列标签,生成的结果是列和行标签的并集。因此,不用顾及执行计算操作的Series、DataFrame是否有完全相同的标签。算术运算和自动对齐Series之间运算算术运算和自动对齐DataFrame之间运算算术运算和自动对齐DataFrame和Series之间运算shape不一致,广播布尔运算布尔运算可以通过'与'(&)、'或'(|)、'非'(~)、异或(^)进行组合运算,(每一个计算项一定要加括号,注意运算符的优先级)关系运算关系运算符(><==!=),常使用关系运算和逻辑运算结合选取数据根据关系运算选取的都是整行数据形如:df[限制条件1&限制条件2…]或df[限制条件1][限制条件2]在df中选择b和c同时大于0的那些行,等价df[(df.b>0)][(df.c>0)]左图根据关系运算选取指定列的数据形如:df[限制条件][列]、df[列][限制条件]在df中选择b列和c列同时大于0的a和b列右图
排序运算
Pandas支持三种排序方式,按索引标签排序,按列里的值排序,按两种方式混合排序。Series.sort_values()方法用于按值对Series排序。DataFrame.sort_values()方法用于按行列的值对DataFrame排序。DataFrame.sort_values()的可选参数by用于指定按哪列排序,该参数的值可以是一列或多列数据。Series.sort_index()与DataFrame.sort_index()方法用于按索引层级对Pandas对象排序。汇总类统计Series与DataFrame支持大量统计的方法,包括sum()、mean()等聚合函数,还包括输出结果与原始数据集同样大小的cumsum()、cumprod()等函数。这些方法基本上都接受axis参数,axis可以用名称或整数指定。Pandas的统计运算默认忽略缺失值,而Numpy的统计运算遇缺失值结果为nan。Series:无需axis参数DataFrame:index,即axis=0,默认值,按列统计columns,即axis=1,按行统计唯一值和值计数运算一般不用于数值列,而是枚举、分类列相关系数和协方差对于两个变量X、Y:协方差:衡量同向反向程度,如果协方差为正,说明X,Y同向变化,协方差越大说明同向程度越高;如果协方差为负,说明X,Y反向运动,协方差越小说明反向程度越高。协方差矩阵:df.cov()相关系数:衡量相似度程度,当他们的相关系数为1时,说明两个变量变化时的正向相似度最大,当相关系数为-1时,说明两个变量变化的反向相似度最大。相关系数矩阵:df.corr(两者关系:把协方差归一化,也就是相关系数。相关系数消除了协方差数值大小的影响。相关系数也可以看成协方差:一种剔除了两个变量量纲影响、标准化后的特殊协方差,它消除了两个变量变化幅度的影响,而只是单纯反应两个变量每单位变化时的相似程度。相关系数和协方差y经由函数构造出来,x和y的相关系数应该为1。但从实验结果可知
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 坚果种植土壤肥力提升考核试卷
- 窄轨机车车辆制造中的风险管理考核试卷
- 河南省平顶山市宝丰县名校联盟2024-2025学年七年级9月月考生物学试题(原卷版)
- 苏教版五年级上册劳技教案深入浅出全解析
- 溶液的酸碱性苏教版解析与指南
- 掌握矩形判定轻松应对几何考试
- 掌握北师大版高二英语短语技巧分享
- 外研版九年级英语上册重点词汇盘点
- 五年级语文句型转换技巧解析
- 学习三角形的切线与割线解析技巧
- 云南众雄新材料有限公司6000吨超细高纯氧化锌生产环评报告
- 2024(部编版)历史七年级上册-第一单元复习课件
- 医院护理培训课件:《危重患者的转运》
- 山东省青岛市市南区第七中学2023-2024学年七年级上学期10月月考数学试题
- 财务共享模式下中兴通讯业财融合案例研究
- 医学类副高评审表
- 就业 利息和货币通论
- 英国普通法中的令状制度
- CDA数据分析师 LEVEL 1级认证考试题库(含答案)
- 消失模铸造工艺设计
- 一种测试电路板的转接电路板的制作方法
评论
0/150
提交评论