缺失数据——推荐_第1页
缺失数据——推荐_第2页
缺失数据——推荐_第3页
缺失数据——推荐_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1缺失数据第6章缺失数据1.缺失观测及其类型缺失信息三种缺失符号Nullable类型与NA符号NA特性convert_dtypes方法缺失数据的处理(运算与分组加乘累计groupby方法中的缺失值填充与剔除fillna方法(填充)dropna方法(剔除)插值4.1线性插值4.2高级插值1.缺失观测及其类型缺失信息返回布尔代数使用会返回布尔表缺失值统计缺失信息三种缺失符号np.nan不等于任何东西,包括自己,为什么np.nan会不等于自己,如果等于自己的,不利于统计,例如要统计相等的值。np.nan在numpy中为浮点型,数据集读取时,只要有缺失值,就会是浮点型。1.导致中包含浮点型,所以整体浮

2、点型对于布尔类型的列表,如果是np.nan填充,那么它的值会自动变为True而不是False。#将浮点型的.转换为但当修改一个布尔列表时,会改变列表类型,而不是赋值为TrueIHOHlieBISH浮II在所有的表格读取后,无论列是存放什么类型的数据,默认的缺失值全为np.nan类型因此整型列转为浮点;而字符由于无法转化为浮点,因此只能归并为object类型(O),原来是浮点型的则类型不变InjS::df7Il.dtypeOutIS:cltype(zloat64n)In:19::dfEMath.dtypeOut191:dtype(t)In工工;dfEClass.dtypeOut20:dtype(

3、OyNoneNone等于自身,布尔值为False,修改布尔值不会改变数据类型,在传入数值类型后,会自动变为np.nan。NaTNaT是针对时间序列的缺失值,是Pandas的内置类型,可以完全看做时序版本的np.nan,与自己不等,且使用equals是也会被跳过Nullable类型与NA符号Nullable整型IntNullable布尔booleanstring类型NA的特性逻辑运算只需看该逻辑运算的结果是否依赖pd.NA的取值,如果依赖,则结果还是NA,如果不依赖,则直接计算结果算术运算和比较运算这里只需记住除了下面两类情况,其他结果都是NA即可convert_dtypes方法读取数据时,就把数据列转为Nullable类型2缺失数据的运算与分组加号与乘号规则使用加法时,缺失值为0使用乘法时,缺失值为1使用累计函数时,缺失值自动略过#表当前元素先前元素相差百分比当然iieriodsiin素先元素相差百分比Igroupby方法中的缺失值自动忽略为缺失值的组3.填充与剔除fillna方法值填充与前后向填充(分别与ffill方法和bfill方法等价)填充中的对齐特性dropna方法axis参数:表示按行或列进行剔

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论