




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
6.1数据类型变换学习内容1.astype()方法2.
to_numeric()方法6.1数据类型变换pandas中进行数据类型变换有两种基本方法:(1)使用astype()方法进行强制类型变换。(2)使用pandas提供的to_numeric()方法变换为数字类型。6.1.1用astype()方法进行强制类型变换astype()方法可以将pandas的DataFrame对象的一列或多列数据变换为指定的数据类型,返回值为变换后的数据,默认更改的是原始对象的副本,语法格式如下:1DataFrame.astype(dtype,copy=True,errors='raise')6.1数据类型变换6.1.1用astype()方法进行强制类型变换表6.1.1
astype()方法的参数说明序号参数说明1dtype数据类型或列名称,将整个pandas对象强制变换为相同的类型。或者,使用字典{col:dtype,...}用于将一列或多列数据变换为特定的类型。2copy布尔值,默认为True,返回更改对象的副本。设置为False表示直接修改对象。一般不要轻易设置为False。3errors默认为raise,表示允许引发异常。还可以设置为ignore,表示忽略异常,出错时返回原始对象(版本0.20.0中的新功能。)01importpandasaspd02df=pd.read_csv('data/ratings.csv',sep=',')03df.dtypes04df案例:电影评分数据集(data/ratings.csv)6.1数据类型变换6.1.1用astype()方法进行强制类型变换05df2=df.astype('int64')06df2.dtypes07df3=df.astype({'用户编号':'int64','项目编号':'int64'})08df3.dtypes案例:电影评分数据集(data/ratings.csv)第5行代码将df对象的所有列都变换为整数,并保存到对象df2。第7行代码通过传递字典的参数,只改变了用户编号和项目编号的类型。6.1数据类型变换6.1.1用astype()方法进行强制类型变换09df4=pd.read_csv('data/booksales.csv',sep=',')10df411df4.dtypes12df5=df4.astype({'价格':'float64'})案例:图书数据集(data/booksales.csv)astype()方法的功能有限,只能进行纯数字的类型转化,如果数据包含其他符号,例如人民币的符号¥,则无法进行类型变换。所以,如果数据列不是纯数字,就不能使用astype()方法进行类型变换6.1数据类型变换pandas中的to_numeric()方法可以将参数变换为数字类型,默认返回的数据类型为float64或int64,语法格式如下:1pandas.to_numerice(arg,errors='raise',downcast=None)表6.1.2
to_numeric()方法的参数说明序号参数说明1arglist(列表),(tuple)元组,一维数组或Series对象2errors默认为'raise',无效的解析将引发异常。还可以是‘coerce’或’ignore’,‘coerce’表示将无效解析设置为NaN,‘ignore’表示无效的解析将忽略异常。3downcastdowncast:默认为None,根据数据自动变换类型。如果不是None,则根据以下规则将结果数据变换为可能的最小数字类型:'integer'或'signed'表示变换为最小的有符号整数(最小值:8),'unsigned'表示变换为最小的无符号整数(最小值:numpy.uint8),'float'表示变换为最小的小数(最小值:numpy.float32)6.1.2用to_numeric()方法变换为数字类型6.1数据类型变换to_numeric()方法进行数据类型变换的代码示例:01importpandasaspd02s=pd.Series(['1.0','2',-3])03pd.to_numeric(s)04pd.to_numeric(s,downcast='float')05pd.to_numeric(s,downcast='signed')'float'表示变换为最小的小数(最小值:numpy.float32)第5行代码设置to_numeric()方法的downcast='signed',变换为最小的有符号整数(最小值:8)6.1数据类型变换to_numeric()方法进行数据类型变换的代码示例:06s2=pd.Series(['apple','1.0','2',-3])07pd.to_numeric(s2,errors='ignore')08pd.to_numeric(s2,errors='coerce')09pd
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新高考改革对数学课程标准的启示心得体会
- 三年级足球冬季训练计划
- 消防救援跌落坠床应急方案流程
- 施工员安全监督职责
- 分管教育教学副校长学科建设推进计划
- 医疗设备维护工作进度安排及保证措施
- 新北师大版四年级数学上册教学安排及计划
- 急性呼吸衰竭患者呼吸机相关肺炎防护措施
- 仁爱版七年级英语上册单元复习计划
- 农牧业企业安全教育培训计划
- 儿科护理安全不良事件
- 中国硒化汞行业市场现状分析及竞争格局与投资发展研究报告2024-2029版
- 水库安保服务方案
- INSAR技术在城市地面沉降监测中的应用
- 产品审核VDA6.5培训课件
- 艾滋病乙肝梅毒知识讲座
- 九年级化学下册 第11单元 课题2 化学肥料课件 新人教版
- 暖气片报价单范本
- 临床医学研究中心年度考核细则
- PSSE软件操作说明
- 22S803 圆形钢筋混凝土蓄水池
评论
0/150
提交评论