版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
6.1数据类型变换学习内容1.astype()方法2.
to_numeric()方法6.1数据类型变换pandas中进行数据类型变换有两种基本方法:(1)使用astype()方法进行强制类型变换。(2)使用pandas提供的to_numeric()方法变换为数字类型。6.1.1用astype()方法进行强制类型变换astype()方法可以将pandas的DataFrame对象的一列或多列数据变换为指定的数据类型,返回值为变换后的数据,默认更改的是原始对象的副本,语法格式如下:1DataFrame.astype(dtype,copy=True,errors='raise')6.1数据类型变换6.1.1用astype()方法进行强制类型变换表6.1.1
astype()方法的参数说明序号参数说明1dtype数据类型或列名称,将整个pandas对象强制变换为相同的类型。或者,使用字典{col:dtype,...}用于将一列或多列数据变换为特定的类型。2copy布尔值,默认为True,返回更改对象的副本。设置为False表示直接修改对象。一般不要轻易设置为False。3errors默认为raise,表示允许引发异常。还可以设置为ignore,表示忽略异常,出错时返回原始对象(版本0.20.0中的新功能。)01importpandasaspd02df=pd.read_csv('data/ratings.csv',sep=',')03df.dtypes04df案例:电影评分数据集(data/ratings.csv)6.1数据类型变换6.1.1用astype()方法进行强制类型变换05df2=df.astype('int64')06df2.dtypes07df3=df.astype({'用户编号':'int64','项目编号':'int64'})08df3.dtypes案例:电影评分数据集(data/ratings.csv)第5行代码将df对象的所有列都变换为整数,并保存到对象df2。第7行代码通过传递字典的参数,只改变了用户编号和项目编号的类型。6.1数据类型变换6.1.1用astype()方法进行强制类型变换09df4=pd.read_csv('data/booksales.csv',sep=',')10df411df4.dtypes12df5=df4.astype({'价格':'float64'})案例:图书数据集(data/booksales.csv)astype()方法的功能有限,只能进行纯数字的类型转化,如果数据包含其他符号,例如人民币的符号¥,则无法进行类型变换。所以,如果数据列不是纯数字,就不能使用astype()方法进行类型变换6.1数据类型变换pandas中的to_numeric()方法可以将参数变换为数字类型,默认返回的数据类型为float64或int64,语法格式如下:1pandas.to_numerice(arg,errors='raise',downcast=None)表6.1.2
to_numeric()方法的参数说明序号参数说明1arglist(列表),(tuple)元组,一维数组或Series对象2errors默认为'raise',无效的解析将引发异常。还可以是‘coerce’或’ignore’,‘coerce’表示将无效解析设置为NaN,‘ignore’表示无效的解析将忽略异常。3downcastdowncast:默认为None,根据数据自动变换类型。如果不是None,则根据以下规则将结果数据变换为可能的最小数字类型:'integer'或'signed'表示变换为最小的有符号整数(最小值:8),'unsigned'表示变换为最小的无符号整数(最小值:numpy.uint8),'float'表示变换为最小的小数(最小值:numpy.float32)6.1.2用to_numeric()方法变换为数字类型6.1数据类型变换to_numeric()方法进行数据类型变换的代码示例:01importpandasaspd02s=pd.Series(['1.0','2',-3])03pd.to_numeric(s)04pd.to_numeric(s,downcast='float')05pd.to_numeric(s,downcast='signed')'float'表示变换为最小的小数(最小值:numpy.float32)第5行代码设置to_numeric()方法的downcast='signed',变换为最小的有符号整数(最小值:8)6.1数据类型变换to_numeric()方法进行数据类型变换的代码示例:06s2=pd.Series(['apple','1.0','2',-3])07pd.to_numeric(s2,errors='ignore')08pd.to_numeric(s2,errors='coerce')09pd
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江苏省泰兴市黄桥东区域市级名校2025届中考冲刺卷生物试题含解析
- 福建省福州市名校2025届中考生物全真模拟试卷含解析
- 辽宁民族师范高等专科学校《线性系统理论与设计》2023-2024学年第一学期期末试卷
- 2025年上半年运城市稷山县招考中小学教师(90名)易考易错模拟试题(共500题)试卷后附参考答案
- 2025年上半年辽宁铁岭市铁岭县事业单位招考70人易考易错模拟试题(共500题)试卷后附参考答案
- 2025年上半年辽宁省锦州黑山县人力资源信息服务中心招聘53人重点基础提升(共500题)附带答案详解-1
- 2025年上半年辽宁省朝阳事业单位面向2025年上半年“三支一扶”服务期满人员招聘35人易考易错模拟试题(共500题)试卷后附参考答案
- 2025年上半年贵州遵义仁怀市人民政府办公室人社局遴选6人易考易错模拟试题(共500题)试卷后附参考答案
- 2025年上半年贵州织金县招聘事业单位人员32人(第三批)易考易错模拟试题(共500题)试卷后附参考答案
- 2025年上半年贵州省贵阳市人社局数据管理中心招聘易考易错模拟试题(共500题)试卷后附参考答案
- 蒋诗萌小品《谁杀死了周日》台词完整版
- TB 10010-2008 铁路给水排水设计规范
- 黑色素的合成与美白产品的研究进展
- 建筑史智慧树知到期末考试答案2024年
- 金蓉颗粒-临床用药解读
- 社区健康服务与管理教案
- 2023-2024年家政服务员职业技能培训考试题库(含答案)
- 2023年(中级)电工职业技能鉴定考试题库(必刷500题)
- 藏历新年文化活动的工作方案
- 果酒酿造完整
- 第4章-理想气体的热力过程
评论
0/150
提交评论