数据分析应用项目化教程(Python) 课件 任务6.4 字符串处理_第1页
数据分析应用项目化教程(Python) 课件 任务6.4 字符串处理_第2页
数据分析应用项目化教程(Python) 课件 任务6.4 字符串处理_第3页
数据分析应用项目化教程(Python) 课件 任务6.4 字符串处理_第4页
数据分析应用项目化教程(Python) 课件 任务6.4 字符串处理_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章使用pandas进行数据清洗和整理

任务6.4字符串处理str介绍获取Series.str或Index.str,然后使用各种字符串处理函数向量化处理数据str处理的链式操作pandas常见字符串处理函数使用str的startswith、contains等bool的Series做条件查询使用正则表达式str介绍str简介:Series和Index包含一些列的字符操作方法,这可以使我们轻易操作数组中的各个元素。最重要的是,这些方法可以自动跳过缺失/NA值。这些方法可以在str属性中访问到,并且基本上和python内建的字符串方法同名。Pandas的字符串处理:使用方法:先获取Series的str属性,然后在属性上调用函数;只能在字符串列上使用,不能数字列上使用;Dataframe上没有str属性和处理方法Series.str并不是Python原生字符串,而是自己的一套方法,不过大部分和原生str很相似获取Series.str或Index.str,然后使用各种字符串处理函数向量化处理数据str处理的链式操作Series.str或Index.str每次调用方法之前需要获取str属性。获取str属性返回的是字符串方法访问器,也就能使用字符串方法了,而调用字符串方法后返回的是新的Series或Index对象,所以不能直接使用字符串方法。清理开头和结尾的白空格,将所有的名称都换为小写,并且将其余的空格都替换为下划线pandas常见字符串处理函数s.str.replace()字符串替换函数s.str.cat()字符拼接函数s.str.split()字符串分割函数s.str.strip()/lstrip()/rstrip()清除两边的特殊字符

s.str.get(i)/s.str.slice()截取字符串函数s.str.pad()在字符串左边/右边添加特定字符使用str的startswith、contains等bool的Series做条件查询s.str.contains()s.str.startswith()/endswith()使用正则表达式日期去除年、月、日三个中文字符Series.str默认就开启了正则表达式模式。匹配或包含模式的字符串,match和contains的区别是是否严格匹配小结str介绍获取Series.str或Index.str,然后使用各种字符串处理函数向量化处理数据str处理的链式操作pandas常见字符串处理函数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论