Python第六章字符串_第1页
Python第六章字符串_第2页
Python第六章字符串_第3页
Python第六章字符串_第4页
Python第六章字符串_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2024/6/21Python语言编程导论第六章字符串内容提要概述通用序列操作字符串格式化字符串方法正那么表达式简介2024/6/22一、概述在Python中,字符串是除数字外最重要的数据类型。字符串无处不在:将字符串输出到屏幕上;从用户的键盘输入读取字符串;文件通常被视为大型字符串;网页大局部是由文本组成的。字符串是一种聚合数据结构,可充分利用索引和切片—用于从字符串中提取子串。而Python正那么表达式库,是一种用来处理字符串的微型语言,但功能强大。2024/6/23二、通用序列操作Python中,字符串、列表和元组都属于序列。序列有一些通用的操作。包括:索引〔indexing〕、分片〔slicing〕、加〔adding〕、乘〔multiplying〕、检查某个元素是否属于序列的成员〔成员资格〕、计算序列长度、找出最大元素和最小元素等。2024/6/241、索引序列中的所有元素都是有编号的—从0开始递增。这些元素可以通过编号分别访问。索引有正索引和负索引,可根据实际情况选用。字符串就是一个由字符组成的序列,处理字符串时,经常需要访问其中的各个字符。索引0指向第1个字符。2024/6/25例如:字符串’apple’的正索引和负索引2024/6/26例6-1:字符串索引应用2024/6/27执行结果:例6-2:计算给定字符串的编码总和2024/6/28执行结果:2、分片与使用索引访问单个元素类似,可以使用分片操作来访问一定范围内的元素。分片是实际应用中经常使用的技术,被截取的局部称为“子串”Python3支持的分片格式为:S[i:j:k]表示:索引S对象中的元素,从索引为i直到索引为j-1,每隔k个元素索引一次,第三个限制k为步长,默认为1,也可以使用负数作为步长,步长-1表示分片将会从右至左进行而不是通常的从左至右,实际效果主是将序列反转。在Python中,还可以使用split()函数来截取字符串。2024/6/29例6-3:字符串分片2024/6/210执行结果:例6-4:返回文件名中的扩展名2024/6/211执行结果:2024/6/2123、序列相加〔字符串连接、合并〕之前介绍过,使用“+”完成。除此之外,还可以使用join函数和reduce函数实现字符串的合并。注意:不同类型的数据不能相加。如:4、乘法用数字x乘以一个序列会生成新的序列,在新的序列中,原来的序列被重复x次。如:5、成员资格为了检查一个值是否在序列中,可以使用in运算符。该运算符检查某个条件是否为真,假设为真返回True,否那么返回False。例如:2024/6/2136、长度、最小值和最大值len、min和max都是内置函数。len—返回序列中包含的元素个数。min—返回序列中的最小值。max—返回序列中的最大值。例如:2024/6/214课堂练习一:课堂练习一2024/6/215三、字符串格式化1、字符串格式化C语言使用函数printf()格式化输出结果,Python也提供了类似功能。Python将假设干值插入带有“%”标记的字符串中,从而可以按照指定格式输出字符串。语法:"%s"%str1"%s%s"%(str1,str2)2024/6/216例6-5:格式化字符串2024/6/217执行结果:例6-6:带精度的格式化2024/6/218执行结果:Python格式化字符串的替代符及含义:符号描述符号描述%c格式化字符及其ASCII码%f格式化浮点数字,可指定小数点后的精度%s格式化字符串%e用科学计数法格式化浮点数%d格式化整数%E作用同%e%u格式化无符号整数%g根据值的大小决定使用%f或%e%o格式化无符号八进制数%G作用同%g%x格式化无符号十六进制数%p用十六进制数格式化变量的地址%X格式化无符号十六进制数(大写)%%若在字符串中输出“%”,需要使用“%%”2024/6/219例6-7:符号、对齐和用0填充在字段宽度和精度之间还可以放置一个“标志”,该标志可以是零、加号、减号或空格。零表示数字将会用0填充。2024/6/220执行结果:2、字符串的转义字符计算机中存在可见字符与不可见字符。可见字符指键盘上的字母、数字和符号。不可见字符是指换行、回车、制表符等字符。对于不可见字符,Python使用的方法类似于C语言,都是使用“\”作为转义字符。Python还提供了函数strip()、lstrip()、rstrip()去除字符串中的转义字符。2024/6/221Python常用的转义字符及其含义:符号描述符号描述\\反斜线\v纵向制表符\’单引号\r回车符\”双引号\f换页符\a发出系统响铃声\o八进制数代表的字符\b退格符\x十六进制数代表的字符\n换行符\000终止符,其后的字符串全部忽略\t横向制表符2024/6/222例6-8:转义字符应用2024/6/223执行结果:四、字符串函数〔方法〕Python字符串自带了大量很有用的函数,要查看这些函数,可调用dir并将参数指定为任何字符串〔如:dir('')〕。虽无必要准确记住所有函数功能,但最好有个大致了解,这样有益于需要时去查询具体使用。字符串函数的详细介绍可参阅其文档字符串或Python在线文档〔〕。此处介绍常用的字符串函数。2024/6/2241、测试函数用于检测字符串是否为特定格式的函数,它们组成了一个最大的字符串函数组。测试函数都返回True或False,因此也称为布尔函数或谓词。2024/6/225字符串测试函数:函数名何时返回True函数名何时返回Trues.endswith(t)s以字符串t结尾s.islower()s只包含小写字母s.startswith(t)s以字符串t打头s.isnumeric()s只包含数字s.isalnum()s只包含字母和数字s.isprintable()s只包含可打印字符s.isalpha()s只包含字母s.isspace()s只包含空白字符s.isdecimal()s只包含表示十进制数字的字符s.istitle()s是个大小写符合标题要求的字符串s.isdigit()s只包含数字字符s.isupper()s只包含大写字母s.isidentifier()s是合法的标识符tinss包含字符串t2024/6/226例如:2024/6/2272、字符串的查找函数函数名返回值s.find(t)若未找到字符串t,则返回-1;否则返回t在s中的起始位置s.rfind(t)与find相同,但从右往左查找s.index(t)与find相同,但如果在s中找不到t,则引发ValueError异常s.rindex(t)与index相同,但从右往左查找2024/6/228说明:函数index和find之间的差异在于没有找到指定子串的情形。函数index引发异常ValueError,而函数find将返回-1。例6-9:查找函数应用2024/6/229执行结果:3、字符串的替换函数函数名返回的字符串s.replace(old,new)将s中的每个old替换为news.expandtabs(n)将s中的每个制表符扩展为空格,空格宽度为n2024/6/230Python字符串自带了两个替换函数,如下表所示。注意:使用替换函数可轻松地删除字符串中的子串。例6-10:字符串替换2024/6/231执行结果:4、字符串的合并之前介绍过,Python可使用“+”连接不同的字符串。除此之外,还可以使用join函数〔是split方法的逆方法〕和reduce函数实现字符串的合并。2024/6/232例6-11:使用join函数连接字符串2024/6/233执行结果:例6-12:使用reduce函数连接字符串2024/6/234执行结果:5、拆分函数函数返回的字符串s.partition(t)将s拆分为三个字符串(head、t和tail),其中head为t前面的子串,tail为t后面的子串。返回值为元组s.rpartition(t)与partition相同,但从s的右端开始搜索t。返回值为元组s.split(t)以t为分隔符,将s划分成一系列子串,并返回一个由这些子串组成的列表s.rsplit(t)与split相同,但从s的右端开始搜索ts.splitlines()返回一个由s中的各行组成的列表2024/6/235拆分函数将字符串拆分成多个子串。如下表所示。例6-13:拆分字符串2024/6/236执行结果:例6-14:使用split()函数获取子串2024/6/237执行结果:6、字符串与日期的转换在实际应用中,经常需要将日期类型与字符串类型互相转换。Python提供了time模块处理日期和时间。函数strftime()可以实现从时间到字符串的转换。字符串到时间的转换要进行两次转换,需要使用time模块和datetime类。2024/6/238strftime()函数:声明:strftime(format[,tuple])->string说明:参数format表示格式化日期的特殊字符。例如:“%Y-%m-%d”相当于“yyyy-MM-dd”.参数tuple表示需要转换的时间,用元组存储。元组中的元素分别表示年、月、日、时、分、秒。函数返回一个表示时间的字符串。2024/6/239字符串到时间的转换步骤:第一次转换:调用函数strptime()将字符串转换为一个元组。其声明为:strptime(string,format)->struct_time函数返回一个存放时间的元组。第二次转换:将表示年、月、日的3个变量传递给函数datetime()。datetime类的datetime()函数格式为:

datetime(year,month,day[,hour[,minute[,second[,microsecond[,tzinfo]]]])函数返回一个date类型的变量。2024/6/240格式化日期的常用标记:符号描述符号描述%a英文星期的简写%M分钟数,取值在01~59之间%A英文星期的完整拼写%j显示从本年第1天开始到当天的天数%b英文月份的简写%w显示今天是星期几,0表示星期天%B英文月份的完整拼写%W显示当天属于本年的第几周,以星期一作为一周的第一条进行计算%c显示本地的日期和时间%x本地的当天日期%d日期数,取值在1~31之间%X本地的当天时间%H小时数,取值在00~23之间%y年份,取值在00~99之间%I小时数,取值在01~12之间%Y年份的完整数字%m月份,取值在01~12之间2024/6/241例6-15:时间与字符串的互相转换2024/6/242执行结果:7、改变大小写函数函数名返回的字符串s.capitalize()将s[0]改为大写,其余小写s.lower()让s的所有字母都小写s.upper()让s的所有字母都大写s.swapcase()将小写字母改为大写,并将大写字母改为小写s.title()让s的大小写符合标题的要求2024/6/243说明:在以上函数中,Python都创立并返回一个新字符串,Python不会真正修改原字符串。例如:2024/6/2448、设置格式函数函数名返回的字符串s.center(n,ch)包含n个字符的字符串,其中s位于中间,两边用字符ch填充s.ljust(n,ch)包含n个字符的字符串,其中s位于左边,右边用字符ch填充s.rjust(n,ch)包含n个字符的字符串,其中s位于右边,左边边用字符ch填充s.format(vars)包含用于设置字符串格式的微型语言,详见:/3.4/library/string.html#formatspec2024/6/245例6-16:设置格式2024/6/246执行结果:9、剥除函数函数名返回的字符串s.strip(ch)从s开头和末尾删除所有包含在字符串ch中的字符s.lstrip(ch)从s开头(左端)删除所有包含在字符串ch中的字符s.rstrip(ch)从s末尾(右端)删除所有包含在字符串ch中的字符2024/6/247剥除函数用于删除字符串开头或末尾多余的字符。如下表所示。默认情况下,剥除空白字符;如果指定了字符串参数,那么剥除该字符串中的字符。例6-17:字符串剥除2024/6/248执行结果:例6-18:去除转义字符2024/6/249执行结果:10、字符串比较Python直接使用“==”“!=”操作符比较两个字符串的内容。如果比较的两个变量的类型不相同、比较的内容也不相同。假设要比较字符串的局部内容,可以先截取子串,再使用“==”“!=”操作符进行比较。假设要比较字符串的开头和结尾局部,更方便的方式是使用startswith()或endswith()函数。startswith()与endswith()的声明为:startswith(substring,[start[,end]])endswith(substring,[start[,end]])2024/6/250例6-19:字符串比较2024/6/251执行结果:例6-20:比较字符串开始和结束处2024/6/252执行结果:课堂练习二:一、假定给定两个字符串〔它们可能是空串〕s1和s2,要将这两个串合并在一起。要求是:s1串的第一个字符与s2串的第一个字符连在一起,后续以此类推。假设一个串的长度大于另一个串的长度,那么保存长串的剩余字符,即连接到新串的末尾即可。例如:假设s1=’abcd’、s2=’efghi’,那么新串为:’aebfcgdhi’。编写函数laceStrings(s1,s2),完成上述功能。

二、编写函数OnlyCharNum(s),对于给定的字符串只显示字母和数字。2024/6/253五、正那么表达式简介虽然Python字符串提供了众多实用的函数,但实际处理字符串时,常常需要更强大的工具。鉴于此,Python提供了一种用于复杂字符串处理的微型语言—正那么表达式,但正那么表达式并不是Python的一局部。正那么表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。实际上,正那么表达式是一种简练描绘一组字符串的方式,可用于高效地执行常见的字符串处理任务,如匹配、替换和分拆字符串。使用正那么表达式编写一些逻辑验证非常方便,如:电子邮件及号码的格式验证。Python提供了re模块实现正那么表达式的验证。2024/6/2541、正那么表达式的构成正那么表达式是包含元字符(metacharacter)的列表。Python支持的正那么表达式元字符和语法2024/6/2552、re模块中一些重要函数函数描述compile(pattern[,flags])根据包含正则表达式的字符串创建模式对象search(pattern,string[,flags])在字符串中查找模式match(pattern,string[,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论