REGEXP_Replace使用方法_第1页
REGEXP_Replace使用方法_第2页
REGEXP_Replace使用方法_第3页
REGEXP_Replace使用方法_第4页
REGEXP_Replace使用方法_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、REGEXP_REPLACE 函数 让我们首先看一下传统的 REPLACE SQL 函数,它把一个字符串用另一个字符串来替换。假设您的数据在正文中有不必要的空格,您希望用单个空格来替换它们。利用 REPLACE 函数,您需要准确地列出您要替换多少个空格。然而,多余空格的数目在正文的各处可能不是相同的。下面的示例在 Joe 和 Smith 之间有三个空格。REPLACE 函数的参数指定要用一个空格来替换两个空格。在这种情况下,结果在原来的字符串的 Joe 和

2、 Smith 之间留下了一个额外的空格。 SELECT REPLACE('Joe Smith',' ', ' ')AS replaceFROM dualREPLACE-Joe Smith REGEXP_REPLACE 函数把替换功能向前推进了一步,其语法在表 9 中列出。以下查询用单个空格替换了任意两个或更多的空格。( ) 子表达式包含了单个空格,它可以按 2,

3、0;的指示重复两次或更多次。 表 9: REGEXP_REPLACE 函数  语法说明REGEXP_REPLACE(source_string, pattern, replace_string , position,occurrence, match_parameter)该函数用一个指定的 replace_string 来替换匹配的模式,从而允许复杂的"搜索并替换"操作。SELECT REGEXP_REPLACE('Joe

4、60;Smith','( )2,', ' ')AS RX_REPLACEFROM dualRX_REPLACE-Joe Smith 后向引用 正则表达式的一个有用的特性是能够存储子表达式供以后重用;这也被称为后向引用(在表 10 中对其进行了概述)。它允许复杂的替换功能,如在新的位置上交换模式或显示重复出现的单词或字母。子表达式的匹配部分保存在临时缓冲区中。缓冲区从左至右进行编号,并利用 digit 符号进行访问,其中 dig

5、it 是 1 到 9 之间的一个数字,它匹配第 digit 个子表达式,子表达式用一组圆括号来显示。 接下来的例子显示了通过按编号引用各个子表达式将姓名 Ellen Hildi Smith 转变为 Smith, Ellen Hildi。 SELECT REGEXP_REPLACE('Ellen Hildi Smith','(.*) (.*) (.*)',&

6、#160;'3, 1 2')FROM dualREGEXP_REPLACE('EL-Smith, Ellen Hildi 该 SQL 语句显示了用圆括号括住的三个单独的子表达式。每一个单独的子表达式包含一个匹配元字符 (.),并紧跟着 * 元字符,表示任何字符(除换行符之外)都必须匹配零次或更多次。空格将各个子表达式分开,空格也必须匹配。圆括号创建获取值的子表达式,并且可以用 digit 来引用。第一个子表达式被赋值为 1 

7、;,第二个 2,以此类推。这些后向引用被用在这个函数的最后一个参数 (3, 1 2) 中,这个函数有效地返回了替换子字符串,并按期望的格式来排列它们(包括逗号和空格)。表 11 详细说明了该正则表达式的各个组成部分。 后向引用对替换、格式化和代替值非常有用,并且您可以用它们来查找相邻出现的值。接下来的例子显示了使用 REGEP_SUBSTR 函数来查找任意被空格隔开的重复出现的字母数字值。显示的结果给出了识别重复出现的单词 is 的子字符串。 SELECT 

8、;REGEXP_SUBSTR('The final test is is the implementation',(:alnum:+)(:space:+)1') AS substrFROM dualSUBSTR-is is 匹配参数选项 您可能已经注意到了正则表达式操作符和函数包含一个可选的匹配参数。这个参数控制是否区分大小写、换行符的匹配和保留多行输入。 正则表达式的实际应用 您不仅可以在队列中使用正则表达式,还可以在使用

9、0;SQL 操作符或函数的任何地方(比如说在 PL/SQL 语言中)使用正则表达式。您可以编写利用正则表达式功能的触发器,以验证、生成或提取值。 接下来的例子演示了您如何能够在一次列检查约束条件中应用 REGEXP_LIKE 操作符来进行数据验证。它在插入或更新时检验正确的社会保险号码格式。如 123-45-6789 和 123456789 之类格式的社会保险号码对于这种列约束条件是可接受的值。有效的数据必须以三个数字开始,紧跟着一个连字符,再加两个数字和一个连字符,最后又是四个数字。另一种表达

10、式只允许 9 个连续的数字。竖线符号 (|) 将各个选项分开。 ALTER TABLE students  ADD CONSTRAINT stud_ssn_ck CHECK  (REGEXP_LIKE(ssn,  '(:digit:3-:digit:2-:digit:4|:digit:9)$')由  和 $ 指示的开头或结尾的字符都是不可接受的。确保您的正则表达式没有分成多行或包含

11、任何不必要的空格,除非您希望格式如此并相应地进行匹配。表 12 说明了该正则表达式示例的各个组成部分。 将正则表达式与现有的功能进行比较 正则表达式有几个优点优于常见的 LIKE 操作符和 INSTR、SUBSTR 及 REPLACE 函数的。这些传统的 SQL 函数不便于进行模式匹配。只有 LIKE 操作符通过使用 % 和 _ 字符匹配,但 LIKE 不支持表达式的重复、复杂的更替、字符范围、字

12、符列表和 POSIX 字符类等等。此外,新的正则表达式函数允许检测重复出现的单词和模式交换。这里的例子为您提供了正则表达式领域的一个概览,以及您如何能够在您的应用程序中使用它们。 实实在在地丰富您的工具包 因为正则表达式有助于解决复杂的问题,所以它们是非常强大的。正则表达式的一些功能难于用传统的 SQL 函数来仿效。当您了解了这种稍显神秘的语言的基础构建程序块时,正则表达式将成为您的工具包的不可缺少的一部分(不仅在 SQL 环境下也在其它的编程语言环境下)。为了使您的各个模式正确,虽然尝试和错误有时是必须的,但正则

13、表达式的简洁和强大是不容置疑的。 Alice Rischert (ar280) 是哥伦比亚大学计算机技术与应用系的数据库应用程序开发和设计方向的主席。她编写了 Oracle SQL 交互手册 第 2 版 (Prentice Hall,2002)和即将推出的 Oracle SQL 示例 (Prentice Hall,2003)。Rischert 拥有超过 15 年的经验在财富 100

14、60;强公司内担任数据库设计师、DBA 和项目主管,并且她自从 Oracle version 5 起就一直使用 Oracle 产品。 表 1:定位元字符  元字符说明使表达式定位至一行的开头$使表达式定位至一行的末尾 表 2:量词或重复操作符  量词说明*匹配 0 次或更多次?匹配 0 次或 1 次+匹配 1 次或更多次m正好匹配 m 次m,至少匹

15、配 m 次m, n至少匹配 m 次但不超过 n 次表 3:预定义的 POSIX 字符类  字符类说明:alpha:字母字符:lower:小写字母字符:upper:大写字母字符:digit:数字:alnum:字母数字字符:space:空白字符(禁止打印),如回车符、换行符、竖直制表符和换页符:punct:标点字符:cntrl:控制字符(禁止打印):print:可打印字符表 4:表达式的替换匹配和分组  元字符说明|替换分隔替换选项,通常与分组操作符

16、 () 一起使用( )分组将子表达式分组为一个替换单元、量词单元或后向引用单元(参见"后向引用"部分)char字符列表表示一个字符列表;一个字符列表中的大多数元字符(除字符类、 和 - 元字符之外)被理解为文字表 5:REGEXP_LIKE 操作符  语法说明REGEXP_LIKE(source_string, pattern, match_parameter)source_string 支持字符数据类型(CHAR、VARCHAR2、CLOB、N

17、CHAR、NVARCHAR2 和 NCLOB,但不包括 LONG)。pattern 参数是正则表达式的另一个名称。match_parameter 允许可选的参数(如处理换行符、保留多行格式化以及提供对区分大小写的控制)。表 6:REGEXP_INSTR 函数  语法说明REGEXP_INSTR(source_string, pattern, start_position, occurrence, return_option, match_parameter

18、)该函数查找 pattern ,并返回该模式的第一个位置。您可以随意指定您想要开始搜索的 start_position。 occurrence 参数默认为 1,除非您指定您要查找接下来出现的一个模式。return_option 的默认值为 0,它返回该模式的起始位置;值为 1 则返回符合匹配条件的下一个字符的起始位置。表 7: 5 位数字加 4 位邮政编码表达式的说明  语法说明 必须匹配的空白:digit:POSI

19、X 数字类 字符列表的结尾 5字符列表正好重复出现 5 次(子表达式的开头 -一个文字连字符,因为它不是一个字符列表内的范围元字符字符列表的开头 :digit:POSIX :digit:类字符列表的开头 字符列表的结尾4字符列表正好重复出现 4 次 )结束圆括号,结束子表达式 ? 量词匹配分组的子表达式 0 或 1 次,从而使得 4 位代码可选$定位元字符,指示行尾表 8:REGEXP_

20、SUBSTR 函数  语法说明REGEXP_SUBSTR(source_string, pattern, position , occurrence, match_parameter)REGEXP_SUBSTR 函数返回匹配模式的子字符串。表 9: REGEXP_REPLACE 函数  语法说明REGEXP_REPLACE(source_string, pattern, replace_string , positi

21、on,occurrence, match_parameter)该函数用一个指定的 replace_string 来替换匹配的模式,从而允许复杂的"搜索并替换"操作。表 10:后向引用元字符  元字符说明digit反斜线紧跟着一个 1 到 9 之间的数字,反斜线匹配之前的用括号括起来的第 digit 个子表达式。(注意:反斜线在正则表达式中有另一种意义,取决于上下文,它还可能表示 Escape 字符。表 11:模式交换正则表达式的说明  正则表达式项目说明(第一个子表达式的开头 .匹配除换行符之外的任意单字符*重复操作符,匹配之前的 . 元字符 0 到 n 次)第一个子表达式的结尾;匹配结果在 1中获取(在这个例子中,结果为 Ellen。) 必须存在的空白 (第二个子表达式的开头 .匹配除换行符之外的任意单个字符 *重复操作符,匹配之前的 . 元字符 0 到 n 次)第二个子表达

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论