版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
LinuxGrep用法QUOTE:原帖由〃网中人”发表:比方以grep来说,在Linux上你可找到grep,egrep,fgrep这几个程序,其差异大致如下:grep:传统的grep程序,在没有参数的情况下,只输出符合RE字符串之句子.常见参数如下:-v:逆反模示,只输出"不含"RE字符串之句子.-r:递归模式,可同时处理所有层级子目录里的文件.-q:静默模式,不输出任何结果(stderr除外.常用以获取returnvalue,符合为true,否则为false.)-i:忽略大小写.-w:整词比对,类似\<word\>.-n:同时输出行号.-c:只输出符合比对的行数.-l:只输出符合比对的文件名称.-o:只输出符合RE的字符串.(gnu新版独有,不见得所有版本都支持.)-E:切换为egrep.egrep:为grep的扩充版本,改良了许多传统grep不能或不便的操作.比方说:-grep之下不支持?与+这两种modifier,但egrep则可.-grep不支持a|b或(abc|xyz)这类”或一”比对,但egrep则可.-grep在处理{n,m}时,需用\{与\}处理,但egrep则不需.诸如此类的...我个人会建议能用egrep就不用grep啦...八_八fgrep:不作RE处理,表达式仅作一般字符串处理,所有meta均失去功能.grep一般格式为:][-]CODE:grep[选项]基本正则表达式[文件]这里基本正则表达式可为字符串。单引号双引号在grep命令中输入字符串参数时,最好将其用双引号括起来。在调用模式匹配时,应使用单引号。例如:“mystring”这样做有两个原因,一是以防被误解为shell命令,二是可以用来查找多个单词组成的字符串。在调用变量时,也应该使用双引号,诸如:grep“$MYVAR”文件名,如果不这样,将没有返回结果。常用的grep选项有:QUOTE:-c只输出匹配行的计数。-i不区分大小写(只适用于单字符)。-h查询多文件时不显示文件名。
-l查询多文件时只输出包含匹配字符的文件名。-n显示匹配行及行号。-s不显示不存在或无匹配文本的错误信息。-V显示不包含匹配文本的所有行。开始讨论之前,先生成一个文件,插入一段文本,并在每列后加入<Tab>键,grep命令示例中绝大多数将以此为例,其命名为data.f。生成一个文件,data.f的记录结构如下:QUOTE:第1列:城市位置编号。第2歹0:月份。第3列:存储代码及出库年份。第4歹0:产品代号。第5列:产品统一标价。第6列:标识号。第7列:合格数量。文件内容如下:][-]CODE:$catdata.f48Dec3BC1977LPSX68.00LVX2A138483Sept5AP1996USP65.00LVX2C18947Oct3ZL1998LPSX43.00KVM9D512219dec2CC1999CAD23.00PLV2C68484nov7PL1996CAD49.00PLV2C234483may5PA1998USP37.00KVM9D644216sept3ZL1998USP86.00KVM9E2341、查询多个文件在所有文件中查询单词“sortit”][-]CODE:$grep"sortit"*2、行匹配1)显示包含“48”字符串的文本:CODE:$grep"48"data.f2)输出匹配行的总数CODE:$grep-c"48"data.f4grep返回数字4,表示:包含字符串“48”的有4行。3)行数显示满足匹配模式的所有行行数:][-]CODE:$grep-n"48"data.f行数在输出第一列,后跟包含48的每一匹配行。4)显示非匹配行显示所有不包含48的各行][-]CODE:$grep-v"48"data.f5)精确匹配可能大家已注意到,在上一例中,抽取字符串“48”,返回结果包含诸如484和483等包含“48”的其他字符串,实际上应精确抽取只包含48的各行。使用grep抽取精确匹配的一种更有效方式是在抽取字符串后加、>。假定现在精确抽取48,方法如下:][-]CODE:$grep"48\>"data.fQUOTE:另一种方法我试过,好像不行:注意在每个匹配模式中抽取字符串后有一个<Tab>键,所以应操作如下:<Tab>表示点击tab键。$grep"48<tab>"data.f6)大小写敏感缺省情况下,grep是大小写敏感的,如要查询大小写不敏感字符串,必须使用-i开关。在data.f文件中有月份字符Sept,既有大写也有小写,要取得此字符串大小写不敏感查询,方法如下:][-]CODE:$grep-i"48"data.fgrep和正则表达式使用正则表达式使模式匹配加入一些规则,因此可以在抽取信息中加入更多选择。使用正则表达式时最好用单引号括起来,这样可以防止grep中使用的专有模式与一些shell命令的特殊方式相混淆。1、模式范围抽取代码为484和483的城市位置,可以使用[]来指定字符串范围。CODE:$grep”48[34]”data.f483Sept5AP1996USP65.00LVX2C189484nov7PL1996CAD49.00PLV2C234483may5PA1998USP37.00KVM9D6442、不匹配行首使行首不是4或8,可以在方括号中使用八记号。][-]CODE:$grep"A[A48]ndata.f219dec2CC1999CAD23.00PLV2C68216sept3ZL1998USP86.00KVM9E234如果是字符串48][-]CODE:$grep-v"A[A48]ndata.f3、设置大小写使用-i开关可以屏蔽月份Sept的大小写敏感][-]CODE:[sam@chenwysam]$grep-i"sept"data.f483Sept5AP1996USP65.00LVX2C189216sept3ZL1998USP86.00KVM9E234也可以用另一种方式[]模式抽取各行包含Sept和sept的所有信息。][-]CODE:[sam@chenwysam]$grep'[sS]ept'data.f如果要抽取包含Sept的所有月份,不管其大小写,并且此行包含字符串483,可以使用管道命令,即符号“I”左边命令的输出作为“|”右边命令的输入。举例如下:][-]CODE:[sam@chenwysam]$grep'[sS]ept'data.fIgrep48483Sept5AP1996USP65.00LVX2C189不必将文件名放在第二个grep命令中,因为其输入信息来自于第一个grep命令的输出4、匹配任意字符如果抽取以K开头,以D结尾的所有代码,可使用下述方法,因为已知代码长度为5个字符:CODE:[sam@chenwysam]$grep'K...D'data.f47Oct3ZL1998LPSX43.00KVM9D512483may5PA1998USP37.00KVM9D644将上述代码做轻微改变,头两个是大写字母,中间两个任意,并以C结尾:][-]CODE:[sam@chenwysam]$grep'[A-Z]..C'data.f483Sept5AP1996USP65.00LVX2C189219dec2CC1999CAD23.00PLV2C68484nov7PL1996CAD49.00PLV2C2345、日期查询一个常用的查询模式是日期查询。先查询所有以5开始以1996或1998结尾的所有记录。使用模式5..199[6,8]。这意味着第一个字符为5,后跟两个点,接着是199,剩余两个数字是6或8。][-]CODE:[sam@chenwysam]$grep'5..199[6,8]'data.f483Sept5AP1996USP65.00LVX2C189483may5PA1998USP37.00KVM9D6446、范围组合必须学会使用[]抽取信息。假定要取得城市代码,第一个字符为0-9,第二个字符在0到5之间,第三个字符在0到6之间,使用下列模式即可实现。][-]CODE:[sam@chenwysam]$grep'[0-9][0-5[0-6]'data.f48Dec3BC1977LPSX68.00LVX2A138483Sept5AP1996USP65.00LVX2C18947Oct3ZL1998LPSX43.00KVM9D512219dec2CC1999CAD23.00PLV2C68484nov7PL1996CAD49.00PLV2C234483may5PA1998USP37.00KVM9D644216sept3ZL1998USP86.00KVM9E234这里返回很多信息,有想要的,也有不想要的。参照模式,返回结果是正确的,因此这里][-]CODE:[sam@chenwysam]$grep'A[0-9][0-5][0-6]'data.f219dec2CC1999CAD23.00PLV2C68216sept3ZL1998USP86.00KVM9E234这样可以返回一个预期的正确结果。以下要注意有无边界字符的区别7、模式出现机率抽取包含数字4至少重复出现两次的所有行,方法如下:
][-]CODE:[sam@chenwysam]$grep'4\{2,\}'data.f483may5PA1998USP37.00KVM9D644上述语法指明数字4至少重复出现两次,注意有无边界字符的区别。同样,抽取记录使之包含数字999(三个9),方法如下:][-]CODE:[sam@chenwysam]$grep'9\{3,\}'data.f219dec2CC1999CAD23.00PLV2C68如果要查询重复出现次数一定的所有行,语法如下,数字9重复出现两次或三次:][-]CODE:[sam@chenwysam]$grep'9\{3\}'data.f219dec2CC1999CAD23.00PLV2C68[sam@chenwysam]$grep'9\{2\}'data.f483Sept5AP1996USP65.00LVX2C18947Oct3ZL1998LPSX43.00KVM9D512219dec2CC1999CAD23.00PLV2C68484nov7PL1996CAD49.00PLV2C234有时要查询重复出现次数在一定范围内,比如数字或字母重复出现2到6次,下例匹配数字8重复出现2到6次,并以3结尾:][-]CODE:[sam@chenwysam]$catmyfile83888883888488883[sam@chenwysam]$grep'8\{2,6\}3'myfile888883888838、使用grep匹配“与〃或者“或〃模式grep命令加-E参数,这一扩展允许使用扩展模式匹配。例如,要抽取城市代码为219或216,方法如下:][-]CODE:[sam@chenwysam]$grep-E'219|216'data.f219dec2CC1999CAD23.00PLV2C68216sept3ZL1998USP86.00KVM9E2349、空行结合使用八和$可查询空行。使用-c参数显示总行数:
][-]CODE:[sam@chenwysam]$grep-c'A$'myfile使用-n参数显示实际在哪一行:][-]CODE:[sam@chenwysam]$grep-c'A$'myfile10、匹配特殊字符查询有特殊含义的字符,诸如$.'"*[]八|\+?,必须在特定字符前加、。假设要查询包含“.的所有行,脚本如下:][-]CODE:[sam@chenwysam]$grep'\.'myfile或者是一个双引号:][-]CODE:[sam@chenwysam]$grep'\"'myfile以同样的方式,如要查询文件名conftroll.conf(这是一个配置文件),脚本如下:][-]CODE:[sam@chenwysam]$grep'conftroll\.confmyfile11、查询格式化文件名使用正则表达式可匹配任意文件名。系统中对文本文件有其标准的命名格式。一般最多六个小写字符,后跟句点,接着是两个大写字符。][-]CODE:[sam@chenwysam]$grep'A[a-z]\(1,6\}\.[A-Z]\(1,2\}'filename这个写法我不知道有没有错:oops::oops::oops:12查询IP地址要查看nnn.nnn网络地址,如果忘了第二部分中的其余部分,只知有两个句点,例如nnn.nn..。要抽取其中所有nnn.nnnIP地址,使用[0-9]\{3\}\.[0-0\{3\}\含义是任意数字出现3次,后跟句点,接着是任意数字出现3次,后跟句点。][-]CODE:[0-9]\{3\}\.[0-9]\{3\}\.'上面还有一点错,改天更正1、类名
grep允许使用国际字符模式匹配或匹配模式的类名形式。类名及其等价的正则表达式类等价的正则表达式类等价的正则表达式QUOTE:[[:upper:]][A-Z][[:alnum:]][0-9a-zA-Z][[:lower:]][a-z][[:space:]]空格或tab键[[:digit:]][0-9][[:alpha:]][a-zA-Z]例一:取以5开头,后跟至少两个大写字母:][-]CODE:$grep'5[[:upper:]][[:upper]]'data.f取以P或D结尾的所有产品代码:][-]CODE:grep'[[:upper:]][[:upper:]][P,D]'data.f2、使用通配符*的匹配模式][-]CODE:$cattestfilelookslikeslookerlong试试如下:][-]CODE:grep"l.*s"testfile如在行尾查询某一单词,试如下模式:][-]CODE:grep"ng$"testfile这将在所有文件中查询行尾包含单词ng的所有行。3、系统grep文件passwd][-]CODE:[root@Linux_chenwysam]#grep"sam"/etc/passwdsam:x:506:4::/usr/sam:/bin/bash
上述脚本查询/etc/passwd文件是否包含sam字符串如果误输入以下脚本:][-]CODE:[root@Linux_chenwysam]#grep"sam"/etc/passwordgrep:/etc/password:没有那个文件或目录将返回grep命令错误代码'Nosuchfileordirectory'。上述结果表明输入文件名不存在,使用grep命令-s开关,可屏蔽错误信息。返回命令提示符,而没有文件不存在的错误提示。][-]CODE:[root@Linux_chenwysam]#grep-s"sam"/etc/password如果grep命令不支持-s开关,可替代使用以下命令:][-]CODE:[root@Linux_chenwysam]#grep"sam"/tec/password>/dev/null2>&1脚本含义是匹配命令输出或错误(2>$1),并将结果输出到系统池。大多数系统管理员称/dev/null为比特池,没关系,可以将之看成一个无底洞,有进没有出,永远也不会填满。上述两个例子并不算好,因为这里的目的只想知道查询是否成功。如要保存grep命令的查询结果,可将命令输出重定向到一个文件。][-]CODE:[root@Linux_chenwysam]#grep"sam"/etc/passwd>/usr/sam/passwd.out[root@Linux_chenwysam]#cat/usr/sam/passwd.outsam:x:506:4::/usr/sam:/bin/bash脚本将输出重定向到目录/tmp下文件passwd.out中。使用ps命令使用带有psx命令的grep可查询系统上运行的进程。psx命令意为显示系统上运行的所有进程列表。要查看DNS服务器是否正在运行(通常称为named),方法如下:][-]CODE:[root@Linux_chenwysam]#psax|grep"named"2897pts/1S0:00grepnamed输出也应包含此grep命令,因为grep命令创建了相应进程,psx将找到它。在grep命令中使用-v选项可丢弃ps命令中的grep进程。如果psx不适用于用户系统,替代使用ps-ef。这里,由于我没有DNS服务,因而只有grep进程。
对一个字符串使用grepgrep不只应用于文件,也可应用于字符串。为此使用echo字符串命令,然后对grep命令使用管道输入。][-]CODE:[root@Linux_chenwysam]#STR="MaryJoePeterPauline"[root@Linux_chenwysam]#echo$STR|grep"Mary"MaryJoePeterPauline匹配成功实现。][-]CODE:[root@Linux_chenwysam]#echo$STR|grep"Simon"因为没有匹配字符串,所以没有输出结果。4、egrepegrep代表expression或extendedgrep,适情况而定。egrep接受所有的正则表达式,egrep的一个显著特性是可以以一个文件作为保存的字符串,然后将之传给egrep作为参数,为此使用-f
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 专业渔业承包经营协议样本2024版B版
- 美术探索之路
- 复料厂的劳动合同(2篇)
- 大产权售房合同(2篇)
- 4 公民的基本权利和义务第2课时公民的基本义务(说课稿)2024-2025学年统编版道德与法治六年级上册
- 《矿井主要灾害事故防治与应急避灾》培训课件2025
- 工程承包居间简单合同范本
- 金融扶贫帮扶协议书
- 2024淘宝年度合作伙伴产品研发合同模板2篇
- 2024暑期兼职广告宣传及市场调研协议3篇
- 山西省太原市重点中学2025届物理高一第一学期期末统考试题含解析
- Python开发工程师招聘笔试题及解答(某大型国企)
- 2024年农民职业农业素质技能考试题库(附含答案)
- 妊娠期高血糖诊治指南
- 2024压铸机安全技术规范
- 绵阳小升初数学试题-(绵中英才学校)
- 高考对联题(对联知识、高考真题及答案、对应练习题)
- 数据中心数据中心建设项目电气工程设计方案
- 广东省深圳市2022年中考英语真题(含答案)
- 四川省泸州市(2024年-2025年小学四年级语文)统编版期末考试(上学期)试卷及答案
- 新版《铁道概论》考试复习试题库(含答案)
评论
0/150
提交评论