一起学Shell之(三) 查找与替换

2023-11-22 16:21:35

#----------------------------------------------------------#

# ====> 红色字体 -特指煮酒个人所见。加粗则为需要重点注意。 # # ====> 蓝色加粗 -特指与本文相关人员，包括参与修正的朋友。 # # ====> 煮酒品茶 -Http://cwtea.blog.51cto.com # #----------------------------------------------------------#

煮酒品茶：学习之中有乐趣当然也有苦闷，特别是刚看正则的时候一下就被转昏头了，不过还好，坚持下来了，正则看起来把复杂问题简单化，其实就可以解决问题了，sed也是，看了一天，笔记记了大概20来页，当然不可能全写上来。只能在笔记上找重点。下面开始吧。

述：正则表达式可以提供更强大的标记法，以单个表达式匹配各种实际的文本数。 grep家族的武器强度。 ---------------------------- grep:文本匹配程序 egrep：使用扩展正则表达式，消耗更多的运算资源 fgrep：快速grep，匹配固定字符串而非正则表达式。 ----------------------------- who |grep -F root 注：-F是grep默认的选项，列出单前root登陆的信息，过程就是把who打印出来的信息交给grep，grep查找root的行。然后再打印出来。 grep 选项文件用途：显示一个或多个模式的文本行，通常用于管道|的第一步。具体参数请查找相关资料。煮酒品茶：这个就不用多说了吧，用途大大的，各种查找，与sed awk cut组成强大的陈营。一起学下去肯定会得到更多。下一步找个Shell分析一下。正则表达式：是一种表达方式，让你可以查找匹配的特定准则的文本，例如表达以"a字母开头“匹配多个字符。煮酒品茶：说白了，就是以特定的语言来规定内在的命令，就好像你在北京用家乡话和老乡沟通一样，别人听不懂的。听的懂的人就可以执行相关的命令了。但是搞IT的都喜欢弄些专业的名词来更好的表述自己的观点。正则是由两个基本组成部分建立，一般字符和特殊字符，一般就是没有意义的字符，特殊就是有特别意义的字符就好像你的家乡话一样，又称 元字符。正则支持的命令有：查找相关：grep egrep agrep 编辑器：sed 字符串处理程序：awk icon perl python ruby tcl 文件查看程序：more page pg less 文件编辑程序：vi emacs jed jove vile vim等 编写正则表达式的三个步骤： 1、知道要匹配的内容以及它如何出现在文本中。 2、编写一个模式来描述要匹配的内容。 3、测试模式来查看它的匹配内容 正则表达式产生的后果： Hit命中 Misses非命中 omissions遗漏 false alarms假命中煮酒品茶：粗俗的来讲就是你首先要需要你的需求以及怎么设计需求，最后预览一下看是不是和你的需要的一样。而产生的后果也就只有这么几种。可以根据错误往上查。元字节查看图 ------------------------------------------------

------------------------------------------- 煮酒品茶：看了表之后余下的就是多练习了，查看时必须先根据前优先级然后再查看，不然真的看晕你。大框架里包小框架，等下sed里会有，我多写一点实例。 优先级：高至低 [....] [: :] 方括号符号 [ ] 方括号表达式  \digit 子表达式或反向应用 * \ & \ } 前置单个字符发现的正则表达式 无符号连续 ^$ 锚点 煮酒品茶：你可以看不懂正则，但一定要记住优先级，不然你查表都没法查。流编辑器Sed 解释：shell中处理一般文件替换支持正则表达式与替换文本，任何可显示的字符都可以作为定界符，通常以标点符号作为分界符如 sed 's/a/b/' file 作用是把file文件中的第一个a替换成b 那么上方的定界符解释是什么意思呢？看这个你就明白了，sed's/a/b/' file 等同于 sed'#s#a#b' file 定界符就是这个意思，这里得感谢 dn833的指导，在sed中'与"都可以使用，意思就是说sed"s/a/b/' file也可以使用。使用方法： [address] command 替换：[address] s/pattern/replacement/flags 标记flages有： -n 可以是1-512，表示第n次出现的替换情况 g 全局更改，就是全部替换的意思 sed 's/a/b/g' file 后面那个g也就是flages全部替换。 p 打印模式之间的内容 w file 写入到一个文件file中下面有很多的实例： ------------------------------------------------ 查看文件 [root@localhost sed]# cat file a a a a a a b b b b bb b c c c c c c ddd dd d d d d 替换第一个'无空格a'为b [root@localhost sed]# sed 's/a/b/' file b a a a a b b b b b bb b c c c c c c ddd dd d d d d 替换全部的a为b g表示全部替换 [root@localhost sed]# sed 's/a/b/g' file b b b b b b b b b b bb b c c c c c c ddd dd d d d d 替换第一个'空格a'和'空格c'，其中;是分隔符 [root@localhost sed]# sed 's/ a/, b/ ; s/ c/,d/' file a, b a a a a b b b b bb b c,d c c c c ddd dd d d d d -------------------------------------------- 替换' " [ ] \ / .等符号替换'有点不同 ------------------------------------------- [root@localhost sed]# sed 's/'\''/b/g' file a a a a a a b b b b bb b c c c c c c ddd dd d d d d a a aa a a b " " " " " "" \\\\//[] b bb bb b b [root@localhost sed]# 替换其它的[ ]< >等 [root@localhost sed]# sed 's/\[/b/g' file a a a a a a b b b b bb b c c c c c c ddd dd d d d d a a aa a a ' " " " " " "" \\\\//b] ' '' '' ' ' [root@localhost ~]# 正则一例： [root@localhost sed]# cat z a:b c:d e:f [root@localhost sed]# sed 's/$.*$:$.*$/\2:\1/' z b:a d:c f:e 煮酒品茶：如何来看这个正则呢？ sed 's/$.*$:$.*$/\2:\1/' z 首先看大框框sed's/?a/?b/' 可以分为两部分了，?a=$.*$:$.*$ ?b=\2:\1 这样是不是就可以看清了？解释？a, \)就是相关的意思，正的变负的负的变正的，所以这里要这么理解\(，把一般字符(换成特殊字符，才能组成正则嘛，后面都一样， .* 看表后会发现.是任意一个字符，*是任意多个前面的字符，.*就是任意多个字符，现在看?b \2:\1 前面说了\正的搞成反的，在sed里2和1都是一般字符，这里反过来就是特殊字符也就是第一段和第二段，第二段是？a的后面那个.* \1是前面那个.* 所以是不是正好反过来了。看正则先看大框架再看优先级。看的多了就知道看了。册除空行和带#号的这一行，我自己写的，用sed -e也可以。 [root@localhost sed]# sed '/^$/D' /etc/vsftpd/vsftpd.conf |sed '/\#.*/D' anonymous_enable=YES local_enable=YES write_enable=YES local_umask=022 dirmessage_enable=YES xferlog_enable=YES connect_from_port_20=YES xferlog_std_format=YES listen=YES pam_service_name=vsftpd userlist_enable=YES 煮酒品茶：sed '/^$/D' /etc/vsftpd/vsftpd.conf |sed '/\#.*/D' 再拆呗，sed '//D是册除的写法，具体可看sed表。^$ ^是以这个为开头，$以这个为结尾，开头结尾那就是空行咯，所以空行全册掉。后面那个\#.* #不管在sed里还是正则里都没任何用，所以#.*也可以，我们可以更好的写^#.*来实现。这个要配置文件中相当重要，别人要看你的配置文件，你给他成百上千的行给别人看？ sed -e方式 [root@localhost sed]# sed -e '/^$/D' -e '/\#.*/D' /etc/vsftpd/vsftpd.conf anonymous_enable=YES local_enable=YES write_enable=YES local_umask=022 dirmessage_enable=YES xferlog_enable=YES connect_from_port_20=YES xferlog_std_format=YES listen=YES pam_service_name=vsftpd userlist_enable=YES tcp_wrappers=YES 把单个数据替换成单个字母，这个可不是全局匹配哇。1和a 2b 3c等进行替换。 [root@localhost sed]# cat number 123456 123654 [root@localhost sed]# sed 'y/123456/abcdef/' number abcdef abcfed 册除：:d命令 sed '2d' file 册除file第二行 sed '2,$d' file 册除2到最后那行 sed '$d' file 册除最后一行 sed '/test/'d file 册除file中包含test的行。 sed '/a/b/'d file 册除a到b中间的行。更多可以看：http://www.linuxde.net/2011/12/3381.html万变不离其宗，你掌握了规则，他再变也就是变下实例，其实吖根本就没变。 ---------------------------------------------- CUT 解释：用来剪下文本文件中的数据，可以是字段类型和字符类型，一个制表字符为单个字符。用法：cut -c list [file...] cut -f list [-d delim] [file...] -c 以字符为主 -d 定界符 -f 以字符为主实例： cut -d: -f 1,5 /etc/passwd 剪掉以:号为定界符的第1个和第5个然后打印出来， /etc/passwd文件内容太多了，直接看这个吧。 --------------------------------------- [root@localhost sed]# echo 1:2:a:e:l:6|cut -d: -f 1,4 1:e root@localhost sed]# ------------------------------------------------------ JOin 解释：可以将多个文件结合在一起，每个文件里的每条记录都共享一个健值，健值指的是主字段。语法：join [options...] file1 file2 转换过程如下： ---------------------------- [root@localhost sed]# cat 1 a 1 b 2 c 4 d 4 [root@localhost sed]# cat 2 a 2 b 4 c 8 d 9 [root@localhost sed]# join 1 2 a 1 2 b 2 4 c 4 8 d 4 9 [root@localhost sed]# ---------------------------------- 煮酒品茶：这个合并数据用不错。积累命令吧，积累多了你就是个宝库了。 Awk 解释：读取命令上所指定的各个文件（若无，则标准输入），一次读取一条记录（行）再针对每一行应用程序所指定的命令。 ...|awk '{print some-stuff}'|... 煮酒品茶：sed和awk是个大话题不可能一下讲过，所以原书上只讲了一部分，在后面有单独讲这个的。 awk '{print $1}' 打印第一个程序 awk '{print $1,$5}' 打印2-5个字段 awk '{print $1,$NFS}' 打印1到最后这个打印出来没回车 awk 'NF>0 {print $0}' 打印1到最后这个打印可来有回车 awk -F: '{print $1,$5}' 以:为定界符打印第一个字段和第五个字段。是不是和cut一样，我们试下吧。 ----------------------------- [root@localhost sed]# echo "a:b:c:d:e:f" |awk -F: '{print $1,$4}' a d [root@localhost sed]# echo "a:b:c:d:e:f" |cut -d: -f 1,4 a:d --------------------------------- 煮酒品茶:基本没区别，但是中间有个:号，下面也会讲到的。 awk -F: -v'OFS=**' 'print $1,$4' file 这个是以**为来做分隔符啦，我们再试下。 --------------------------- [root@localhost sed]# echo "a:b:c:d:e:f" |awk -F: -v 'OFS=:' '{print $1,$4}' a:d [root@localhost sed]# -------------------------------------- 煮酒品茶：注意OFS=:'后面要加个空格，和'｛分开。总结一下:笔记内容有， sed 正则 awk cut join 慢慢消化，多看实例，下回找个Shell来分析下。

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > SSC CC SRNS SRIS PPM
下一篇 > 100+Android 开源项目分类汇总二(精品 )

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

一起学Shell之(三) 查找与替换

相关文章