27： sed高级应用、 awk基本用法、总结和答疑

2023-11-24 10:45:52

Top

NSD SHELL DAY05

案例1：sed综合脚本应用
案例2：使用awk提取文本
案例3：awk处理条件
案例4：awk综合脚本应用

1 案例1：sed综合脚本应用

1.1 问题

本案例要求编写脚本getupwd.sh，实现以下需求：

找到使用bash作登录Shell的本地用户
列出这些用户的shadow密码记录
按每行“用户名 --> 密码记录”保存到getupwd.log，如图-1所示

图－1

1.2 方案

基本思路如下：

先用sed工具取出登录Shell为/bin/bash的用户记录，保存为临时文件/tmp/urec.tmp，并计算记录数量
再结合while循环遍历取得的账号记录，逐行进行处理
针对每一行用户记录，采用掐头去尾的方式获得用户名、密码字串
按照指定格式追加到/tmp/getuupwd.log文件
结束循环后删除临时文件，报告分析结果

1.3 步骤

实现此案例需要按照如下步骤进行。

步骤一：编写getupwd.sh脚本

[root@svr5 ~]# vim ./getupwd.sh  
#/bin/bash
A=$(sed -n '/bash$/s/:.*//p' /etc/passwd) 			## 提取符合条件的账号记录
for i in  $A     									##遍历账号记录
dopass1=$(grep $i /etc/shadow)pass2=${pass1#*:}pass=${pass2%%:*}echo  "$i   --> $pass"
done

[root@svr5 ~]# chmod +x ./getupwd.sh

步骤二：测试、验证执行结果

[root@svr5 ~]# ./getupwd.sh

用户分析完毕，请查阅文件 /tmp/getupwd.log

[root@svr5 ~]# less /tmp/getupwd.log
root --> $6$ IWgMYmRACwdbfwBo$dr8Yn983nswiJVw0dTMjzbDvSLeCd1GMYjbvsDiFEkL8jnXOLcocBQypOCr4C6BRxNowIxjh6U2qeFU0u1LST/
zengye --> $6$ Qb37LOdzRl5995PI$L0zTOgnhGz8ihWkW81J.5XhPp/l7x2./Me2ag0S8tRndCBL9nIjHIKkUKulHxJ6TXyHYmffbVgUT6pbSwf8O71
clamav --> !!
mysql --> !!
abc --> !!
… …

从上述参考脚本可以发现，使用sed来实现字段提取会比较复杂。下一章课程将会学到awk命令，届时可以通过更简单的方法来改进此脚本内容。

总结知识点：

#sed [选项] ‘条件指令’ 文件

选项:

-n 屏蔽默认输出

-r 支持扩展正则

-i 修改源文件

条件：

行号 4 4,5 4~2 4,+10

/正则/

指令：

p 打印

d 删除

s 替换s/旧/新/g

a 追加

i 插入

c 替换行

2 案例2：使用awk提取文本

2.1 问题

本案例要求使用awk工具完成下列过滤任务：

练习awk工具的基本用法

提取本机的网卡流量、根分区剩余容量、获取SSH远程失败的IP地址
格式化输出/etc/passwd文件中的用户名、UID、宿主目录信息
2.2 步骤

实现此案例需要按照如下步骤进行。

步骤一：awk文本过滤的基本用法

1）基本操作方法

格式：awk [选项] '[条件]{指令}' 文件

其中，print 是最常用的编辑指令；若有多条编辑指令，可用分号分隔。

Awk过滤数据时支持仅打印某一列，如第2列、第5列等。

处理文本时，若未指定分隔符，则默认将空格、制表符等作为分隔符。

直接过滤文件内容：
```
[root@svr5 ~]# cat test.txt 
hello the world
welcome to beijing
[root@svr5 ~]# awk '{print $1,$3}' test.txt		//打印文档第1列和第3列
hello world
welcome beijing
```
结合管道过滤命令输出：
```
[root@svr5 ~]# df -h | awk '{print $4}'		//打印磁盘的剩余空间
```
2）选项 -F 可指定分隔符

输出passwd文件中以分号分隔的第1、7个字段，显示的不同字段之间以逗号隔开，操作如下：
```
[root@svr5 ~]# awk -F: '{print $1,$7}' /etc/passwd
root /bin/bash
bin /sbin/nologin
daemon /sbin/nologin
adm /sbin/nologin
lp /sbin/nologin
… …
```
awk还识别多种单个的字符，比如以“:”或“/”分隔，输出第1、10个字段：
```
[root@svr5 ~]# awk -F [:/] '{print $1,$10}' /etc/passwd
root bash
bin nologin
daemon nologin
adm sbin
… …
```
awk常用内置变量：

$0 文本当前行的全部内容

$1 文本的第1列

$2 文件的第2列

$3 文件的第3列，依此类推

NR 文件当前行的行号

NF 文件当前行的列数（有几列）

输出每次处理行的行号，以及当前行以“:”分隔的字段个数（有几列）：
```
[root@svr5 ~]# awk -F: '{print NR,NF}' passwd.txt
1 7
2 7
3 7
.. ..
```
2）awk的print指令不仅可以打印变量，还可以打印常量
```
[root@svr5 ~]# awk -F: '{print $1,"的解释器:",$7}' /etc/passwd
root 的解释器: /bin/bash
bin 的解释器: /sbin/nologin
… …
```
步骤二：利用awk提取本机的网络流量、根分区剩余容量、获取远程失败的IP地址

1）提取IP地址

分步实现的思路及操作参考如下——

通过ifconfig eth0查看网卡信息，其中包括网卡流量：
```
[root@svr5 ~]# ifconfig eth0
eth0: flags=4163  mtu 1500inet 192.168.4.21  netmask 255.255.255.0  broadcast 192.168.4.255inet6 fe80::fa64:c143:ad6a:5159  prefixlen 64  scopeid 0x20ether 52:54:00:b3:11:11  txqueuelen 1000  (Ethernet)RX packets 313982  bytes 319665556 (304.8 MiB)RX errors 0  dropped 0  overruns 0  frame 0TX packets 51809  bytes 40788621 (38.8 MiB)TX errors 0  dropped 0 overruns 0  carrier 0  collisions 0
```
RX为接收的数据量，TX为发送的数据量。packets以数据包的数量为单位，bytes以字节为单位：
```
[root@svr5 ~]# ifconfig eth0 | awk '/RX p/{print $5}'    //过滤接收数据的流量
319663094
[root@svr5 ~]# ifconfig eth0 | awk '/TX p/{print $5}'	 //过滤发送数据的流量
40791683
```
2）提取根分区剩余容量

分步实现的思路及操作参考如下——

通过df命令查看根分区的使用情况，其中包括剩余容量：
```
[root@svr5 ~]# df -h /
文件系统 			容量 	已用 	可用 	已用% 	挂载点
/dev/sda2 		19G 		7.2G 	11G 		40% 		/
```
输出上述结果中最后一行的第4列：
```
[root@svr5 ~]# df -h / | tail -1 | awk '{print $4}'
11G
```
或者直接在awk中使用正则：
```
[root@svr5 ~]# df -h | awk '/\/$/{print $4}'
11G
```
3）根据/var/log/secure日志文件，过滤远程连接密码失败的IP地址
```
[root@svr5 ~]# awk '/Failed/{print $11}' /var/log/secure
192.168.2.254
192.168.2.100
... ...
```
步骤三：格式化输出/etc/passwd文件

1）awk处理的时机

awk会逐行处理文本，支持在处理第一行之前做一些准备工作，以及在处理完最后一行之后做一些总结性质的工作。在命令格式上分别体现如下：
```
awk  [选项]  '[条件]{指令}'  文件
awk  [选项]  ' BEGIN{指令} {指令} END{指令}'  文件
```
- BEGIN{ } 行前处理，读取文件内容前执行，指令执行1次
- { } 逐行处理，读取文件过程中执行，指令执行n次
- END{ } 行后处理，读取文件结束后执行，指令执行1次
只做预处理的时候，可以没有操作文件，比如：
```
[root@svr5 ~]# awk 'BEGIN{A=24;print A*2}'
[root@svr5 ~]# awk 'BEGIN{print x+1}'           #x可以不定义，直接用，默认值位0
[root@svr5 ~]# awk 'BEGIN{print 3.2+3.5}'
```
举个例子（统计系统中使用bash作为登录Shell的用户总个数）：

a.预处理时赋值变量x=0

b.然后逐行读入/etc/passwd文件，如果发现登录Shell是/bin/bash则x加1

c.全部处理完毕后，输出x的值即可。相关操作及结果如下：
```
[root@svr5 ~]# awk 'BEGIN{x=0}/bash$/{x++} END{print x}' /etc/passwd
29
```
2）格式化输出/etc/passwd文件

要求: 格式化输出passwd文件内容时，要求第一行为列表标题，中间打印用户的名称、UID、家目录信息，最后一行提示一共已处理文本的总行数，如图-1所示。

图-1

3）根据实现思路编写、验证awk过滤语句

输出信息时，可以使用“\t”显示Tab制表位：
```
[root@svr5 ~]# awk -F: 'BEGIN{print "User\tUID\tHome"} \{print $1 "\t"  $3  "\t"  $6}     \END{print "Total",NR,"lines."}' /etc/passwd
User    UID     Home
root    0       /root
bin     1       /bin
daemon  2       /sbin
adm     3       /var/adm
lp      4       /var/spool/lpd
sync    5       /sbin
.. ..
Total 67 lines.
```
3 案例3：awk处理条件

3.1 问题

本案例要求使用awk工具完成下列过滤任务，注意awk处理条件的设置：
- 列出UID间于1~1000的用户详细信息
- 输出/etc/hosts文件内以127或192开头的记录
- 列出100以内整数中7的倍数或是含7的数
3.2 步骤

实现此案例需要按照如下步骤进行。

步骤一：认识awk处理条件的设置

1）使用正则设置条件

输出其中以bash结尾的完整记录：
```
[root@svr5 ~]# awk -F: '/bash$/{print}' /etc/passwd
root:x:0:0:root:/root:/bin/bash
```
输出包含root的行数据：
```
[root@svr5 ~]# awk -F: '/root/' /etc/passwd
```
输出root或adm账户的用户名和UID信息：
```
[root@svr5 ~]# awk -F: '/^(root|adm)/{print $1,$3}' /etc/passwd
root 0
adm 3
```
输出账户名称包含root的基本信息（第1列包含root）：
```
[root@svr5 ~]# awk -F: '$1~/root/' /etc/passwd
```
输出其中登录Shell不以nologin结尾（对第7个字段做!~反向匹配）的用户名、登录Shell信息：
```
[root@svr5 ~]# awk -F: '$7!~/nologin$/{print $1,$7}' /etc/passwd
root /bin/bash
sync /bin/sync
shutdown /sbin/shutdown
```
2）使用数值/字符串比较设置条件

比较符号：==(等于) !=（不等于） >（大于）

>=（大于等于） <（小于） <=（小于等于）

输出第3行（行号NR等于3）的用户记录：
```
[root@svr5 ~]# awk -F: 'NR==3{print}' /etc/passwd
```
输出账户UID大于等于1000的账户名称和UID信息：
```
[root@svr5 ~]# awk -F: '$3>=1000{print $1,$3}' /etc/passwd
tom 1000
jerry 1001
```
输出账户UID小于10的账户名称和UID信息：
```
[root@svr5 ~]# awk -F: '$3<10{print $1,$3}' /etc/passwd
root 0
bin 1
daemon 2
adm 3
lp 4
sync 5
shutdown 6
halt 7
mail 8
```
输出用户名为“root”的行：
```
[root@svr5 ~]# awk -F: '$1=="root"' /etc/passwd
root:x:0:0:root:/root:/bin/bash
```
3）逻辑测试条件

输出账户UID大于10并且小于20的账户信息：
```
[root@svr5 ~]# awk -F: '$3>10 && $3<20' /etc/passwd
operator:x:11:0:operator:/root:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin
ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
```
输出账户UID大于1000或者账户UID小于10的账户信息：
```
[root@svr5 ~]# awk -F: '$3>1000 || $3<10' /etc/passwd
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
varnish:x:1001:1001::/home/varnish:/sbin/nologin
nginx:x:1002:1002::/home/nginx:/sbin/nologin
```
4）数学运算
```
[root@svr5 ~]# awk 'BEGIN{x++;print x}'
1
[root@svr5 ~]# awk 'BEGIN{x=8;print x+=2}'
10
[root@svr5 ~]# awk 'BEGIN{x=8;x--;print x}'
7
[root@svr5 ~]# awk 'BEGIN{print 2+3}'
5
[root@svr5 ~]# awk 'BEGIN{print 2*3}'
6
[root@svr5 ~]# awk 'BEGIN{print 2*3}'
6
[root@svr5 ~]# awk 'BEGIN{ print 23%8}'
7
[root@svr5 ~]# seq  200 | awk  '$1%3==0'       //找200以内3的倍数
… …
```
步骤二：完成任务要求的awk过滤操作

1）列出UID间于1~1000的用户详细信息：
```
[root@svr5 ~]# awk -F: '$3>=1 && $3<=1000' /etc/passwd
```
2）输出/etc/hosts映射文件内以127或者192开头的记录：
```
[root@svr5 ~]# awk  '/^(127|192)/' /etc/hosts
127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
192.168.4.5  svr5.tarena.com svr5
```
3）列出100以内整数中7的倍数或是含7的数：
```
[root@svr5 ~]# seq 100 | awk '$1%7==0||$1~/7/'
7
14
17
21
27
28
35
37
42
47
.. ..
```
4 案例4：awk综合脚本应用

4.1 问题

本案例要求编写脚本，实现以下需求：
- 找到使用bash作登录Shell的本地用户
- 列出这些用户的shadow密码记录，如图-2所示
图－2

4.2 步骤

实现此案例需要按照如下步骤进行。

步骤一：任务需求及思路分析

编写脚本的任务要求如下：
- 分析出使用bash作登录Shell的本地用户
- 列出这些用户的shadow密码记录
- 按每行“用户名 -- 密码记录”保存结果
步骤二：根据实现思路编写脚本
```
[root@svr5 ~]# cat getupwd-awk.sh
#/bin/bash
A=$(awk -F:  '/bash$/{print $1}' /etc/passwd)		## 提取符合条件的账号记录
```
for i in $A
do
grep $i /etc/shadow | awk -F: ‘{print $1,"–>",$2}’
done

步骤三：验证、测试脚本
```
[root@svr5 ~]# ./getupwd-awk.sh

root -->  $6$ IWgMYmRACwdbfwBo$dr8Yn983nswiJVw0dTMjzbDvSLeCd1GMYjbvsDiFEkL8jnXOLcocBQypOCr4C6BRxNowIxjh6U2qeFU0u1LST/

zengye -->  $6$ Qb37LOdzRl5995PI$L0zTOgnhGz8ihWkW81J.5XhPp/l7x2./Me2ag0S8tRndCBL9nIjHIKkUKulHxJ6TXyHYmffbVgUT6pbSwf8O71

clamav --> !!

mysql --> !!

… …
```

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 7.@Data注解及其hashCode设值的研究
下一篇 > Linux Perf性能分析常用手段(火焰图,gprof,kernelshark,bts)

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

27： sed高级应用 、 awk基本用法 、 总结和答疑

NSD SHELL DAY05

1 案例1：sed综合脚本应用

1.1 问题

1.2 方案

1.3 步骤

2 案例2：使用awk提取文本

2.1 问题

2.2 步骤

3 案例3：awk处理条件

3.1 问题

3.2 步骤

4 案例4：awk综合脚本应用

4.1 问题

4.2 步骤

相关文章

27： sed高级应用、 awk基本用法、总结和答疑