查看原文
其他

Shell编程之文本处理工具与bash的特性

景禹 景禹 2022-06-09

最近听我一位工作的朋友讲起,说是在公司上班之后,shell编程经常使用,不论是对数据库日志的处理,还是其他一些形式的文本处理都很方便,所以决定将shell编程好好巩固学习一番,对于那些搞运维的小姐姐,学好shell编程也是很有必要的。(建议浏览器中参考学习,效果更棒!

文本处理工具

1. grep工具

grep是过滤工具;用于根据关键字进行行过滤

语法:

# grep [选项] '关键字' 文件名

常见选项:

OPTIONS: -i: 不区分大小写 -v: 查找不包含指定内容的行,反向选择 -w: 按单词搜索 -o: 打印匹配关键字 -c: 统计匹配到的行数 -n: 显示行号 -r: 逐层遍历目录查找 -A: 显示匹配行及后面多少行 -B: 显示匹配行及前面多少行 -C: 显示匹配行前后多少行 -l:只列出匹配的文件名 -L:列出不匹配的文件名 -e: 使用正则匹配 -E:使用扩展正则匹配 ^key:以关键字开头 key$:以关键字结尾 ^$:匹配空行    --color=auto :可以将找到的关键词部分加上颜色的显示

实验中使用的文件是将/etc/passwd 拷贝到 /tmp/ 目录下进行的,说明:不要直接使用/etc/passwd文件,将其拷贝到/tmp下做实验。


颜色显示(别名设置):

临时设置:# alias grep='grep --color=auto' //只针对当前终端和当前用户生效永久设置:1)全局(针对所有用户生效)vim /etc/bashrcalias grep='grep --color=auto'source /etc/bashrc
2)局部(针对具体的某个用户)vim ~/.bashrcalias grep='grep --color=auto'source ~/.bashrc

举例说明:

# grep -i 'root' passwd //忽略大小写匹配包含root的行# grep -w 'ftp' passwd //精确匹配ftp单词# grep -w 'hello' passwd //精确匹配hello单词;自己添加包含hello的行到文件# grep -wo 'ftp' passwd //打印匹配到的关键字ftp# grep -n 'root' passwd //打印匹配到root关键字的行号# grep -ni 'root' passwd //忽略大小写匹配统计包含关键字root的行# grep -nic 'root' passwd //忽略大小写匹配统计包含关键字root的行数# grep -i '^root' passwd //忽略大小写匹配以root开头的行# grep 'bash$' passwd //匹配以bash结尾的行# grep -n '^$' passwd //匹配空行并打印行号# grep '^#' /etc/vsftpd/vsftpd.conf //匹配以#号开头的行# grep -v '^#' /etc/vsftpd/vsftpd.conf //匹配不以#号开头的行# grep -A5 'mail' passwd      //匹配包含mail关键字及其后5行# grep -B5 'mail' passwd //匹配包含mail关键字及其前5行# grep -C5 'mail' passwd //匹配包含mail关键字及其前后5行

2. cut工具

cut是截取工具,用于列的截取

语法:

cut 选项 文件名

常见选项:

 -c: 以字符为单位进行分割,截取 -d: 自定义分隔符,默认为制表符\t -f: 与 -d 一起使用,指定截取哪个区域

举例说明:

cut -d: -f1 1.txt       //以:冒号分割,截取第1列内容cut -d: -f1,6,7 1.txt   //以:冒号分割,截取第1,6,7列内容cut -c4 1.txt           //截取文件中每行第4个字符cut -c1-4 1.txt         //截取文件中每行的1-4个字符cut -c4-10 1.txt        //截取文件中每行的4-10个字符cut -c5- 1.txt          //从第5个字符开始截取后面所有字符

练习:用小工具列出你当系统的运行级别。运行级别一般为5或者3

  1. 如何查看系统运行级别

  • 命令runlevel

  • 文件/etc/inittab

  • 如何过滤运行级别

    runlevel | cut -c3runlevel | cut -d ' ' -f2grep -v '^#' /etc/inittab | cut -d: -f2grep '^id' /etc/inittab | cut -d: -f2grep "initdefault:$" /etc/inittab | cut -c4grep -v ^# /etc/inittab | cut -c4grep 'id:' /etc/inittab | cut -d: -f2cut -d':' -f2 /etc/inittab | grep -v ^#cut -c4 /etc/inittab | tail -1cut -d: -f2 /etc/inittab | tail -1

    3. sort工具

    sort工具用于排序;它将文件的每一行作为一个单位,从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。

    语法和选项

    -u :去除重复行 -r :降序排列,默认是升序 -o : 将排序结果输出到文件中,类似重定向符号 > -n:以数字排序,默认是按字符排序 -t :分隔符 -k :第N列 -b :忽略前导空格。 -R :随机排序,每次运行的结果均不同

    举例说明

    head passwd > 1.txt
    sort -n -t: -k3 1.txt //按照用户的uid进行升序排列 sort -nr -t: -k3 1.txt //按照用户的uid进行降序排列 sort -nr -t: -k3 1.txt -o 2.txt sort -n 2.txt //按照数字排序 sort -nu 2.txt //按照数字排序并且去重 sort -nr 2.txt sort -nru 2.txt sort -nru 2.txt sort -n 2.txt -o 3.txt 按照数字排序并将结果重定向到文件 sort -R 2.txt sort -u 2.txt


    4. uniq工具

    uniq用于去除连续重复
    -i: 忽略大小写-c: 统计重复行次数-d: 只显示重复行
    举例说明:uniq 2.txtuniq -d 2.txtuniq -dc 2.txt

    5. tee工具

    tee工具是从标准输入读取并写入到标准输出和文件,即:双向覆盖重定向(屏幕输出|文本输入)
    选项:-a 双向追加重定向
    echo hello worldecho hello world | tee file1cat file1echo 999 | tee -a file1cat file1
    grep -v '^#' vsftpd.conf | grep -v '^$' | tee vsftpd.conf.back

    6. diff 工具


    diff工具用于逐行比较文件的不同

    注意:diff描述两个文件不同的方式是告诉我们怎样改变第一个文件之后与第二个文件匹配。

    语法:

    diff [选项] 文件1 文件2

    常用选项:

    选项含义
    -b不检查空格
    -B不检查空白行
    -i不检查大小写
    -w忽略所有的空格
    --normal正常格式显示(默认)
    -c上下文格式显示
    -u合并格式显示

    举例说明:

    • 比较两个普通文件异同,文件准备:

    # cat file1
    aaaa
    111
    hello world
    222
    333
    bbb
    # cat file2
    aaa
    hello
    111
    222
    bbb
    333
    world

    1)正常显示

    diff目的:file1如何改变才能和file2匹配[root@MissHou ~]# diff file1 file21c1,2 第一个文件的第1行需要改变(c=change)才能和第二个文件的第1到2行匹配< aaaa 小于号"<"表示左边文件(file1)文件内容------表示分隔符> aaa 大于号">"表示右边文件(file2)文件内容> hello3d3 第一个文件的第3行删除(d=delete)后才能和第二个文件的第3行匹配< hello world5d4 第一个文件的第5行删除后才能和第二个文件的第4行匹配< 3336a6,7 第一个文件的第6行增加(a=add)内容后才能和第二个文件的第6到7行匹配> 333 需要增加的内容在第二个文件里是333和world> world

    2)上下文格式显示

    [root@MissHou ~]# diff -c file1 file2前两行主要列出需要比较的文件名和文件的时间戳;文件名前面的符号***表示file1,---表示file2*** file1 2019-04-16 16:26:05.748650262 +0800--- file2 2019-04-16 16:26:30.470646030 +0800***************我是分隔符*** 1,6 **** 以***开头表示file1文件,1,6表示1到6行! aaaa! 表示该行需要修改才与第二个文件匹配 111- hello world -表示需要删除该行才与第二个文件匹配 222- 333 -表示需要删除该行才与第二个文件匹配 bbb--- 1,7 ---- 以---开头表示file2文件,1,7表示1到7行! aaa 表示第一个文件需要修改才与第二个文件匹配! hello 表示第一个文件需要修改才与第二个文件匹配 111 222 bbb+ 333 表示第一个文件需要加上该行才与第二个文件匹配+ world 表示第一个文件需要加上该行才与第二个文件匹配

    3)合并格式显示

    [root@MissHou ~]# diff -u file1 file2前两行主要列出需要比较的文件名和文件的时间戳;文件名前面的符号---表示file1,+++表示file2--- file1 2019-04-16 16:26:05.748650262 +0800+++ file2 2019-04-16 16:26:30.470646030 +0800@@ -1,6 +1,7 @@-aaaa+aaa+hello111-hello world222-333bbb+333+world
    • 比较两个目录不同

    默认情况下也会比较两个目录里相同文件的内容[root@MissHou tmp]# diff dir1 dir2diff dir1/file1 dir2/file10a1> helloOnly in dir1: file3Only in dir2: test1如果只需要比较两个目录里文件的不同,不需要进一步比较文件内容,需要加-q选项[root@MissHou tmp]# diff -q dir1 dir2Files dir1/file1 and dir2/file1 differOnly in dir1: file3Only in dir2: test1

    其他小技巧:

    有时候我们需要以一个文件为标准,去修改其他文件,并且修改的地方较多时,我们可以通过打补丁的方式完成。

    1)先找出文件不同,然后输出到一个文件[root@MissHou ~]# diff -uN file1 file2 > file.patch-u:上下文模式-N:将不存在的文件当作空文件2)将不同内容打补丁到文件[root@MissHou ~]# patch file1 file.patchpatching file file13)测试验证[root@MissHou ~]# diff file1 file2

    7. paste工具

    paste工具用于合并文件行
    常用选项: -d:自定义间隔符,默认是tab -s:串行处理,非并行

    8. tr工具

    tr用于字符转换,替换和删除;主要用于删除文件中控制字符或进行字符转换

    语法:

    用法1:命令的执行结果交给tr处理,其中string1用于查询,string2用于转换处理# commands|tr 'string1' 'string2'用法2:tr处理的内容来自文件,记住要使用"<"标准输入# tr 'string1' 'string2' < filename
    用法3:匹配string1进行相应操作,如删除操作# tr options 'string1' < filename

    常用选项:

    -d 删除字符串1中所有输入字符。 -s 删除所有重复出现字符序列,只保留第一个;即将重复出现字符串压缩为一个字符串

    常匹配字符串:

    字符串含义
    a-z或[:lower:]匹配所有小写字母
    A-Z或[:upper:]匹配所有大写字母
    0-9或[:digit:]匹配所有数字
    [:alnum:]匹配所有字母和数字
    [:alpha:]匹配所有字母
    [:blank:]所有水平空白
    [:punct:]匹配所有标点符号
    [:space:]所有水平或垂直的空格
    [:cntrl:]所有控制字符
    \nCtrl-J 换行
    \rCtrl-M 回车
    \tCtrl-I  tab键
    \fCtrl-L  走行换页

    举例说明:

    # cat 3.txt 自己创建该文件用于测试ROOT:x:0:0:root:/root:/bin/bashbin:x:1:1:bin:/bin:/sbin/nologindaemon:x:2:2:daemon:/sbin:/sbin/nologinadm:x:3:4:adm:/var/adm:/sbin/nologinlp:x:4:7:lp:/var/spool/lpd:/sbin/nologinsync:x:5:0:sync:/sbin:/bin/syncshutdown:x:6:0:shutdown:/sbin:/sbin/shutdownhalt:x:7:0:halt:/sbin:/sbin/haltmail:x:8:12:mail:/var/spool/mail:/sbin/nologinuucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologinboss02:x:516:511::/home/boss02:/bin/bashvip:x:517:517::/home/vip:/bin/bashstu1:x:518:518::/home/stu1:/bin/bashmailnull:x:47:47::/var/spool/mqueue:/sbin/nologinsmmsp:x:51:51::/var/spool/mqueue:/sbin/nologinaaaaaaaaaaaaaaaaaaaabbbbbb111111122222222222233333333cccccccchello world 888666777999

     tr -d '[:/]' < 3.txt 删除文件中的:和/ cat 3.txt |tr -d '[:/]'删除文件中的:和/ tr '[0-9]' '@' < 3.txt 将文件中的数字替换为@符号 tr '[a-z]' '[A-Z]' < 3.txt 将文件中的小写字母替换成大写字母 tr -s '[a-z]' < 3.txt 匹配小写字母并将重复的压缩为一个 tr -s '[a-z0-9]' < 3.txt 匹配小写字母和数字并将重复的压缩为一个 tr -d '[:digit:]' < 3.txt 删除文件中的数字 tr -d '[:blank:]' < 3.txt 删除水平空白 tr -d '[:space:]' < 3.txt 删除所有水平和垂直空白

    小试牛刀

    1. 使用小工具分别截取当前主机IP;截取NETMASK;截取广播地址;截取MAC地址

    ifconfig eth0|grep 'Bcast'|tr -d '[a-zA-Z ]'|cut -d: -f2,3,410.1.1.1:10.1.1.255:255.255.255.0ifconfig eth0|grep 'Bcast'|tr -d '[a-zA-Z ]'|cut -d: -f2,3,4|tr ':' '\n'10.1.1.110.1.1.255255.255.255.0#ifconfig eth0|grep 'HWaddr'|cut -d: -f2-|cut -d' ' -f400:0C:29:25:AE:54#ifconfig eth0|grep 'HW'|tr -s ' '|cut -d' ' -f500:0C:29:B4:9E:4E
    # ifconfig eth1|grep Bcast|cut -d: -f2|cut -d' ' -f1# ifconfig eth1|grep Bcast|cut -d: -f2|tr -d '[ a-zA-Z]'# ifconfig eth1|grep Bcast|tr -d '[:a-zA-Z]'|tr ' ' '@'|tr -s '@'|tr '@' '\n'|grep -v ^$# ifconfig eth0|grep 'Bcast'|tr -d [:alpha:]|tr '[ :]' '\n'|grep -v ^$# ifconfig eth1|grep HWaddr|cut -d ' ' -f11# ifconfig eth0|grep HWaddr|tr -s ' '|cut -d' ' -f5# ifconfig eth1|grep HWaddr|tr -s ' '|cut -d' ' -f5# ifconfig eth0|grep 'Bcast'|tr -d 'a-zA-Z:'|tr ' ' '\n'|grep -v '^$'
    1. 将系统中所有普通用户的用户名、密码和默认shell保存到一个文件中,要求用户名密码和默认shell之间用tab键分割

    # grep 'bash$' passwd |grep -v 'root'|cut -d: -f1,2,7|tr ':' '\t' |tee abc.txt

    bash的特性

    1、命令和文件自动补全

    Tab只能补全命令和文件(RHEL6/Centos6)

    2、常见的快捷键

    ^c 终止前台运行的程序^z 将前台运行的程序挂起到后台^d 退出 等价exit^l 清屏 ^a | home 光标移到命令行的最前端^e |end 光标移到命令行的后端^u 删除光标前所有字符^k 删除光标后所有字符^r 搜索历史命令

    3 、常用的通配符(重点

    *:匹配0或多个任意字符?:匹配任意单个字符[list]:匹配[list]中的任意单个字符,或者一组单个字符 [a-z][!list]: 匹配除list中的任意单个字符{string1,string2,...}:匹配string1,string2或更多字符串

    # rm -f file*# cp *.conf /dir1# touch file{1..5}

    4、bash中的引号(重点)

    • 双引号"" :会把引号的内容当成整体来看待,允许通过$符号引用其他变量值

    • 单引号'':会把引号的内容当成整体来看待,禁止引用其他变量值,shell中特殊符号都被视为普通字符

    • 反撇号``:反撇号和$()一样,引号或括号里的命令会优先执行,如果存在嵌套,反撇号不能用

    [root]# echo "$(hostname)"server[root]# echo '$(hostname)'$(hostname)[root]# echo "hello world"hello world[root]# echo 'hello world'hello world
    [root]# echo $(date +%F)2020-03-07[root]# echo `echo $(date +%F)`2018-11-22[root]# echo `date +%F`2020-03-07[root]# echo `echo `date +%F``date +%F[root]# echo $(echo `date +%F`)2018-11-22

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存