在正常情況下,sed將待處理的行讀入模式空間,腳本中的命令就一條接著一條的對該行進(jìn)行處理,直到腳本執(zhí)行完畢,然后該行被輸出,模式空間請空;然后重復(fù)剛才的動作,文件中的新的一行被讀入,直到文件處理完備。但是,各種各樣的原因,比如用戶希望在某個條件下腳本中的某個命令被執(zhí)行,或者希望模式空間得到保留以便下一次的處理,都有可能使得sed在處理文件的時候不按照正常的流程來進(jìn)行。這個時候,sed設(shè)置了一些高級命令來滿足用戶的要求。如果想要學(xué)習(xí)sed的高級命令,首先要了解如下兩個緩存區(qū):
1、模式空間(pattern space)的定義:模式空間就是一個緩存區(qū),保存sed剛剛從輸入端讀取的。
2、暫存空間(hold space)的定義:暫存空間就是在處理模式空間數(shù)據(jù)的時候,臨時緩存數(shù)據(jù)用的。
還有幾個命令參數(shù):
g: 將hold space中的內(nèi)容拷貝到pattern space中,原來pattern space里的內(nèi)容清除
G: 將hold space中的內(nèi)容append到pattern space\n后
h: 將pattern space中的內(nèi)容拷貝到hold space中,原來的hold space里的內(nèi)容被清除
H: 將pattern space中的內(nèi)容append到hold space\n后
x: 交換pattern space和hold space的內(nèi)容
比如咱們想要倒排一個文件的內(nèi)容,文件如下:
[qiu.li@l-tdata1.tkt.cn6 ~]$ cat tmp
1-line
2-line
3-line
執(zhí)行如下命令:
[qiu.li@l-tdata1.tkt.cn6 ~]$ sed '2,$G;h;$!d' tmp
3-line
2-line
1-line
下面咱們逐步理解上面的執(zhí)行過程
一、讓咱們來分析一下如下三條命令:
- 2,$G:從第二行到最后一行執(zhí)行G命令
- h:執(zhí)行h命令
- $!d:刪除除了最后一行的所有行
二、具體的操作
- 掃描到第一行
- 將1-line放入模式空間;此時模式空間還是1-line;
- 直接執(zhí)行h命令,此時暫存空間是1-line;
- 執(zhí)行d命令,刪除了模式空間僅有的一行數(shù)據(jù),刪除之后,模式空間是空的
- 掃描到第二行
- 將2-line放入模式空間
- 執(zhí)行G命令,將暫存空間的1-line添加到模式空間2-line的后面,此時模式空間是2-line\n1-line;
- 執(zhí)行h命令,此時暫存空間的內(nèi)容是2-line\n1-line;
- 執(zhí)行d命令,模式空間被清空
- 掃描到第三行
- 將3-line放入模式空間,
- 執(zhí)行G命令,將暫存空間的2-line\n1-line添加到模式空間3-line的后面,此時模式空間是3-line\n2-line\n1-line;
- 執(zhí)行h命令,此時暫存空間的內(nèi)容是3-line\n2-line\n1-line;
- 不執(zhí)行$!d;
- 直接輸出 3-line\n2-line\n1-line
當(dāng)然,命令:sed '1!G;h;$!d' tmp 也能有這個效果。