說明:
sed是stream editor(流編輯器)的縮寫。它能夠完美匹配正則表達式。sed和awk是文件編輯最重要的兩個命令了。尤其涉及到了很多正則表達式的問題,筆者不敢也有點犯怵,試著寫寫。
實例:
1.替換文件中的字符串
$sed -i 's/text/replace/g' file
#如果不加g結尾,則替換每一行的第一個
#如果只是打印,去掉-i
2.忽略前N處匹配,從N+1出開始替換
$sed -i 's/text/replace/2g' file
#在g前面加入數字N
3.移除空白符
$sed '/^$/d' file
4.標記已匹配的內容
$echo this is an example | sed 's:\w\+:/[]:g'
[this] [is] [an] [example]
#冒號是定界符,只要合適,定界符可以是任意的
5.子串匹配
$echo this is digit 7 in a number | sed 's:digit \(0-9\):\1:'
#輸出:this is 7 in a number
#學過正則表達式的人,都理解group的概念,()里的內容是第一組,所以只打印了7
6.引用
$text=hello
$echo hello world | sed "s/$text/HELLO"
#輸出HELLO world
#可能有人注意用雙引號,是因為單引號會把$text當做一個字符串,而不是表達式。
7.刪除
$sed '2d' file #刪除第二行
$sed '2,$d' file #刪除2-最后一行
$sed '$d' file #刪除最后一行
解讀—help
用法: sed [選項]... {腳本(如果沒有其他腳本)} [輸入文件]...
-n, --quiet, --silent
取消自動打印模式空間
-e 腳本, --expression=腳本
添加“腳本”到程序的運行列表
-f 腳本文件, --file=腳本文件
添加“腳本文件”到程序的運行列表
--follow-symlinks
直接修改文件時跟隨軟鏈接
-i[擴展名], --in-place[=擴展名]
直接修改文件(如果指定擴展名就備份文件)
-l N, --line-length=N
指定“l(fā)”命令的換行期望長度
--posix
關閉所有 GNU 擴展
-r, --regexp-extended
在腳本中使用擴展正則表達式
-s, --separate
將輸入文件視為各個獨立的文件而不是一個長的連續(xù)輸入
-u, --unbuffered
從輸入文件讀取最少的數據,更頻繁的刷新輸出
--help 打印幫助并退出
--version 輸出版本信息并退出
如果沒有 -e, --expression, -f 或 --file 選項,那么第一個非選項參數被視為
sed腳本。其他非選項參數被視為輸入文件,如果沒有輸入文件,那么程序將從標準
輸入讀取數據。
解讀:
對于這個幫助信息,確實信息量非常不足,不過sed確實過于復雜,所以嘗試分成幾次來詳解這個命令。
我再借用另一段幫助信息文檔
調用sed命令有兩種形式:
sed [options] 'command' file(s)
sed [options] -f scriptfile file(s)
options
a\&; 例如:sed "a\mm" file
在當前行后面加入一行文本。
b lable
分支到腳本中帶有標記的地方,如果分支不存在則分支到腳本的末尾。
c\
用新的文本改變本行的文本。
d
從模板塊(Pattern space)位置刪除行。
D
刪除模板塊的第一行。
i\
在當前行上面插入文本。
h
拷貝模板塊的內容到內存中的緩沖區(qū)。
H
追加模板塊的內容到內存中的緩沖區(qū)
g
獲得內存緩沖區(qū)的內容,并替代當前模板塊中的文本。
G
獲得內存緩沖區(qū)的內容,并追加到當前模板塊文本的后面。
l
列表不能打印字符的清單。
n
讀取下一個輸入行,用下一個命令處理新的行而不是用第一個命令。
N
追加下一個輸入行到模板塊后面并在二者間嵌入一個新行,改變當前行號碼。
p
打印模板塊的行。
P(大寫)
打印模板塊的第一行。
q
退出Sed。
r file
從file中讀行。
t label
if分支,從最后一行開始,條件一旦滿足或者T,t命令,將導致分支到帶有標號的命令處,或者到腳本的末尾。
T label
錯誤分支,從最后一行開始,一旦發(fā)生錯誤或者T,t命令,將導致分支到帶有標號的命令處,或者到腳本的末尾。
w file
寫并追加模板塊到file末尾。
W file
寫并追加模板塊的第一行到file末尾。
!
表示后面的命令對所有沒有被選定的行發(fā)生作用。
s/re/string
用string替換正則表達式re。
=
打印當前行號碼。
#
把注釋擴展到下一個換行符以前。
以下的是替換標記
g表示行內全面替換。
p表示打印行。
w表示把行寫入一個文件。
x表示互換模板塊中的文本和緩沖區(qū)中的文本。
y表示把一個字符翻譯為另外的字符(但是不用于正則表達式)
區(qū)別加斜桿與不加
例如: a\ 表示在a\后面加入內容,而d則在d前面加入表達式,1d表示刪除1行。
sed補充
這是對sed命令與選項的一個比較全面的補充,主要是從網上搜集的例子。
1 p命令
命令p用于顯示模式空間的內容。默認情況下,sed把輸入行打印在屏幕上,選項-n用于取消默認的打印操作。當選項-n和命令p同時出現時,sed可打印選定的內容。
復制代碼 代碼如下:
sed '/my/p' datafile
#默認情況下,sed把所有輸入行都打印在標準輸出上。如果某行匹配模式my,p命令將把該行另外打印一遍。
sed -n '/my/p' datafile
#選項-n取消sed默認的打印,p命令把匹配模式my的行打印一遍。
2.d命令
命令d用于刪除輸入行。sed先將輸入行從文件復制到模式空間里,然后對該行執(zhí)行sed命令,最后將模式空間里的內容顯示在屏幕上。如果發(fā)出的是命令d,當前模式空間里的輸入行會被刪除,不被顯示。
sed '$d' datafile
#刪除最后一行,其余的都被顯示
sed '/my/d' datafile
#刪除包含my的行,其余的都被顯示
3.s命令
sed 's/^My/You/g' datafile
#命令末端的g表示在行內進行全局替換,也就是說如果某行出現多個My,所有的My都被替換為You。
sed -n '1,20s/My$/You/gp' datafile
#取消默認輸出,處理1到20行里匹配以My結尾的行,把行內所有的My替換為You,并打印到屏幕上。
sed 's#My#Your#g' datafile
#緊跟在s命令后的字符就是查找串和替換串之間的分隔符。分隔符默認為正斜杠,但可以改變。無論什么字符(換行符、反斜線除外),只要緊跟s命令,就成了新的串分隔符。
4 e選項
-e是編輯命令,用于sed執(zhí)行多個編輯任務的情況下。在下一行開始編輯前,所有的編輯動作將應用到模式緩沖區(qū)中的行上。
sed -e '1,10d'-e 's/My/Your/g' datafile
#選項-e用于進行多重編輯。第一重編輯刪除第1-3行。第二重編輯將出現的所有My替換為Your。因為是逐行進行這兩項編輯(即這兩個命令都在模式空間的當前行上執(zhí)行),所以編輯命令的順序會影響結果。
5 r命令
r命令是讀命令。sed使用該命令將一個文本文件中的內容加到當前文件的特定位置上。
sed '/My/r introduce.txt' datafile
#如果在文件datafile的某一行匹配到模式My,就在該行后讀入文件introduce.txt的內容。如果出現My的行不止一行,則在出現My的各行后都讀入introduce.txt文件的內容。
6 w命令
sed -n '/hrwang/w me.txt' datafile
7 a\ 命令
a\ 命令是追加命令,追加將添加新文本到文件中當前行(即讀入模式緩沖區(qū)中的行)的后面。所追加的文本行位于sed命令的下方另起一行。如果要追加的內容超過一行,則每一行都必須以反斜線結束,最后一行除外。最后一行將以引號和文件名結束。
sed '/^hrwang/a\
>hrwang and mjfan are husband\
>and wife' datafile
#如果在datafile文件中發(fā)現匹配以hrwang開頭的行,則在該行下面追加hrwang and mjfan are husband and wife
8 i\ 命令
i\ 命令是在當前行的前面插入新的文本。
9 c\ 命令
sed使用該命令將已有文本修改成新的文本。
10 n命令
sed使用該命令獲取輸入文件的下一行,并將其讀入到模式緩沖區(qū)中,任何sed命令都將應用到匹配行緊接著的下一行上
sed '/hrwang/{n;s/My/Your/;}' datafile
=注:如果需要使用多條命令,或者需要在某個地址范圍內嵌套地址,就必須用花括號將命令括起來,每行只寫一條命令,或這用分號分割同一行中的多條命令。
11 y命令
該命令與UNIX/Linux中的tr命令類似,字符按照一對一的方式從左到右進行轉換。例如,y/abc/ABC/將把所有小寫的a轉換成A,小寫的b轉換成B,小寫的c轉換成C。
sed '1,20y/hrwang12/HRWANG^$/' datafile
#將1到20行內,所有的小寫hrwang轉換成大寫,將1轉換成^,將2轉換成$。
#正則表達式元字符對y命令不起作用。與s命令的分隔符一樣,斜線可以被替換成其它的字符。
12 q命令
q命令將導致sed程序退出,不再進行其它的處理
01.sed '/hrwang/{s/hrwang/HRWANG/;q;}' datafile
13 h命令和g命令
#cat datafile
My name is hrwang.
Your name is mjfan.
hrwang is mjfan's husband.
mjfan is hrwang's wife.
sed -e '/hrwang/h'-e '$G' datafile
sed -e '/hrwang/H' -e '$G' datafile
#通過上面兩條命令,你會發(fā)現h會把原來暫存緩沖區(qū)的內容清除,只保存最近一次執(zhí)行h時保存進去的模式空間的內容。而H命令則把每次匹配hrwnag的行都追加保存在暫存緩沖區(qū)。
sed -e '/hrwang/H' -e '$g' datafile
sed -e '/hrwang/H' -e '$G' datafile
#通過上面兩條命令,你會發(fā)現g把暫存緩沖區(qū)中的內容替換掉了模式空間中當前行的內容,此處即替換了最后一行。而G命令則把暫存緩沖區(qū)的內容追加到了模式空間的當前行后。此處即追加到了末尾。
您可能感興趣的文章:- shell腳本之正則表達式、grep、sed、awk
- Python 實現簡單的shell sed替換功能(實例講解)
- Linux shell利用sed如何批量更改文件名詳解
- 詳解linux下批量替換文件內容的三種方法(perl,sed,shell)
- Shell正則表達式之grep、sed、awk實操筆記
- 利用perl、python、php、shell、sed、awk、c 實現字符串的翻轉
- Shell文本處理三劍客之sed的使用