主頁 > 知識庫 > 一天一個shell命令 linux文本內容操作系列-sed命令詳解

一天一個shell命令 linux文本內容操作系列-sed命令詳解

熱門標簽:怎么在百度地圖標注公司的位置 百度地圖標注直線距離 德陽400電話申請 天津電話外呼系統(tǒng)排名 測繪地圖標注名稱 鶴崗400電話申請 外呼電話系統(tǒng)怎么操作 智能電銷機器人有用嗎 商機地圖標注

說明:

sed是stream editor(流編輯器)的縮寫。它能夠完美匹配正則表達式。sed和awk是文件編輯最重要的兩個命令了。尤其涉及到了很多正則表達式的問題,筆者不敢也有點犯怵,試著寫寫。

實例:

1.替換文件中的字符串

$sed -i 's/text/replace/g' file

#如果不加g結尾,則替換每一行的第一個

#如果只是打印,去掉-i

2.忽略前N處匹配,從N+1出開始替換

$sed -i 's/text/replace/2g' file

#在g前面加入數字N

3.移除空白符

$sed '/^$/d' file

4.標記已匹配的內容

$echo this is an example | sed 's:\w\+:/[]:g'

[this] [is] [an] [example]

#冒號是定界符,只要合適,定界符可以是任意的

5.子串匹配

$echo this is digit 7 in a number | sed 's:digit \(0-9\):\1:'

#輸出:this is 7 in a number

#學過正則表達式的人,都理解group的概念,()里的內容是第一組,所以只打印了7

6.引用

$text=hello

$echo hello world | sed "s/$text/HELLO"

#輸出HELLO world

#可能有人注意用雙引號,是因為單引號會把$text當做一個字符串,而不是表達式。

7.刪除

$sed '2d' file #刪除第二行

$sed '2,$d' file  #刪除2-最后一行

$sed '$d' file  #刪除最后一行

解讀—help

用法: sed [選項]... {腳本(如果沒有其他腳本)} [輸入文件]...

  -n, --quiet, --silent
                  取消自動打印模式空間
  -e 腳本, --expression=腳本
                 添加“腳本”到程序的運行列表
  -f 腳本文件, --file=腳本文件
                 添加“腳本文件”到程序的運行列表
  --follow-symlinks
                  直接修改文件時跟隨軟鏈接
  -i[擴展名], --in-place[=擴展名]
                  直接修改文件(如果指定擴展名就備份文件)
   -l N, --line-length=N
                  指定“l(fā)”命令的換行期望長度
  --posix
                  關閉所有 GNU 擴展
  -r, --regexp-extended
                  在腳本中使用擴展正則表達式
  -s, --separate
                  將輸入文件視為各個獨立的文件而不是一個長的連續(xù)輸入
  -u, --unbuffered
                  從輸入文件讀取最少的數據,更頻繁的刷新輸出
      --help     打印幫助并退出
      --version  輸出版本信息并退出

如果沒有 -e, --expression, -f 或 --file 選項,那么第一個非選項參數被視為
sed腳本。其他非選項參數被視為輸入文件,如果沒有輸入文件,那么程序將從標準
 輸入讀取數據。

解讀:

對于這個幫助信息,確實信息量非常不足,不過sed確實過于復雜,所以嘗試分成幾次來詳解這個命令。

我再借用另一段幫助信息文檔

調用sed命令有兩種形式:
sed [options] 'command' file(s)
sed [options] -f scriptfile file(s)

options
a\&;  例如:sed "a\mm" file
在當前行后面加入一行文本。
b lable
分支到腳本中帶有標記的地方,如果分支不存在則分支到腳本的末尾。
c\
用新的文本改變本行的文本。
d
從模板塊(Pattern space)位置刪除行。
D
刪除模板塊的第一行。
i\
在當前行上面插入文本。
h
拷貝模板塊的內容到內存中的緩沖區(qū)。
H
追加模板塊的內容到內存中的緩沖區(qū)
g
獲得內存緩沖區(qū)的內容,并替代當前模板塊中的文本。
G
獲得內存緩沖區(qū)的內容,并追加到當前模板塊文本的后面。
l
列表不能打印字符的清單。
n
讀取下一個輸入行,用下一個命令處理新的行而不是用第一個命令。
N
追加下一個輸入行到模板塊后面并在二者間嵌入一個新行,改變當前行號碼。
p
打印模板塊的行。
P(大寫)
打印模板塊的第一行。
q
退出Sed。
r file
從file中讀行。
t label
if分支,從最后一行開始,條件一旦滿足或者T,t命令,將導致分支到帶有標號的命令處,或者到腳本的末尾。
T label
錯誤分支,從最后一行開始,一旦發(fā)生錯誤或者T,t命令,將導致分支到帶有標號的命令處,或者到腳本的末尾。
w file
寫并追加模板塊到file末尾。
W file
寫并追加模板塊的第一行到file末尾。
!
表示后面的命令對所有沒有被選定的行發(fā)生作用。
s/re/string
用string替換正則表達式re。
=
打印當前行號碼。
#
把注釋擴展到下一個換行符以前。


 以下的是替換標記
g表示行內全面替換。
p表示打印行。
w表示把行寫入一個文件。
x表示互換模板塊中的文本和緩沖區(qū)中的文本。
y表示把一個字符翻譯為另外的字符(但是不用于正則表達式)

區(qū)別加斜桿與不加
 例如: a\ 表示在a\后面加入內容,而d則在d前面加入表達式,1d表示刪除1行。

sed補充

這是對sed命令與選項的一個比較全面的補充,主要是從網上搜集的例子。

1 p命令

命令p用于顯示模式空間的內容。默認情況下,sed把輸入行打印在屏幕上,選項-n用于取消默認的打印操作。當選項-n和命令p同時出現時,sed可打印選定的內容。

復制代碼 代碼如下:

sed '/my/p' datafile
 #默認情況下,sed把所有輸入行都打印在標準輸出上。如果某行匹配模式my,p命令將把該行另外打印一遍。

sed -n '/my/p' datafile
 #選項-n取消sed默認的打印,p命令把匹配模式my的行打印一遍。

2.d命令
命令d用于刪除輸入行。sed先將輸入行從文件復制到模式空間里,然后對該行執(zhí)行sed命令,最后將模式空間里的內容顯示在屏幕上。如果發(fā)出的是命令d,當前模式空間里的輸入行會被刪除,不被顯示。

 sed '$d' datafile
#刪除最后一行,其余的都被顯示
sed '/my/d' datafile
 #刪除包含my的行,其余的都被顯示

3.s命令

 sed 's/^My/You/g' datafile
 #命令末端的g表示在行內進行全局替換,也就是說如果某行出現多個My,所有的My都被替換為You。
sed -n '1,20s/My$/You/gp' datafile
 #取消默認輸出,處理1到20行里匹配以My結尾的行,把行內所有的My替換為You,并打印到屏幕上。
 

sed 's#My#Your#g' datafile
 #緊跟在s命令后的字符就是查找串和替換串之間的分隔符。分隔符默認為正斜杠,但可以改變。無論什么字符(換行符、反斜線除外),只要緊跟s命令,就成了新的串分隔符。

4 e選項

-e是編輯命令,用于sed執(zhí)行多個編輯任務的情況下。在下一行開始編輯前,所有的編輯動作將應用到模式緩沖區(qū)中的行上。

 sed -e '1,10d'-e 's/My/Your/g' datafile
  #選項-e用于進行多重編輯。第一重編輯刪除第1-3行。第二重編輯將出現的所有My替換為Your。因為是逐行進行這兩項編輯(即這兩個命令都在模式空間的當前行上執(zhí)行),所以編輯命令的順序會影響結果。 

 5 r命令
r命令是讀命令。sed使用該命令將一個文本文件中的內容加到當前文件的特定位置上。

 sed '/My/r introduce.txt' datafile
 #如果在文件datafile的某一行匹配到模式My,就在該行后讀入文件introduce.txt的內容。如果出現My的行不止一行,則在出現My的各行后都讀入introduce.txt文件的內容。

 6 w命令

 sed -n '/hrwang/w me.txt' datafile  
 
7 a\ 命令
a\ 命令是追加命令,追加將添加新文本到文件中當前行(即讀入模式緩沖區(qū)中的行)的后面。所追加的文本行位于sed命令的下方另起一行。如果要追加的內容超過一行,則每一行都必須以反斜線結束,最后一行除外。最后一行將以引號和文件名結束。

sed '/^hrwang/a\
 >hrwang and mjfan are husband\
 >and wife' datafile
 #如果在datafile文件中發(fā)現匹配以hrwang開頭的行,則在該行下面追加hrwang and mjfan are husband and wife
 
8 i\ 命令
i\ 命令是在當前行的前面插入新的文本。

9 c\ 命令

sed使用該命令將已有文本修改成新的文本。

10 n命令
sed使用該命令獲取輸入文件的下一行,并將其讀入到模式緩沖區(qū)中,任何sed命令都將應用到匹配行緊接著的下一行上

 sed '/hrwang/{n;s/My/Your/;}' datafile 
=注:如果需要使用多條命令,或者需要在某個地址范圍內嵌套地址,就必須用花括號將命令括起來,每行只寫一條命令,或這用分號分割同一行中的多條命令。

11 y命令

該命令與UNIX/Linux中的tr命令類似,字符按照一對一的方式從左到右進行轉換。例如,y/abc/ABC/將把所有小寫的a轉換成A,小寫的b轉換成B,小寫的c轉換成C。

 sed '1,20y/hrwang12/HRWANG^$/' datafile
 #將1到20行內,所有的小寫hrwang轉換成大寫,將1轉換成^,將2轉換成$。
#正則表達式元字符對y命令不起作用。與s命令的分隔符一樣,斜線可以被替換成其它的字符。
 
 12 q命令
q命令將導致sed程序退出,不再進行其它的處理
01.sed '/hrwang/{s/hrwang/HRWANG/;q;}' datafile 

13 h命令和g命令

#cat datafile
My name is hrwang.
Your name is mjfan.
hrwang is mjfan's husband.
mjfan is hrwang's wife.
sed -e '/hrwang/h'-e '$G' datafile
sed -e '/hrwang/H' -e '$G' datafile
#通過上面兩條命令,你會發(fā)現h會把原來暫存緩沖區(qū)的內容清除,只保存最近一次執(zhí)行h時保存進去的模式空間的內容。而H命令則把每次匹配hrwnag的行都追加保存在暫存緩沖區(qū)。

sed -e '/hrwang/H' -e '$g' datafile
sed -e '/hrwang/H' -e '$G' datafile

#通過上面兩條命令,你會發(fā)現g把暫存緩沖區(qū)中的內容替換掉了模式空間中當前行的內容,此處即替換了最后一行。而G命令則把暫存緩沖區(qū)的內容追加到了模式空間的當前行后。此處即追加到了末尾。

您可能感興趣的文章:
  • shell腳本之正則表達式、grep、sed、awk
  • Python 實現簡單的shell sed替換功能(實例講解)
  • Linux shell利用sed如何批量更改文件名詳解
  • 詳解linux下批量替換文件內容的三種方法(perl,sed,shell)
  • Shell正則表達式之grep、sed、awk實操筆記
  • 利用perl、python、php、shell、sed、awk、c 實現字符串的翻轉
  • Shell文本處理三劍客之sed的使用

標簽:優(yōu)質小號 鎮(zhèn)江 武漢 滁州 六盤水 丹東 百色 自貢

巨人網絡通訊聲明:本文標題《一天一個shell命令 linux文本內容操作系列-sed命令詳解》,本文關鍵詞  一天,一個,shell,命令,linux,;如發(fā)現本文內容存在版權問題,煩請?zhí)峁┫嚓P信息告之我們,我們將及時溝通與處理。本站內容系統(tǒng)采集于網絡,涉及言論、版權與本站無關。
  • 相關文章
  • 下面列出與本文章《一天一個shell命令 linux文本內容操作系列-sed命令詳解》相關的同類信息!
  • 本頁收集關于一天一個shell命令 linux文本內容操作系列-sed命令詳解的相關信息資訊供網民參考!
  • 推薦文章