主頁 > 知識庫 > Linux 中刪除文本中的回車字符的方法

Linux 中刪除文本中的回車字符的方法

熱門標(biāo)簽:承德地圖標(biāo)注公司 濮陽好的聯(lián)通400電話申請 虛假地圖標(biāo)注 地圖標(biāo)注如何改成微信號 地圖標(biāo)注黃河的位置 百度地圖標(biāo)注公司位置要多少錢 靈圖uu電子寵物店地圖標(biāo)注 山東企業(yè)外呼系統(tǒng)公司 400電話號碼辦理多少錢

當(dāng)回車字符(Ctrl+M)讓你緊張時,別擔(dān)心。有幾種簡單的方法消除它們。

“回車”字符可以往回追溯很長一段時間 —— 早在打字機(jī)上就有一個機(jī)械裝置或杠桿將承載紙滾筒的機(jī)架移到右邊,以便可以重新在左側(cè)輸入字母。他們在 Windows 上的文本文件上保留了它,但從未在 Linux 系統(tǒng)上使用過。當(dāng)你嘗試在 Linux 上處理在 Windows 上創(chuàng)建的文件時,這種不兼容性有時會導(dǎo)致問題,但這是一個非常容易解決的問題。

如果你使用 od八進(jìn)制轉(zhuǎn)儲octal dump)命令查看文件,那么回車(也用 Ctrl+M 代表)字符將顯示為八進(jìn)制的 15。字符 CRLF 通常用于表示 Windows 文本文件中的一行結(jié)束的回車符和換行符序列。那些注意看八進(jìn)制轉(zhuǎn)儲的會看到 \r\n。相比之下,Linux 文本僅以換行符結(jié)束。

這有一個 od 輸出的示例,高亮顯示了行中的 CRLF 字符,以及它的八進(jìn)制。

$ od -bc testfile.txt
0000000 124 150 151 163 040 151 163 040 141 040 164 145 163 164 040 146
  T h i s i s a t e s t f
0000020 151 154 145 040 146 162 157 155 040 127 151 156 144 157 167 163
  i l e f r o m W i n d o w s
0000040 056 015 012 111 164 047 163 040 144 151 146 146 145 162 145 156 <==
  . \r \n I t ' s d i f f e r e n <==
0000060 164 040 164 150 141 156 040 141 040 125 156 151 170 040 164 145
  t t h a n a U n i x t e
0000100 170 164 040 146 151 154 145 015 012 167 157 165 154 144 040 142 <==
  x t f i l e \r \n w o u l d b <==

雖然這些字符不是大問題,但是當(dāng)你想要以某種方式解析文本,并且不希望就它們是否存在進(jìn)行編碼時,這有時候會產(chǎn)生干擾。

3 種從文本中刪除回車符的方法

幸運(yùn)的是,有幾種方法可以輕松刪除回車符。這有三個選擇:

dos2unix

你可能會在安裝時遇到麻煩,但 dos2unix 可能是將 Windows 文本轉(zhuǎn)換為 Unix/Linux 文本的最簡單方法。一個命令帶上一個參數(shù)就行了。不需要第二個文件名。該文件會被直接更改。

$ dos2unix testfile.txt
dos2unix: converting file testfile.txt to Unix format...

你應(yīng)該會發(fā)現(xiàn)文件長度減少,具體取決于它包含的行數(shù)。包含 100 行的文件可能會縮小 99 個字符,因?yàn)橹挥凶詈笠恍胁粫?CRLF 字符結(jié)尾。

之前:

-rw-rw-r-- 1 shs shs 121 Sep 14 19:11 testfile.txt

之后:

-rw-rw-r-- 1 shs shs 118 Sep 14 19:12 testfile.txt

如果你需要轉(zhuǎn)換大量文件,不用每次修復(fù)一個。相反,將它們?nèi)糠旁谝粋€目錄中并運(yùn)行如下命令:

$ find . -type f -exec dos2unix {} \;

在此命令中,我們使用 find 查找常規(guī)文件,然后運(yùn)行 dos2unix 命令一次轉(zhuǎn)換一個。命令中的 {} 將被替換為文件名。運(yùn)行時,你應(yīng)該處于包含文件的目錄中。此命令可能會損壞其他類型的文件,例如除了文本文件外在上下文中包含八進(jìn)制 15 的文件(如,鏡像文件中的字節(jié))。

sed

你還可以使用流編輯器 sed 來刪除回車符。但是,你必須提供第二個文件名。以下是例子:

$ sed -e “s/^M//” before.txt > after.txt

一件需要任意的重要的事情是,請不要輸入你看到的字符。你必須按下 Ctrl+V 后跟 Ctrl+M 來輸入 ^M。s 是替換命令。斜杠將我們要查找的文本(Ctrl + M)和要替換的文本(這里為空)分開。

vi

你甚至可以使用 vi 刪除回車符(Ctrl+M),但這里假設(shè)你沒有打開數(shù)百個文件,或許也在做一些其他的修改。你可以鍵入 : 進(jìn)入命令行,然后輸入下面的字符串。與 sed 一樣,命令中 ^M 需要通過 Ctrl+V 輸入 ^,然后 Ctrl+M 插入 M%s 是替換操作,斜杠再次將我們要刪除的字符和我們想要替換它的文本(空)分開。 g(全局)意味在所有行上執(zhí)行。

:%s/^M//g

總結(jié)

dos2unix 命令可能是最容易記住的,也是從文本中刪除回車的最可靠的方法。其他選擇使用起來有點(diǎn)困難,但它們提供相同的基本功能。

via: https://www.networkworld.com/article/3438857/how-to-remove-carriage-returns-from-text-files-on-linux.html

總結(jié)

以上所述是小編給大家介紹的 Linux 中刪除文本中的回車字符的方法,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
如果你覺得本文對你有幫助,歡迎轉(zhuǎn)載,煩請注明出處,謝謝!

標(biāo)簽:鷹潭 泰安 上海 福州 樂山 安康 淮安 德宏

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Linux 中刪除文本中的回車字符的方法》,本文關(guān)鍵詞  Linux,中,刪除,文本,中的,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Linux 中刪除文本中的回車字符的方法》相關(guān)的同類信息!
  • 本頁收集關(guān)于Linux 中刪除文本中的回車字符的方法的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章