與表類似,了解Lua如何實現(xiàn)字符串可以讓你更高效地使用它。
Lua實現(xiàn)字符串的方式與多數(shù)其他腳本語言所采用的兩種主要方式都不相同。首先,Lua中的所有字符串都是內(nèi)部化[1]的,這意味著Lua維護著任何字符串的一個單一拷貝。當一個新字符串出現(xiàn)時,Lua檢查是否有現(xiàn)成的拷貝,如果有的話,重用之。內(nèi)部化使得諸如字符串對比和索引表之類的操作非??焖伲菚档蛣?chuàng)建字符串的速度。
第二,Lua中的變量從不存儲字符串,只是引用它們。這種實現(xiàn)方式可以加快很多字符串操作,例如在Perl中,當你寫類似于$x=$y的代碼、$y是一個字符串時,賦值操作會將字符串的內(nèi)容從$y的緩沖區(qū)復制到$x的緩沖區(qū)。如果這個字符串很長,這個操作的開銷就很大。而在Lua中,這個賦值僅僅是一次指針的復制。
然而,這種引用實現(xiàn)會降低特定方式的字符串連接的速度。在Perl中,操作$s = $s . "x"和$s .= "x"區(qū)別非常大,對于前者,你獲得了$s的一個拷貝,并且追加"x"到它的尾部;而對于后者,"x"只是簡單地被追加到$s所維護的內(nèi)部緩沖區(qū)的尾部。因此,后者無關(guān)于字符串的長度(假設(shè)緩沖區(qū)足夠放下追加的文本)。如果把這兩句代碼放進循環(huán)里,它們的區(qū)別就是線性和二次算法的區(qū)別。例如,下述循環(huán)需要大約五分鐘來讀取一個5MB的文件:
復制代碼 代碼如下:
$x = "";
while (>)
{
$x = $x . $_;
}
如果我們把
復制代碼 代碼如下:
$x = $x . $_
改為
復制代碼 代碼如下:
$x .= $_
耗時將會降低為0.1秒!
Lua沒有提供第二種,也就是更快速的方式,因為它的變量沒有內(nèi)部緩沖區(qū)。因此,我們需要一個顯式的緩沖區(qū):一個包含字符串片段的表來完成這項工作。下面的循環(huán)讀取相同的5MB的文件,需要0.28秒,雖然沒有Perl那么快,也還算不錯:
復制代碼 代碼如下:
local t = {}
for line in io.lines() do
t[#t + 1] = line
end
s = table.concat(t, "\n")
[1] 內(nèi)部化,原文internalize
您可能感興趣的文章:- Lua性能優(yōu)化技巧(一):前言
- Lua性能優(yōu)化技巧(二):基本事實
- Lua性能優(yōu)化技巧(三):關(guān)于表
- Lua性能優(yōu)化技巧(五):削減、重用和回收
- Lua性能優(yōu)化技巧(六):最后的提示