亚洲国产a∨乱码无码中文电影,国产一视频在线观看,全免费a级毛片免费看无码

主頁 > 知識庫 > 正則表達式性能優(yōu)化方法（高效正則表達式書寫）

正則表達式性能優(yōu)化方法（高效正則表達式書寫）

這里說的正則表達式優(yōu)化，主要是針對目前常用的NFA模式正則表達式，詳細可以參考：正則表達式匹配解析過程探討分析（正則表達式匹配原理）。從上面例子，我們可以推斷出，影響NFA類正則表達式（常見語言：GNU Emacs,Java,ergp,less,more,.NET語言,
PCRE library,Perl,PHP,Python,Ruby,sed,vi )其實主要是它的“回溯”，減少“回溯”次數(shù)（減少循環(huán)查找同一個字符次數(shù)），是提高性能的主要方法。我們來看個例子：

源字符串：script type="text/javascript">adsfadfsdasfsdafdsfsadfsa/script>

匹配要求，匹配script….>…./script>標簽里面所有內(nèi)容，包括改標簽

常見寫法(1)，因為script后面可能出現(xiàn)字符、空白、特殊符號等，還有標簽里面也可能出現(xiàn)各種js代碼。我們簡單方法是：

正則表達式：script.*?>.*?/script> (測試工具使用了：regexBuddy)

總共花費115步，回溯了：48次。因為我們使用”.”字符，匹配默認情況下除了\n之外所有字符。
方法（2），我們分析特點發(fā)現(xiàn)，script…>后面，應該是除了”>”之外都可以字符，然后一對script>標簽里面js內(nèi)容?？梢远x為除了””之外。（這里面我只是舉例說明優(yōu)化方法，實際網(wǎng)頁中script標簽里面，常見都會出現(xiàn)有””字符了）

正則表達式：script[^?>]+>[^]+/script>

19步，0次回溯！，步驟只有原先的15%左右，性能幾倍的提升了！
從上面我們看到，不同正則表達式，對通用字符配平，性能相差會很大。減少“回溯”是最好的方法，減少回溯其中最主要的方法是：”用最小范圍的元字符，盡量避免用過大的元字符！”。一般規(guī)律如下：

1、使用正確的邊界匹配器（^、$、\b、\B等），限定搜索字符串位置
2、使用具體的元字符、字符類（\d、\w、\s等），少用”.”字符
3、使用正確的量詞（+、*、?、{n,m}），如果能夠限定長度，匹配最佳
4、使用非捕獲組、原子組，減少沒有必要的字匹配捕獲用(?:)

如：我想匹配一些英文字母，它后面接的是數(shù)字。如：abc1234,我可以寫 “\w+\d+”，也可以寫”[a-zA-Z]+\d+” ，其中第一個\w+會先匹配所有abc1234，然后回溯，匹配滿足\d+格式。一共4步，而后面這個只需要2步，步驟減少一半了！好了，今天就先到這里，歡迎大家討論、交流！

您可能感興趣的文章:

Python 正則表達式匹配字符串中的http鏈接方法
python正則表達式去除兩個特殊字符間的內(nèi)容方法
Python實現(xiàn)正則表達式匹配任意的郵箱方法
Java使用正則表達式驗證手機號和電話號碼的方法
js正則表達式校驗指定字符串的方法
JS使用正則表達式獲取小括號、中括號及花括號內(nèi)容的方法示例
Android 2018最新手機號驗證正則表達式方法
前端正則表達式書寫及常用的方法

標簽：咸陽鞍山池州梅州三亞綿陽六安恩施

巨人網(wǎng)絡通訊聲明：本文標題《正則表達式性能優(yōu)化方法（高效正則表達式書寫）》，本文關鍵詞正則,表達式,性能,優(yōu)化,；如發(fā)現(xiàn)本文內(nèi)容存在版權問題，煩請?zhí)峁┫嚓P信息告之我們，我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡，涉及言論、版權與本站無關。