同時能夠非常快速精準的處理一系列比較復(fù)雜的字符串的檢索、替換和提取,具有快速匹配文本進行信息抽取的特點。普通字符,非打印字符,通用字符,原子表這些字符組成了正則的基本部分。描述和分析文本內(nèi)容可以適用正則表達式進行文本匹配,一般的文本字符都是可以通過一定的轉(zhuǎn)化為對應(yīng)的正則表達式的形式。
正則表達式雖然描述能力強,但是若要實現(xiàn)匹配功能,還要進行等價轉(zhuǎn)化。復(fù)雜的正則語義邏輯會增加時間和空間的復(fù)雜度,因此,正則表示不太利于大規(guī)模集合的構(gòu)造和高速的數(shù)據(jù)流匹配。
本文地址:http://knowyourextract.com//article/28160.html