logo       

[ruby-list:42474] Re: 多量の正規表現との効率的なマッチのアイデアを、、: msg#00128

lang.ruby.japanese

Subject: [ruby-list:42474] Re: 多量の正規表現との効率的なマッチのアイデアを、、


伊藤T51です

>多分、2、3ケ月のうちに処理するデータが 1G位になりそうなので、、、

馬鹿サーチを退治しないとダメですね。
fgrep的パターンマッチの最適化とか
検索語 Aho-Corasick fgrep
(C++ boost::spirit(パーサー生成)には シンボルテーブルのマッチ(3分木
で実装)がある。Rubyにもパーサージェネレータあるはず。)
あるいは、インクリメンタルにグループIDを付与しておくにしないと。

照合の順位は、実は「最長マッチ」で代用できませんか。





<Prev in Thread] Current Thread [Next in Thread>
Google Custom Search

News | FAQ | advertise