|
[ruby-list:42474] Re: 多量の正規表現との効率的なマッチのアイデアを、、: msg#00128lang.ruby.japanese
伊藤T51です >多分、2、3ケ月のうちに処理するデータが 1G位になりそうなので、、、 馬鹿サーチを退治しないとダメですね。 fgrep的パターンマッチの最適化とか 検索語 Aho-Corasick fgrep (C++ boost::spirit(パーサー生成)には シンボルテーブルのマッチ(3分木 で実装)がある。Rubyにもパーサージェネレータあるはず。) あるいは、インクリメンタルにグループIDを付与しておくにしないと。 照合の順位は、実は「最長マッチ」で代用できませんか。
|
|
| <Prev in Thread] | Current Thread | [Next in Thread> |
|---|---|---|
| Previous by Date: | [ruby-list:42473] Re: 多量の正規表現との効率的なマッチのアイデアを、、, rubikitch |
|---|---|
| Next by Date: | [ruby-list:42475] String#first, String#last, Kouhei Yanagita |
| Previous by Thread: | [ruby-list:42473] Re: 多量の正規表現との効率的なマッチのアイデアを、、, rubikitch |
| Next by Thread: | [ruby-list:42493] Re: 多量の正規表現との効率的なマッチのアイデアを、、, しん |
| Indexes: | [Date] [Thread] [Top] [All Lists] |
| News | FAQ | advertise |