logo       

[ruby-list:42457] Re: 多量の正規表現との効率的なマッチのアイデアを、、: msg#00111

lang.ruby.japanese

Subject: [ruby-list:42457] Re: 多量の正規表現との効率的なマッチのアイデアを、、


伊藤T15です

固定文字列のように見えますが

1.fgrep で対象データを●濃縮●
ヒットした側は10%になり処理量減少
-v, --invert-match
結果を反転し、マッチしなかった行を選択します。もあります

以下DB風の操作
2.ヒットした側の ..単語をそれぞれHASH値に
して列挙、レコード列に追加
3.正規表現もHASH値にして比較
4.一致したら、文字列レベルの比較で確認。

語の比較順があるので一括処理困難
URL逆順化してSORT、最長一致なら簡単ですが。





<Prev in Thread] Current Thread [Next in Thread>
Google Custom Search

News | FAQ | advertise