logo       

[ruby-list:42498] Re: 多量の正規表現との効率的なマッチのアイデアを、、: msg#00152

lang.ruby.japanese

Subject: [ruby-list:42498] Re: 多量の正規表現との効率的なマッチのアイデアを、、


伊藤T15です
データ量が1GBに近づいたら、また考えればと 思います

入力行のグループ項とURL項の関係がわかると、高効率な方法もあるかも。

1. グループ項 <= f(URL) ならば
URLごとにカウントして 、カウント後、
URLによってグループ項を書き換えして、
同一グループのカウントを合計する。

2.URLとグループの関連が無いなら
二段HASH [URL][(仮)グループ] でカウントし、その後
URLによってグループを書き換え
最後に同一グループでカウントを合計する。

どちらでも、正規表現との比較は、全レコードではなく
異なりURL の数に減少します?。





<Prev in Thread] Current Thread [Next in Thread>
Google Custom Search

News | FAQ | advertise