Flickrが写真のクラスタリングと人気ランキングに対応

Flickrがタグによるクラスタリングとinterestingnessと呼ばれる人気写真ランキング機能を実装したようです。
The New New Things -FlickrBlog-

interestingnessは、ある写真がどの程度お気に入りに入れられたか、その写真投稿者とコメントの関係等を考慮してランキングしてあるとのこと。ExploreからSelect monthしてカレンダー画面に遷移後、日付をクリックすると、その日のinterestingnessがみれます。確かにこれはすごい。Flickrはもともと綺麗・プロっぽい写真が多い感じでしたが、interestingnessは特にそう感じられます。まさにinterestingness。

もう一つの、僕が個人的にも気になるクラスタリングのほうもすばらしく、夏・花・自然夏・海・休暇クラスタを比較するとかなりの精度でクラスタリングされているのが分かります。アルゴリズムとして何を使っているのかはわかりませんが、Flickrの持っているタグ情報はかなりのものでしょうから、いずれの方法にしてもかなりCPUパワーを食うはず。

アル厨も、当初は最短距離法でクラスタリングする方向で実装していたんですが、実験段階で1台のマシンだけで正当法で処理するのは負荷が高いと判断して、簡単な文字列比較方式にした経緯もあります。

どの程度の頻度、マシン・ソフトウェア構成、クラスタリングアルゴリズムで処理が行われているのかが気になります。