クラスタリング結果のtreemapによる可視化(が思い通りにならない)
主に自分メモ。更新がないとサボってると思われがち、てのもあるけど。
クラスタリング自体は実験中にしてはうまく出来ていると思っていて、それを可視化するにあたってnewsmapで使われているtreemapアルゴリズムを使ってみているんだけどうまくばらけてくれない。Google Newsを元ネタとして使っているnewsmapの場合はあらかじめカテゴリー(クラスタ)数が決まっているので初期分割数は固定で良いが、アル厨の場合はクラスタ数が未定なのでとりあえずb-treeを作っていくと、特定期間のユニークブックマーク総数に対する重要な(alphaな)ブックマーク数は必ずしも多いとは限らないのでブックマーク数でLR決定すると思い通りの結果とならない罠に陥っている様子。
以下に地味な試験中画面を示す*1。
これかたづくまでCatalyst触っちゃいけない指令を自分に出しているからさっさとかたづけたいんだけどまだ時間かかりそうな感じです。
*1:と書くと論文チックだ。