2

全て

私はhttp://www.wisdom.weizmann.ac.il/~bagon/CVspring07/files/scalable.pdfで David Nister と Henrik Stewenius の同じアプローチを適用することを探しています。

この論文では、彼らは階層的な k-means クラスタリングへの入力として多数の SIFT ベクトル (128-D) を使用して、階層的なビジュアル語彙ツリーを構築します。

このクラスタリングを行うために使用できる優れたライブラリを知っている人はいますか?

Ps: 入力 SIFT 記述子の数が多く (70,000,000)、結果が 1,000,000 の葉ノードを持つ語彙ツリーになることを望んでいます。

どうもありがとう。よろしく。

4

1 に答える 1

2

データがサポートされている形式の場合、 OpenIMAJのClusterQuantiserツールでこれを実行できるはずです。ツールが箱から出してデータを処理できない場合は、org.openimaj.ml.clustering.kmeans.HierarchicalByteKMeansクラス(svnトランクバージョン)またはorg.openimaj.ml.clustering.kmeans.HByteKMeans1.0.5リリースのクラスのドライバーを作成できます。クラスの両方のバージョンはディスクからのデータのストリーミングをサポートしているため、すべての機能をメモリに保持する必要はありません。

完全を期すために、vlfeatには階層的なk-means実装もありますが、どれだけ拡張できるかはわかりません。

実際の経験から、クラスタリングの前に機能をサンプリングすることも検討してください。それらすべてをクラスタリングすることで多くのメリットが得られるかどうかはわかりません。

于 2012-06-25T22:52:09.327 に答える