全て
この論文では、彼らは階層的な k-means クラスタリングへの入力として多数の SIFT ベクトル (128-D) を使用して、階層的なビジュアル語彙ツリーを構築します。
このクラスタリングを行うために使用できる優れたライブラリを知っている人はいますか?
Ps: 入力 SIFT 記述子の数が多く (70,000,000)、結果が 1,000,000 の葉ノードを持つ語彙ツリーになることを望んでいます。
どうもありがとう。よろしく。
全て
この論文では、彼らは階層的な k-means クラスタリングへの入力として多数の SIFT ベクトル (128-D) を使用して、階層的なビジュアル語彙ツリーを構築します。
このクラスタリングを行うために使用できる優れたライブラリを知っている人はいますか?
Ps: 入力 SIFT 記述子の数が多く (70,000,000)、結果が 1,000,000 の葉ノードを持つ語彙ツリーになることを望んでいます。
どうもありがとう。よろしく。
データがサポートされている形式の場合、 OpenIMAJのClusterQuantiserツールでこれを実行できるはずです。ツールが箱から出してデータを処理できない場合は、org.openimaj.ml.clustering.kmeans.HierarchicalByteKMeans
クラス(svnトランクバージョン)またはorg.openimaj.ml.clustering.kmeans.HByteKMeans
1.0.5リリースのクラスのドライバーを作成できます。クラスの両方のバージョンはディスクからのデータのストリーミングをサポートしているため、すべての機能をメモリに保持する必要はありません。
完全を期すために、vlfeatには階層的なk-means実装もありますが、どれだけ拡張できるかはわかりません。
実際の経験から、クラスタリングの前に機能をサンプリングすることも検討してください。それらすべてをクラスタリングすることで多くのメリットが得られるかどうかはわかりません。