4

Google の word2vec モデルを研究しています。最大 300 次元のテキスト ワード コーパスのベクトルを生成できました。これは非常に優れたツールであり、ビッグデータでは精度がさらに向上します。

word2vec を使用してグレースケール画像でベクトルを生成する方法はありますか。アプローチは同じだと確信しています。ピクセル強度に基づいてベクトルを生成し、コサイン類似度を計算します。

グレースケール画像の類似距離を計算するモデルを構築しようとしています。word2vec またはテキストで動作するグローブ以外に、これを行うことができるライブラリはありますか?

4

2 に答える 2

4

word2vec が非常に印象的なツールであることに同意しますが、このモデルは記事やニュースの次の単語を予測することによってトレーニングされています。全体として、画像に word2vec を使用するのは意味がないと思います。

skimageを使用して、画像測定を行うことができます。例:スキーイメージ測定

于 2015-06-18T13:36:42.347 に答える
3

Word2vec は画像の良いモデルではありませんが、本当に必要なのはword モデルのバッグだと思います。画像比較の基本的な方法では、画像を重要な点の特徴 (例: SIFT、SURF など) のリストに変換してから、点のクラスターを互いに一致させます (例: FLANN )。

画像内の大量の特徴と各ポイント表現の不確実性により、画像認識に word2vec などの基本的な 1 層ネットワーク学習を使用することが困難になります。このチュートリアルでより良い例を見つけることができます。

3年後の更新:ConvNetsと、ピクセルから視覚的特徴を抽出できる現在利用可能ないくつかの事前トレーニング済みモデルについても言及する必要があります。

于 2015-07-05T00:12:28.963 に答える