問題タブ [vgg-net]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
637 参照

machine-learning - Torch でトレーニングされた VGG 顔を使用する

トーチを使用してトレーニング済みの VGG を介して、システム内の既存のイメージを渡す方法はありますか? Ubuntu 14.04 を使用していますが、残念ながら GPU がありません。かなり広範囲に検索しましたが、見つけたものはすべて GPU を必要とします。トーチなしで VGG を使用する他の方法はありますか? 私は提案を受け入れますが、この方法は GPU を必要としません。

0 投票する
1 に答える
338 参照

machine-learning - 特定の形式での VGG 特徴抽出

このレポを機能させようとしています。私は指示に従い、このスクリプトを使用してサンプルデータを取得しました (同じリポジトリから取得):

次のステップで、彼らは私がする必要があると言ったsample video frames and extract VGG features for the frames. これを行う方法が正確にはわかりません。Caffeの指示に従いましたが、機能が同じ形式ではありません。

では、VGG 機能を と同じ形式で抽出するにはどうすればよいyt_allframes_vgg_fc7_val.txtですか?

0 投票する
1 に答える
447 参照

python - Keras トレーニング済み VGG エラー

これに従って、事前トレーニング済みの VGG モデルを読み込んで実行しました。ただし、隠しレイヤーから機能マップを抽出しようとしており、ここの「任意の機能マップの抽出」セクションから結果を複製しようとしていました。私のコードは次のとおりです。

ただし、次のエラーが発生していました。

どうすればこれを修正できますか?

0 投票する
2 に答える
2614 参照

python - Keras VGG 抽出機能

事前トレーニング済みの VGG 顔 CNN を読み込んで、正常に実行しました。レイヤー 3 と 8 からハイパー列平均を抽出したいと思います。ここからハイパー列の抽出に関するセクションに従っていました。ただし、get_output 関数が機能していなかったため、いくつかの変更を加える必要がありました。

輸入品:

主な機能:

Get features function:(私はこれに従いました)

ハイパーカラム抽出:

ただし、コードを実行すると、次のエラーが発生します。

どうすればこれを修正できますか?

ノート:

ハイパー列抽出関数で、feature_maps = get_features(model,1,instance)1 の代わりに任意の整数を使用すると、正常に動作します。しかし、レイヤー3から8までの平均を抽出したい.

0 投票する
3 に答える
683 参照

tensorflow - vggモデルを実行するための画像スケーリング操作について

VGG モデルの Tensorflow 実装を読んでいるときに、著者が入力 RGB 画像に対して次のようなスケーリング操作を実行していることに気付きました。質問が 2 つVGG_MEAN あります。意味と、その設定を取得する方法を教えてください。第二に、これらの平均値を減算して取得する必要がある理由bgr

0 投票する
2 に答える
2336 参照

tensorflow - VGG の各層にはいくつのニューロンが入っていますか?

各層に入っているニューロンの数を教えてください。これにより、VGG で何が起こっているかについての理解が深まると思います。

ここでこのコードを使用して、具体的なものを用意しましょう。

https://github.com/machrisaa/tensorflow-vgg/blob/master/vgg19.py#L46

この行では、224x224x3 (画像) が入力されているのがわかります。コードの各行 (各行はレイヤーを表します) の後、この画像の寸法はどうなりますか?

ありがとうございました。

0 投票する
2 に答える
1247 参照

neural-network - Caffe: vgg ネットワークの可変入力画像サイズ

VGG ネットワークから FC 層ではなく、畳み込み層の特徴を抽出するために caffe を使用しようとしています。この状況では、理論的な入力画像サイズは任意である可能性があります。しかし、VGG ネットワークは 224x224 ピクセルのサイズにトリミングされた画像でトレーニングされたようです。そこで、deploy.prototext で入力データ レイヤーを定義します。

width = 500\height = 500\crop_size = 500 を変更しようとしましたが、失敗しました。Caffe がいくつかのエラーをスローします。形の不一致。ソース パラメータの形状は 1 1 4096 25088 (102760448) です。ターゲット パラメータの形状は 4096 131072 (536870912) です。保存したネットからコピーするのではなく、このレイヤーのパラメーターを最初から学習するには、レイヤーの名前を変更してください。」</p>

入力レイヤーには大きすぎる画像をトリミングせずに実行するにはどうすればよいですか?