image - Caffe - 画像データ/画像ラベルのペアを使用したオートエンコーダーのトレーニング

Question

私はカフェにとても慣れていません。私の仕事は、1 つは神経のグレースケール画像で、もう 1 つは画像に特定の構造が存在するかどうかを示す対応するバイナリマスクである .tif 形式で与えられた画像ペアでオートエンコーダネットをトレーニングすることです。これらは同じ「train」フォルダーにあります。私が達成したいのは、これらの画像を使った有意義な実験です (セグメンテーション、分類、指定されていません)。私の最初の問題は、既存の train.txt がないと画像をネットにフィードする方法がわからないことです。画像を直接使用できますか、または必要な lmdb、hdf5 などの別の形式を使用できますか? どんな提案でも大歓迎です。

score 0 · Accepted Answer

簡単な分類 (alexnet、googlenet、lenet などの既存のもの) で実現できます。これを行うには、バイナリマスクまたはグレースケールイメージとクラス名のみを使用できます。Nvidia Digits は、ペアのデータセットと学習を作成するための優れたグラフィカルツールです。

このリンクを参照してください:

https://developer.nvidia.com/digits

image - Caffe - 画像データ/画像ラベルのペアを使用したオートエンコーダーのトレーニング

1 に答える 1

Related

Reference