0

私はカフェにとても慣れていません。私の仕事は、1 つは神経のグレースケール画像で、もう 1 つは画像に特定の構造が存在するかどうかを示す対応するバイナリ マスクである .tif 形式で与えられた画像ペアでオートエンコーダ ネットをトレーニングすることです。これらは同じ「train」フォルダーにあります。私が達成したいのは、これらの画像を使った有意義な実験です (セグメンテーション、分類、指定されていません)。私の最初の問題は、既存の train.txt がないと画像をネットにフィードする方法がわからないことです。画像を直接使用できますか、または必要な lmdb、hdf5 などの別の形式を使用できますか? どんな提案でも大歓迎です。

4

1 に答える 1

0

簡単な分類 (alexnet、googlenet、lenet などの既存のもの) で実現できます。これを行うには、バイナリ マスクまたはグレー スケール イメージとクラス名のみを使用できます。Nvidia Digits は、ペアのデータセットと学習を作成するための優れたグラフィカル ツールです。

このリンクを参照してください:

https://developer.nvidia.com/digits

于 2016-09-04T10:15:06.197 に答える