46

TensorFlow は初めてです。自分の画像データセットをトレーニングできる画像認識のヘルプを探しています。

新しいデータセットをトレーニングする例はありますか?

4

4 に答える 4

94

TensorFlow に独自のデータを入力する方法に興味がある場合は、このチュートリアルをご覧ください。
また、スタンフォード大学での CS230 のベスト プラクティスを記載したガイドもここに書いています。


新しい回答 ( tf.data) とラベル付き

tf.datainの導入により、r1.4プレースホルダーやキューなしで画像のバッチを作成できます。手順は次のとおりです。

  1. 画像のファイル名と対応するラベルのリストを含むリストを作成します
  2. tf.data.Datasetこれらのファイル名とラベルの読み取りを作成します
  3. データの前処理
  4. tf.data.Dataset次のバッチを生成するイテレータを作成します

コードは次のとおりです。

# step 1
filenames = tf.constant(['im_01.jpg', 'im_02.jpg', 'im_03.jpg', 'im_04.jpg'])
labels = tf.constant([0, 1, 0, 1])

# step 2: create a dataset returning slices of `filenames`
dataset = tf.data.Dataset.from_tensor_slices((filenames, labels))

# step 3: parse every image in the dataset using `map`
def _parse_function(filename, label):
    image_string = tf.read_file(filename)
    image_decoded = tf.image.decode_jpeg(image_string, channels=3)
    image = tf.cast(image_decoded, tf.float32)
    return image, label

dataset = dataset.map(_parse_function)
dataset = dataset.batch(2)

# step 4: create iterator and final input tensor
iterator = dataset.make_one_shot_iterator()
images, labels = iterator.get_next()

sess.run([images, labels])これで、プレースホルダーを介してデータをフィードせずに直接実行できます。


古い回答 (TensorFlow キューを使用)

要約すると、複数のステップがあります。

  1. ファイル名のリストを作成します (例: 画像へのパス)
  2. TensorFlowファイル名キューを作成する
  3. 各画像を読み取ってデコードし、固定サイズにサイズ変更します (バッチ処理に必要)
  4. これらの画像のバッチを出力します

最も単純なコードは次のようになります。

# step 1
filenames = ['im_01.jpg', 'im_02.jpg', 'im_03.jpg', 'im_04.jpg']

# step 2
filename_queue = tf.train.string_input_producer(filenames)

# step 3: read, decode and resize images
reader = tf.WholeFileReader()
filename, content = reader.read(filename_queue)
image = tf.image.decode_jpeg(content, channels=3)
image = tf.cast(image, tf.float32)
resized_image = tf.image.resize_images(image, [224, 224])

# step 4: Batching
image_batch = tf.train.batch([resized_image], batch_size=8)
于 2016-05-20T09:58:39.873 に答える