python - データセットの選択とバッチ処理を可能にするために tf.data パイプラインをどのように使用しますか?

翻译自：https://stackoverflow.com/questions/47100998 2017-11-03T17:05:24.987

224 次

tf.data 入力パイプラインを使用して、データのバッチ処理中に実行時にデータセットを選択できるようにしようとしています。以下により、InitTrain/InitTest を実行して、使用するデータセットを選択できるようになります。

TrainData = tf.data.Dataset.from_generator(TrainGenerator,tf.float32)
TestData = tf.data.Dataset.from_generator(TestGenerator,tf.float32)

DataIterator = tf.data.Iterator.from_structure(tf.float32)
DataNext = DataIterator.get_next()
InitTrain = DataIterator.make_initializer(TrainData)
InitTest = DataIterator.make_initializer(TestData)

イテレータを使用しない場合は、次を使用してパディングされたバッチを取得できます。

TrainData.padded_batch(1000,someshape)

入力データソースを選択する機能を保持しながら、データをバッチ処理するにはどうすればよいですか?

考えられる回避策は、新しい from_generator データセットを作成し、DataNext で sess.run を呼び出すジェネレーターを作成して、バッチ処理できるデータセットを作成することですが、これにより run 呼び出しが割り当てられるため、これが意図された方法であるとは思えません利用される。

python - データセットの選択とバッチ処理を可能にするために tf.data パイプラインをどのように使用しますか?

1 に答える 1

Related

Reference