この Tensorflow 公式ページ: https://github.com/tensorflow/models/tree/master/official/vision/image_classification#imagenet-prepareに従って、ローカル GPU サーバーの imagenet2012 データセットで resnet50 モデルをトレーニングしたいと思います。 ただし、次のようにトレーニングを開始できるように、imagenet2012 トレーニングおよび検証データセットを正確に準備する方法がわかりません。
python3 classifier_trainer.py \
--mode=train_and_eval \
--model_type=resnet \
--dataset=imagenet \
--model_dir=$MODEL_DIR \
--data_dir=$DATA_DIR ??? \ # ----------> HOW TO CONFIG THIS DIR IF I HAVE DOWNLOADED THE DATA??
--config_file=configs/examples/resnet/imagenet/gpu.yaml \
--params_override='runtime.num_gpus=$NUM_GPUS'
具体的には、次の指示に従って、データセットを 2 つの tar ファイルとしてダウンロードしました。データセットを準備して構成をセットアップするための正確な手順(コマンドライン引数または configs/examples/resnet/imagenet/gpu.yaml での設定)。ILSVRC2012_img_train.tar
ILSVRC2012_img_val.tar
\myPath
PS1、トレーニング スクリプトで使用できるデータセットには 2 つのタイプがあることに気付きました。1) TFDS を使用するもの、 2) TFRecords を使用するものです。ページの下部にあるシェル スクリプトを使用して TFRecords データセットを作成しましたが、設定方法がわかりません。TF では TFDS が推奨されているようですが、トレーニングを正常に実行できる限り、TFRecords 形式で問題ありません。現在、次の形式のトレーニングと検証の TFRecords ファイルが既にあります。
${DATA_DIR}/train/train-00000-of-01024
${DATA_DIR}/train/train-00001-of-01024
...
${DATA_DIR}/train/train-01023-of-01024
${DATA_DIR}/validation/validation-00000-of-00128
S{DATA_DIR}/validation/validation-00001-of-00128
...
${DATA_DIR}/validation/validation-00127-of-00128
PS2: TF コミュニティが、私のような初心者のために imagenet データセットを準備するための明確なステップ バイ ステップ ガイドを提供してくれることを願っています。それは感謝されます!