問題タブ [resuming-training]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

31 問題

0 投票する

1 に答える

529 参照

python - 固定回数の反復後にトレーニングするときに、YOLOv5 で重みをバックアップする方法はありますか?

YOLOv5のトレーニング中にウェイトをバックアップしたいので、何らかの理由でトレーニングが停止した場合、yolov3のように最初からやり直す必要がないように、100回の反復ごとにウェイトがバックアップされるフォルダーを指定できます

2020-07-01T12:53:27.590

0 投票する

1 に答える

119 参照

tensorflow - DeblurGAN は自分の重みをロードできなくなりました

ねえ、私は本当に助けが必要です =)

最初に、とても長くて申し訳ありません^^ 最後に完全なコードが必要ないことを願っています。

ブレ除去のためにGANをコーディングしました。今、私はそれを訓練しています。最初の 71 エポックは問題なくトレーニングされました。colab GPU の時間制限に達するまでいくつかのエポックをトレーニングし、翌日、重みを gan にロードしてトレーニングを続けました。2、3 週間前、エポック 71 の重みを Gan にロードしたかったのですが、次のエラーが表示されました (コードを何も変更していないことは確かです)。この瞬間から、最初の 65 の重みしかロードできず、65 を超えるすべてのエポックで同じエラーが発生します。

私は解決策を長い間探していましたが、本当の解決策は見つかりませんでした。しかし、後で古い重み (1-65) の 1 つで 1 つのエポックをトレーニングすると、新しい重みの 1 つをロードできることがわかりました。したがって、この「回避策」を使用できると思いましたが、昨日、エポックごとにテストデータセットのメトリックのスコアをプロットしました。この写真を受け取りました: psnrscore/epoch ご覧のとおり、エポック 65 以降にゴミを生成しているように見えます (60 以降の写真では、最初の 5 エポックを失ったため、6 から始まります)

私は本当にイライラしていて、誰かが私を助けてくれることを願っています = D

GAN の完全なコードは次のとおりです。

tensorflow keras deep-learning generative-adversarial-network resuming-training

2020-08-19T08:37:11.230

0 投票する

0 に答える

52 参照

python - 事前トレーニング済みの tensorflow オブジェクト検出 API モデルの 1 つのクラスを改善する

事前トレーニング済みの tf オブジェクト検出 API モデル ( ) で phone モバイルクラスを改善しようとしていましたefficientdet_d0_coco17_tpu-32。

トレーニングデータを収集し、次のようなtfrecords場所を作成しました。label_map.pbtext

pipeline.configを次のように更新しました。

新しいモデルを推論しようとしているときにトレーニングした後、常に1 asを取得していdetection_classesます。

私が間違っていることは何ですか？または継続学習はここでは不可能ですか?

python tensorflow object-detection-api tensorflow-model-garden resuming-training

2021-01-15T10:55:01.107

0 投票する

1 に答える

143 参照

yolo - Yolov3 トレーニングを再開するには？

私は深層学習が初めてで、カスタムデータでトレーニングしている yolov3 モデルを持っています。トレーニングするたびに、トレーニングはゼロから始まるようです。モデルが前回停止した場所からトレーニングを継続するにはどうすればよいですか? 私が持っている設定は、このレポと同じです。

yolo resuming-training

2021-03-28T20:12:39.597

0 投票する

2 に答える

480 参照

object-detection-api - 保存されたチェックポイントからトレーニングを再開する際の TF2 オブジェクト検出 API の問題

一晩で発生したと思われる TF2 オブジェクト検出 API の問題に直面しています。保存したチェックポイントからトレーニングを再開しようとしていますが、いつものように、トレーニングを再開する前に構成ファイルのパスをチェックポイントのある場所に変更します。これは常に機能しています。

今日、このエラーが発生しています (以下を参照)。何らかの理由で、チェックポイントディレクトリとモデルディレクトリを同じにすることはできません。さて、大きな問題は、モデルディレクトリを変更すると、トレーニングが最後のエポックからではなくゼロから再開されることです。これはTF2でのみ発生します。TF1でも試してみましたが、正常に動作します。

ファイル "/usr/local/lib/python3.7/dist-packages/object_detection/utils/variables_helper.py"、230 行目、insure_checkpoint_supported (' Model_dir を別のパスに設定してください。'))) RuntimeError: Checkpoint dir ( /content/drive/MyDrive/Object_detection/training) と model_dir (/content/drive/MyDrive/Object_detection/training) を同じにすることはできません。model_dir を別のパスに設定してください。

object-detection-api tensorflow2 resuming-training

2021-05-07T11:26:53.643

1 2 3 4 5 6 7 8 9 10

問題タブ [resuming-training]

python - 固定回数の反復後にトレーニングするときに、YOLOv5 で重みをバックアップする方法はありますか?

tensorflow - DeblurGAN は自分の重みをロードできなくなりました

python - 事前トレーニング済みの tensorflow オブジェクト検出 API モデルの 1 つのクラスを改善する

yolo - Yolov3 トレーニングを再開するには？

object-detection-api - 保存されたチェックポイントからトレーニングを再開する際の TF2 オブジェクト検出 API の問題

Reference