問題タブ [resuming-training]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 固定回数の反復後にトレーニングするときに、YOLOv5 で重みをバックアップする方法はありますか?
YOLOv5のトレーニング中にウェイトをバックアップしたいので、何らかの理由でトレーニングが停止した場合、yolov3のように最初からやり直す必要がないように、100回の反復ごとにウェイトがバックアップされるフォルダーを指定できます
tensorflow - DeblurGAN は自分の重みをロードできなくなりました
ねえ、私は本当に助けが必要です =)
最初に、とても長くて申し訳ありません^^ 最後に完全なコードが必要ないことを願っています。
ブレ除去のためにGANをコーディングしました。今、私はそれを訓練しています。最初の 71 エポックは問題なくトレーニングされました。colab GPU の時間制限に達するまでいくつかのエポックをトレーニングし、翌日、重みを gan にロードしてトレーニングを続けました。2、3 週間前、エポック 71 の重みを Gan にロードしたかったのですが、次のエラーが表示されました (コードを何も変更していないことは確かです)。この瞬間から、最初の 65 の重みしかロードできず、65 を超えるすべてのエポックで同じエラーが発生します。
私は解決策を長い間探していましたが、本当の解決策は見つかりませんでした。しかし、後で古い重み (1-65) の 1 つで 1 つのエポックをトレーニングすると、新しい重みの 1 つをロードできることがわかりました。したがって、この「回避策」を使用できると思いましたが、昨日、エポックごとにテスト データセットのメトリックのスコアをプロットしました。この写真を受け取りました: psnrscore/epoch ご覧のとおり 、エポック 65 以降にゴミを生成しているように見えます (60 以降の写真では、最初の 5 エポックを失ったため、6 から始まります)
私は本当にイライラしていて、誰かが私を助けてくれることを願っています = D
GAN の完全なコードは次のとおりです。
python - 事前トレーニング済みの tensorflow オブジェクト検出 API モデルの 1 つのクラスを改善する
事前トレーニング済みの tf オブジェクト検出 API モデル ( ) で phone モバイル クラスを改善しようとしていましたefficientdet_d0_coco17_tpu-32
。
トレーニング データを収集し、次のようなtfrecords
場所を作成しました。label_map.pbtext
pipeline.config
を次のように更新しました。
新しいモデルを推論しようとしているときにトレーニングした後、常に1 asを取得していdetection_classes
ます。
私が間違っていることは何ですか?または継続学習はここでは不可能ですか?
yolo - Yolov3 トレーニングを再開するには?
私は深層学習が初めてで、カスタム データでトレーニングしている yolov3 モデルを持っています。トレーニングするたびに、トレーニングはゼロから始まるようです。モデルが前回停止した場所からトレーニングを継続するにはどうすればよいですか? 私が持っている設定は、このレポと同じです。
object-detection-api - 保存されたチェックポイントからトレーニングを再開する際の TF2 オブジェクト検出 API の問題
一晩で発生したと思われる TF2 オブジェクト検出 API の問題に直面しています。保存したチェックポイントからトレーニングを再開しようとしていますが、いつものように、トレーニングを再開する前に構成ファイルのパスをチェックポイントのある場所に変更します。これは常に機能しています。
今日、このエラーが発生しています (以下を参照)。何らかの理由で、チェックポイント ディレクトリとモデル ディレクトリを同じにすることはできません。さて、大きな問題は、モデルディレクトリを変更すると、トレーニングが最後のエポックからではなくゼロから再開されることです。これはTF2でのみ発生します。TF1でも試してみましたが、正常に動作します。
ファイル "/usr/local/lib/python3.7/dist-packages/object_detection/utils/variables_helper.py"、230 行目、insure_checkpoint_supported (' Model_dir を別のパスに設定してください。'))) RuntimeError: Checkpoint dir ( /content/drive/MyDrive/Object_detection/training) と model_dir (/content/drive/MyDrive/Object_detection/training) を同じにすることはできません。model_dir を別のパスに設定してください。