問題タブ [allennlp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
allennlp - AllenNLP 設定でモデル/重みのシリアル化を完全に無効にする方法は?
構成ファイルを使用して、標準の AllenNLP モデル トレーニングですべてのモデル/状態の重みのシリアル化を無効にしたいと考えていjsonnet
ます。
その理由は、Optuna を使用してハイパーパラメータの自動最適化を実行しているためです。数十のモデルをテストすると、ドライブがすぐにいっぱいになります。num_serialized_models_to_keep
に設定して、チェックポインターを既に無効にしています0
。
中間メトリクスなどのロギングに関するデフォルトの動作が必要なため、に設定serialization_dir
したくありません。デフォルトのモデル状態、トレーニング状態、最適なモデルの重みの書き込みNone
を無効にしたいだけです。
上記で設定したオプション以外に、モデルの重みのすべてのシリアル化を無効にするデフォルトのトレーナーまたはチェックポインター オプションはありますか? API ドキュメントと Web ページを確認しましたが、何も見つかりませんでした。
そのようなオプションの機能を自分で定義する必要がある場合、AllenNLP のどの基本関数を Model サブクラスでオーバーライドする必要がありますか?
または、トレーニングが終了したときに中間モデル状態をクリーンアップするためのユーティリティはありますか?
編集: @petew の回答は、カスタム チェックポインターの解決策を示していますが、このコードを私のユースケースで見つけられるようにする方法が明確ではありませんallennlp train
。
以下のように、設定ファイルから custom_checkpointer を呼び出せるようにしたいと思います。
を呼び出すときにチェックポインターをロードするベストプラクティスは何allennlp train --include-package <$my_package>
ですか?
my_package/models
s やなどのサブディレクトリにサブモジュールを含む my_package がありmy_package/training
ます。カスタム チェックポインター コードを に配置したいmy_package/training/custom_checkpointer.py
私のメイン モデルは にありmy_package/models/main_model.py
ます。カスタム チェックポインターを使用するには、main_model クラスのコード/関数を編集またはインポートする必要がありますか?
python-3.x - RNLanguageModel の forward メソッドの役割は何ですか?
AllenNlp フレームワークを使用した文字ベースのニューラル ネットワークに関するチュートリアルを読んでいます。目標は、文を完成できるモデルを構築することです。その後、モデルをトレーニングしたいインスタンスを構築するステップがあります。私は以下のコードを持っています、私は転送機能の役割を理解できませんでした、誰でも助けることができますか? 誰かが例を提供できますか