問題タブ [allennlp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
gradient-descent - allennlp.predictors.predictor.get_gradients でエラー RuntimeError: Expected object of backend CUDA but got backend CPU for argument #3 'index' が発生しました
インスタンスの勾配を取得するために allennlp.predictors.Predictor.get_gradients を使用しようとしました。
allennlp==0.8.5
メインコード:
しかし、次のエラーが発生しました。
ただし、次のコードで Predictor.predict_instance テストに合格できます
allennlp - allennlp を使用したパイプライン モデルの構築
私は allennlp を初めて使用し、allennlp でモデルを構築する標準的な方法に完全に適合しないモデルの構築に苦労しています。
NLP を使用してパイプライン モデルを構築したいと考えています。パイプラインは基本的に 2 つのモデルで構成されています。それらを A と B と呼びましょう。最初の A はトレーニングされ、完全なトレーニング A の予測に基づいて、B は後でトレーニングされます。
私が見たのは、人々が 2 つの別々のモデルを定義しallennlp train ...
、次のようなシェル スクリプトでコマンド ライン インターフェイスを使用して両方をトレーニングすることです。
私はそれについて2つの懸念があります:
- このコードはデバッグが難しい
- あまり柔軟ではありません。完全にトレーニングされたモデルのフォワード パスを実行したい場合は、それを実行するスクリプトを bash する別のスクリプトを作成しました。
より良い方法でそれを行う方法についてのアイデアはありますか?
allennlp.commands.main(..)
シェルスクリプトの代わりにPythonスクリプトを使用して直接呼び出すことを考えました。そうすることで、少なくとも、デバッガーを使用して実行できる共同の python モジュールが得られます。