問題タブ [question-answering]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - コンテキスト内の複数の回答範囲、BERT 質問回答
BERT
線形レイヤーとその上のレイヤーで事前トレーニングされた質問応答システムを作成していsoftmax
ます。ネットで入手可能なテンプレートに従うと、通常、1 つの例のラベルは 1answer_start_index
と 1だけで構成されanswer_end_index
ます。たとえば、オブジェクトHuggingface
をインスタンス化するときから:SQUADFeatures
しかし、私自身のデータセットでは、回答語がコンテキスト内の複数の場所で見つかった例があります。つまり、回答を構成する正しいスパンがいくつかある可能性があります。
私の問題は、そのような例を管理する方法がわからないことですか? ネット ラベルで利用可能なテンプレートは、通常、次のように一覧表示されます。
- [start_example1, start_example2, start_example3]
- [end_example1, end_example2, end_example3]
私の場合、これは次のようになります。
- [start_example1, [start_example2_1, start_example2_2], start_example3]
- もちろん最後も同じ
言い換えれば、例ごとに 1 つのラベルを含むリストはありませんが、例として単一ラベルまたは「ラベル」のリスト、つまりリストで構成されるリストのいずれかを含むリストがあります。
他のテンプレートに従う場合、プロセスの次のステップは次のとおりです。
ただし、これはもちろん (?) 私の span_start リストと span_end リストには単一項目だけが含まれているのではなく、リスト内のリストが含まれている場合があるため、エラーが発生します。
この問題にどのように取り組むことができるかについて誰にも考えがありますか? コンテキストに存在する回答を構成するスパンが 1 つしかない例のみを使用する必要がありますか?
torch-error を回避した場合、損失の逆伝播 / 評価 / 計算は引き続き機能しますか?
ありがとう!/B
web - カスタム質問調査を Web に追加する方法
Wix を使用している調査用に Web のカスタム アンケートを追加したいのですが、何か具体的な方法を提案できますか?回答用の電子メールを追加するための画面が表示されます。答えは、間違った答えの数が 22 で除算され、100 で乗算されるように機能するはずです。間違った答えは 4=> 4/22=ans => Ans*100=Answer です。この最後の答えは、ユーザーのスコアです。これを追加するにはどうすればよいですか?私のwixまたは他のフォームビルダーに、このカスタムスコアを追加します.
python - 質問応答のためにBERTを微調整するときの精度が低い
質問応答用に CamemBERT (Roberta のフランス語版) を微調整しようとしています。
最初に、CamemBERTモデルを使用して、質問とテキストの入力埋め込みを生成し、出力線形レイヤーを使用して、回答の開始と終了に対応する開始ロジットと終了ロジットを出力します。
論文の公式結果では、質問応答のパフォーマンスは(88%, 77%)の(F1 スコア, EM)ですが、私が得た結果は(71%, 46%)です。
私の質問は、なぜ結果が十分に近くないのですか?
これは、公式モデルと同じハイパーパラメーターを使用して、FQuAD データセットでモデルをトレーニングおよび評価するために使用しているスクリプトの一部です。
nlp - NLP : QuestionAnsweringPipeline から 5 つの最適な候補を取得します。
私は、huggingface トランスフォーマー ライブラリを使用して、フランス語の質問応答モデルに取り組んでいます。RoBERTaに非常に似ていますが、フランス語に適応した事前トレーニング済みのCamemBERTモデルを使用しています。
現在、トランスフォーマー ライブラリの QuestionAnsweringPipeline を使用して、自分のテキストに関する質問の最良の回答候補を取得できます。
これが私のコードの抜粋です。
私は現在これを取得しています : {'score': 0.9630325870663725, 'start': 2421, 'end': 2424, 'answer': '{21'}
、これは間違っています。
ということで、ベスト5の回答候補を挙げたいと思います。誰もそれを行う方法を知っていますか?