問題タブ [question-answering]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - (TF-IDF)コサイン類似度計算後、5つの関連記事を返す方法
データフレームsample_df (4 列: paper_id、title、abstract、body_text ) を取得します。アブストラクト カラム (アブストラクトごとに ~ 1000 ワード) を抽出し、テキスト クリーニング プロセスを適用しました。これが私の質問です:
私の目標は tf -idf 質問応答を行うことであるため、質問と要約の間のコサイン類似度の計算が終了したら、対応する情報 ( paper_id、title、body_text など) を含む上位 5 つの記事スコアを返すにはどうすればよいでしょうか。
私の英語が下手で、nlp を初めて使用したことを本当に申し訳ありません。誰かが助けてくれれば幸いです。
maxlength - AllenNLP 質問応答のパッセージの長さ制限
私は AllenNLP を初めて使用し、現在、事前トレーニング済みの質問応答モデルを使用しています。性能を確保するための通路の長さの制限があるのだろうか?BERT の最大長は 512 で、それより長いパッセージは切り捨てられることはわかっています。
AllenNLP で長いパッセージを試してみましたが、うまくいっているようですが、確認したいだけです。ありがとうございました。