問題タブ [gpt]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
26 参照

nlp - EncoderDecoderModel の Laverage 事前学習済み GPT

GPT の注意が Masked Multihead Attention であることはわかっています。事前トレーニング済みの GPT モデルがあり、その重みを EncoderDecoderModel のエンコーダーに割り当てたいと考えています。お気に入り:

私はトランスフォーマーと pytorch の初心者です。

0 投票する
0 に答える
130 参照

python - GPT2 チャットボットのシングル インタラクション…属性エラー:「NoneType」オブジェクトに属性「multiprocessing_chunksize」がありません問題:2

GPT2 カスタム チャットボットの相互作用の問題

GPT2 カスタム チャットボットのシングル インタラクション。この実装ではスレッドを使用していませんが、「multiprocessing_chunksize」と表示されています。ここでは、gpt2 を使用してチャットボットを構築し、カスタムの日付セット (タイプ: ペルソナ) によってトレーニングされたカスタム モデルと対話しようとします。

0 投票する
1 に答える
120 参照

python - Pythonで.mdlファイルをロードするには?

チャットボット用に、カスタム データセット、特にEmpatheticDialoguesデータセットを使用して GPT トランスフォーマー モデルを微調整する予定です。リポジトリは、プロジェクトに .mdl ファイルを提供します。これらの .mdl ファイルを ipynb ファイルにロードするにはどうすればよいですか? DialoGPT と呼ばれる GPT トランスフォーマー モデルを微調整するために、.mdl ファイルをロードする必要があるのは正しいですか?

このGoogle Colab Notebookのガイダンスに従って、前述のリポジトリの .csv データセットだけを読み込んでみました。ただし、上記のデータセットでモデルをトレーニングした後にモデルをテストすると、ランダムなシンボルが表示されます。