問題タブ [gpt-2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - 翻訳タスクのGPT2トレーニングでバッチサイズを増やす方法は?
機械翻訳タスクに事前トレーニング済みのGPT2モデルを使用するコードを開発しています。データの word-to-id の長さは 91 で、モデル用に次のコードを開発しました。
このコードは、バッチ サイズが 1 の場合にうまく機能しますが、非常に遅いです。バッチ サイズを 1 から 32 に増やしたかったのですが、ディメンションの互換性の問題が発生します。エラーなしでバッチサイズを増やすにはどうすればよいですか?
私のデータは文のペアで構成されています。最初の文は第 1 言語の文で、第 2 文はその第 2 言語への翻訳です。
たとえば、x.shape が (batch_size, 12) であると仮定します (つまり、入力として長さ 12 の 'batch_size' 文があり、y.shape も (batch_size, 12) (翻訳) です)。長さ 90 の to-id ディクショナリで、センテンス内の各単語とそのインデックスに一致します)
artificial-intelligence - GPT-2 言語モデルを使用したテキスト補完では、どのようにして完全な URL を生成できますか?
この自動テキスト補完は、Fabrice Bellard 氏の Web サイトで見つけました。それから私は写真のように尋ねます:
だから私の質問は次のとおりです:応答テキストはランダムに生成されますか、それとも入力したテキストによって何らかの形で制御されますか? また、(私がアクセスできない) Web ページへのリンクを生成するにはどうすればよいでしょうか?
私は AI とニュートラル ネットワーク (およびそのようなもの) に慣れていないので、これがばかげた質問である場合はご容赦ください (非常に興味があるため)。