3

AI アプリケーション用のトレーニング済みデータセットを使用するモジュールをパッケージ化するために setuptools を使用しています。特に、nltk データ ファイルvader_lexicon.txtで見つかったものを使用しています。

pip から nltk をインストールする場合、データセットは自動的にダウンロードされません。特定のデータセットを取得するには、コマンドラインまたは Python インタープリターからコマンドを手動で実行する必要があります。すべてのデータセットを含めると数百メガバイトになるため、彼らがこれを行ったと思われます。

setuptools のドキュメントから、データ ファイルを含める方法は を使用するMANIFEST.inように見えますが、この場合、ソース配布にデータ ファイルを含める必要があるようです。

遠隔地からのデータを含める方法はありますか?

4

0 に答える 0