9

インターネットに接続できない SUSE Linux ボックスで nltk を実行しようとしています。

nltk を正常にインストールして実行しましたが、送信すると

>>> tagged = nltk.pos_tag(tokens)

次のエラーが表示されます。

LookupError:
**************************************************** **********************
リソース 'tokenizers/punkt/english.pickle' が見つかりません。リソースを取得するには、NLTK Downloader を使用してください。

ボックスをインターネットに接続できないため、ダウンローダーを使用できません。

必要なパッケージをインストールする方法はありますか?

4

3 に答える 3

4

ディレクトリにデータがダウンロードされますnltk_data。その場所はシステムによって異なりますが、次の手順で確認できます。

import nltk
print nltk.data.find('.')

english.pickleのサブフォルダーにある必要があります<nltk_data>/taggers/。そこに配置する最も簡単な方法は、インターネットにアクセスできるマシンでダウンローダーを使用し、それをコピーして同じサブフォルダーに配置することです。のバージョンは 1 つだけenglish.pickleで、Windows ボックスにダウンロードできます。問題ありません。

于 2012-07-20T19:14:41.157 に答える
2

ダウンローダーは、ファイルを特定のフォルダーに保存します。オンライン マシンにダウンロードして、オフライン マシンの同等の場所にファイルをコピーすることは可能だと思います。私のマシンでは、にダウンロードされ/usr/local/lib/nltk_dataます。

于 2012-07-19T09:07:30.727 に答える