18

Python で記述されたNLTK - Natural Language Toolkitを学習しようとしています。サンプル データ セットをインストールしていくつかの例を実行したいと考えています。

私の Web 接続はプロキシ サーバーを使用しており、次のようにプロキシ アドレスを指定しようとしています。

>>> nltk.set_proxy('http://proxy.example.com:3128' ('USERNAME', 'PASSWORD'))
>>> nltk.download()

しかし、私はエラーが発生します:

Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'str' object is not callable

ProxyBasicAuthHandlerを呼び出す前にをセットアップすることにしましたnltk.download()

import urllib2

auth_handler = urllib2.ProxyBasicAuthHandler(urllib2.HTTPPasswordMgrWithDefaultRealm())
auth_handler.add_password(realm=None, uri='http://proxy.example.com:3128/', user='USERNAME', passwd='PASSWORD')
opener = urllib2.build_opener(auth_handler)
urllib2.install_opener(opener)

import nltk
nltk.download()

しかし今、私は得るHTTP Error 407 - Proxy Autentification Required

ドキュメントによると、プロキシが に設定されている場合、Noneこの関数はシステム プロキシを検出しようとします。しかし、それは機能していません。

NLTK のサンプル データ セットをインストールするにはどうすればよいですか?

4

9 に答える 9

6

上記のオプションは私にはうまくいきませんでした。これが私のWindows環境で私のために働いたものです。丸括弧を外してみてください。それは今動作します!

nltk.set_proxy('http://proxy.example.com:3128', 'USERNAME', 'PASSWORD')
于 2014-10-17T16:37:05.327 に答える
2

Windows環境でNLTK 3.0とpython 3.4を実行しています..ブランチを削除するとプロキシ認証がうまく動作します..このスクリプトを使用します

nltk.set_proxy('http://proxy.example.com:3128', 'username', 'password')
于 2014-11-27T05:16:47.217 に答える
2

NLTK Corpus を手動でインストールする場合。

1) http://www.nltk.org/nltk_data/にアクセスして、目的の NLTK コーパス ファイルをダウンロードします。

2) Python シェルで次の値を確認します。nltk.data.path

corpora3) マシンに存在するパスの 1 つを選択し、データ ファイルを内部のサブ ディレクトリに解凍します。

4) データをインポートできるようになりましたfrom nltk.corpos import stopwords

参考:https ://medium.com/@satorulogic/how-to-manually-download-a-nltk-corpus-f01569861da9

于 2017-05-01T14:02:11.577 に答える
1

また、適切な環境変数を変更して、システムのプロキシを bash に設定します。

私が保持しているプロキシ設定の一部は次のとおりです。

http_proxy=http://127.0.0.1:3129/
ftp_proxy=http://127.0.0.1:3129/
all_proxy=socks://127.0.0.1:3129/
https_proxy=http://127.0.0.1:3129/

~/.bashrc ファイルを編集することで、環境変数の変更を永続的にすることができます。サンプル編集:

export http_proxy=http://127.0.0.1:3129/
于 2012-12-17T05:39:54.980 に答える