問題タブ [urllib]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
9 に答える
51304 参照

python - Python でダウンロードする前にファイルのサイズを取得する

Web サーバーからディレクトリ全体をダウンロードしています。問題なく動作しますが、ダウンロード前にファイルサイズを取得して、サーバー上で更新されたかどうかを比較する方法がわかりません。これは、FTP サーバーからファイルをダウンロードする場合と同じように実行できますか?


@Jon: 素早い回答ありがとうございます。動作しますが、Web サーバー上のファイルサイズは、ダウンロードしたファイルのファイルサイズよりわずかに小さくなります。

例:

CR/LF 変換と何か関係がありますか?

0 投票する
26 に答える
1308084 参照

python - HTTP経由でファイルをダウンロードする方法は?

スケジュールに従ってWebサイトからMP3ファイルをダウンロードし、iTunesに追加したポッドキャストXMLファイルをビルド/更新するために使用する小さなユーティリティがあります。

XMLファイルを作成/更新するテキスト処理はPythonで記述されています。ただし、Windows.batファイル内でwgetを使用して、実際のMP3ファイルをダウンロードします。ユーティリティ全体をPythonで記述したいと思います。

Pythonでファイルを実際にダウンロードする方法を見つけるのに苦労したので、なぜ。を使用することにしwgetました。

では、Pythonを使用してファイルをダウンロードするにはどうすればよいですか?

0 投票する
2 に答える
2878 参照

python - urllib、urllib2、および ClientCookie を使用して Python スクリプトから phpBB3 フォーラムにログインするにはどうすればよいでしょうか?

(ClientCookie は (自動) Cookie 処理のモジュールです: http://wwwsearch.sourceforge.net/ClientCookie )

スクリプトはログインしませんが、ユーザー名とパスワードを要求する同じログイン ページにリダイレクトされるようです。私は何を間違っていますか?

どんな助けでも大歓迎です!ありがとう!

0 投票する
4 に答える
11258 参照

python - urllib.urlopen は機能しますが、urllib2.urlopen は機能しません

私はテストしている簡単なウェブサイトを持っています。これは localhost で実行されており、Web ブラウザーでアクセスできます。インデックス ページは単に「実行中」という単語です。 urllib.urlopenページを正常に読み取りますが、読み取りurllib2.urlopenません。問題を示すスクリプトを次に示します (これは実際のスクリプトであり、別のテスト スクリプトを簡略化したものではありません)。

スタック トレースは次のとおりです。

何か案は?のより高度な機能が必要になる可能性があるurllib2ため、単に を使用するだけではなくurllib、この問題を理解したいと考えています。

0 投票する
5 に答える
76648 参照

python - Pythonでurlencoded unicode文字列の引用符を外す方法は?

「Tan%u0131m」としてエンコードされた「Tanım」のようなユニコード文字列があります。このエンコードされた文字列を元のユニコードに変換するにはどうすればよいですか。どうやら urllib.unquote はユニコードをサポートしていないようです。

0 投票する
3 に答える
1859 参照

python - os.system() を使用して stdin からデータを取得するにはどうすればよいですか

スクリプトを使用してウィキペディアからテキストをダウンロードするために私が見つけた唯一の信頼できる方法は、cURL を使用することです。これまでのところ、それを行う唯一の方法はos.system(). 出力は Python シェルで適切に表示されますが、終了コード ( ) 以外のものを返す関数には思えません0。あるいは、誰かが を適切に使用する方法を示すことができますurllib

0 投票する
5 に答える
2392 参照

python - EXPLOSM.net からダウンロード コミックスクリプト [Python]

だから私はこの短いスクリプト (正しい言葉ですか?) を書いて、explosm.net コミックからコミック画像をダウンロードしました.

それはうまく動作します。webpage html を取得するための urllib2 と image.retrieve() のための urllib

これを SO に投稿した理由: このコードを最適化するにはどうすればよいですか? REGEX (正規表現) を使用すると高速になりますか? インターネットの制限ですか?アルゴリズムが悪い…?

速度または一般的なコードの美学の改善は、 「回答」として大歓迎です。

ありがとうございました。

- - - - - - - - - - - - - - - - コード - - - - - - - - - -----------------

ちなみに、これは Python 2.5 コードであり、3.0 ではありませんが、私は PYthon 3.0 のすべての機能を大いに研究し、新年の前後に (大学のアプリの後 - YAY! ^-^)

0 投票する
3 に答える
19629 参照

python - Python 3.0 で許可を得て http 経由でファイルをダウンロードし、バグを回避するにはどうすればよいですか?

引き続き使用したいスクリプトがありますが、Python 3 のバグの回避策を見つけるか、2.6 にダウングレードして、他のスクリプトもダウングレードする必要があるようです...

うまくいけば、ここの誰かがすでに回避策を見つけていることを願っています。

問題は、バイトと文字列に関する Python 3.0 の新しい変更により、明らかにすべてのライブラリ コードがテストされていないことです。

Web サーバーからページをダウンロードするスクリプトがあります。このスクリプトは、Python 2.6 の URL の一部としてユーザー名とパスワードを渡しましたが、Python 3.0 ではこれが機能しなくなりました。

たとえば、これは次のとおりです。

この例外で失敗します:

どうやら、base64 エンコーディングにはバイトが必要であり、文字列を出力するため、username:password の文字列を構築し、単純な認証のためにこれを base64 エンコードしようとする urlretrieve (またはその中のコード) は失敗します。

代わりに urlopen を使用しようとすると、次のようになります。

次に、次の例外で失敗します。

どうやら、この「次世代 URL 検索ライブラリ」の URL 解析では、URL 内のユーザー名とパスワードをどう処理すればよいかわかりません。

他にどのような選択肢がありますか?

0 投票する
2 に答える
34585 参照

python - Python3.0urllib.parseエラー「タイプstrはバッファAPIをサポートしていません」

誰かがこれを回避する方法を教えてもらえますか?にデータをフィードすることで取得してcgi.Fieldstorageいますが、他の方法ではできないようです。

0 投票する
3 に答える
32716 参照

python - urllib.open使用時のPythonエラー

これを実行すると:

インタラクティブウィンドウ(PythonWin)でこの出力を取得します。

上記のURLのソースを取得することを期待しています。これは他のコンピューター(学校のコンピューターなど)でも機能することはわかっていますが、これは私のラップトップにあり、ここで何が問題なのかわかりません。また、私はこのエラーをまったく理解していません。どういう意味ですか?Addinfourl?fp?助けてください。