問題タブ [downloading-website-files]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
32 参照

python - Python を使用してダウンロードしたファイルの問題

サイトからいくつかの jpg をダウンロードしてハード ドライブに保存しようとしていますが、フォーマットに問題があるためにファイルを開くことができません。

チャンクサイズを変更して request() で少し遊んでみましたが、うまくいきませんでした。シェルにエラーはありません。ウェブサイトのリンクは適切です。

解決策 (「for i...」ループ内):

0 投票する
0 に答える
39 参照

linux - リモート Web サイトから PDF ファイルをダウンロードする

Web サイトにあるすべての PDF ファイルをダウンロードするにはどうすればよいですか? ここでは wget コマンドを使用したくありません。これは手動で時間がかかるためです。

0 投票する
0 に答える
78 参照

excel - VBA-Excel を使用して保護された Web サイトからファイルをダウンロードする

保護された Web ページからファイルをダウンロードしようとしています (仕事のため、URL を投稿できません)。

バイト (WinHTTP 要求を使用しています) を .xls に保存すると、ファイルが破損しているように見えます。

私のコード (機密情報なし) と「HTTP ヘッダー ライブ」で取得した小さなコード。

コードが実行されます。すべてのチェック済みステータスで「OK」になりましたが、ファイル (622kb で、手動でダウンロードした場合と同じ) を開こうとすると、セルのデータが多すぎるというメッセージが表示されます。「とにかく開く」をクリックすると、いくつかの部分を読むことができます。

ファイルが別のエンコードで保存されているようです。

HTTP Header Live からのいくつかのコード。

ログイン:
https://www.website.com/retro/logincheck.asp
ホスト: www.website.com
ユーザーエージェント: Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:70.0) Gecko/20100101 Firefox/70.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9, / ;q=0.8
Accept-Language: es-ES,es;q=0.8,en-US;q=0.5,en;q =0.3
Accept-Encoding: gzip、deflate、br
Content-Type: application/x-www-form-urlencoded
Content-Length: 38
Origin: https://www.website.com
Connection: keep-alive
Referer: https:/ /www.website.com/retro/default.asp?idioma=ES
クッキー: cc_social=yes; cc_analytics=はい; cc_advertising=はい; cc_necessary=はい; _ga=GA1.2.859443177.1570897852; __utma=136336428.859443177.1570897852.1570897852.1570897852.1; __utmz=136336428.1570897852.1.1.utmcsr=google|utmccn=(オーガニック)|utmcmd=オーガニック| utmctr=(not%20provided); ASPSESSIONIDQWSBSQAD=LDIIIENCGKDHMEJEGKJKBDMM; cookieconsent=却下; ASPSESSIONIDQWQCRRBD=PCOIENHDNLHCKNODMJLKAFGM
Upgrade-Insecure-Requests: 1
txtUser=MYUSER&txtpwd=MYPASS&lg=es
POST: HTTP/2.0 302 見つかった
日付: 水曜日、2019 年 12 月 4 日 22:20:17 GMT
サーバー: Microsoft-IIS/8.5
キャッシュ制御: プライベート
コンテンツ-タイプ: text/html
有効期限: 2019 年 12 月 4 日水曜日 22:20:18 GMT
場所: retro.asp
コンテンツの長さ: 130
経由: 2.0 www.website.com
X-Firefox-Spdy: h2

ファイル:
https://www.website.com/retro/VerBorderoGRxls.asp?id=27348&p=3º Trimestre 2019&n=0&m=UNKNOWN&con=CIRCULAR&fmt=xls
ホスト: www.website.com
ユーザーエージェント: Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:70.0) Gecko/20100101 Firefox/70.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9, / ;q=0.8
Accept-Language: es-ES,es ;q=0.8,en-US;q=0.5,en;q=0.3
Accept-Encoding: gzip, deflate, br
接続: キープアライブ
リファラー: https://www.website.com/retro/borderos_resumen.asp
クッキー: cc_social=yes; cc_analytics=はい; cc_advertising=はい; cc_necessary=はい; _ga=GA1.2.859443177.1570897852; __utma=136336428.859443177.1570897852.1570897852.1570897852.1; __utmz=136336428.1570897852.1.1.utmcsr=google|utmccn=(オーガニック)|utmcmd=オーガニック| utmctr=(not%20provided); ASPSESSIONIDQWSBSQAD=LDIIIENCGKDHMEJEGKJKBDMM; cookieconsent=却下; ASPSESSIONIDQWQCRRBD=PCOIENHDNLHCKNODMJLKAFGM
アップグレード-安全でない-リクエスト: 1

GET: HTTP/2.0 200 OK
日付: 水曜日、2019 年 12 月 4 日 22:21:40 GMT
サーバー: Microsoft-IIS/8.5
キャッシュ制御: プライベート
コンテンツ タイプ: アプリケーション/x-msexcel
有効期限: 水曜日、2019 年 12 月 4 日 22: 21:40 GMT
content-length: 637440
via: 2.0 www.website.com
X-Firefox-Spdy: h2

0 投票する
1 に答える
620 参照

python-3.x - urllib.error.HTTPError: HTTP エラー 404: request.urlopen() の使用時に見つかりません

私はチュートリアルに従っていましたが、使用request.urlopen(url)するとエラーが発生し、URL を確認しようとしました ( https://www.wsj.com/market-data/quotes/PH/XPHS/JFC/historical-prices/download?MOD_VIEW= page&num_rows=150&range_days=150&startDate=06/01/2020&endDate=07/05/2020 ) で問題ありません。

これが私のコードです:

コンソールに表示されるエラーは次のとおりです。

0 投票する
0 に答える
23 参照

php - PHPを使用して大きなファイルをダウンロードする方法

オンラインで利用可能なPHPコードを使用して、WebリンクからWebサーバーに7GBの.tarファイルをダウンロードしようとしていました。ただし、ファイルは約 4GB に達した時点でダウンロードを停止しました。

私のウェブサーバーには無制限のストレージがありますが、この問題の原因は何ですか?

このような大きなファイルを停止せずにダウンロードする方法はありますか?

または、この目的のための Web サーバー ソフトウェア/プラグインはありますか?

ありがとう