2

私は非常に単純に見える小さな問題を抱えています...しかし、私はそれを理解していません! http://cspsp.gshi.org/の Web サイト コンテンツをダウンロードしようとしています( www.cspsp.gshi.org経由でアクセスしようとすると、間違ったページに移動します....)

このために、Powershellで次のようにします:
(New-Object System.Net.WebClient).DownloadFile( 'http://cspsp.gshi.org/', 'save.htm' )

Firefox で Web サイトにアクセスしてそのコンテンツを簡単にダウンロードできますが、Powershell は常に次のような出力を出力します:
The remoteserver returned an Error: (404) Nothing found.(ドイツ語からの翻訳)。

ここで何が間違っているのかわかりません。Google などの他の Web サイトは問題なく動作します。

4

1 に答える 1

2

User-AgentこのサイトはHTTPクライアントから送信されるリクエストヘッダーに依存しているようSystem.Net.WebClientで、デフォルト値すら送信していません(少なくとも、自分のローカルサーバーにアクセスしたときは送信しませんでした)。

いずれにせよ、これは私のために働いた:

$request = (New-Object System.Net.WebClient)
$request.headers['User-Agent'] = "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.40 Safari/537.17"
$request.DownloadFile('http://cspsp.gshi.org/', 'saved.html')
于 2012-12-20T02:29:38.407 に答える