0

ここでこのファイルを使用して wget を使用してファイルのリストをダウンロードしようとしています: http://webdatacommons.org/downloads/2012-08/nquads/files.list

ここで説明されているとおり: http://webdatacommons.org/2012-08/stats/how_to_get_the_data.html#toc0

しかし、次のメッセージが表示されます。

rbhagdev@rbhagdev-linux:~/RDF$ wget -i files.list
--2013-05-01 11:49:44-- http://webdatacommons.org/downloads/2012-08/nquads/html-mf-geo-00000.nq.sort.gz%0Dhttp://webdatacommons. org/downloads/2012-08/nquads/html-mf-geo-00001.nq.sort.gz%0Dhttp://webdatacommons.org/downloads/2012-08/nquads/html-mf-geo-00002.nq. sort.gz%0Dhttp://webdatacommons.org/downloads/2012-08/nquads/html-mf-geo-00003.nq.sort.gz%0Dhttp://webdatacommons.org/downloads/2012-08/nquads/ html-mf-geo-00004.nq.sort.gz%0Dhttp://webdatacommons.org/downloads/2012-08/nquads/html-mf-geo-00005.nq.sort.gz%0Dhttp://webdatacommons. org/downloads/2012-08/nquads/html-mf-geo-00006.nq.sort.gz%0Dhttp://webdatacommons.org/downloads/2012-08/nquads/html-mf-hcalendar-00000.nq. sort.gz webdatacommons.org (webdatacommons.org) を解決しています... 129.13.253.75 webdatacommons.org (webdatacommons.org)|129.13.253.75|:80 に接続しています... 接続されました。HTTP 要求が送信され、応答を待っています... 403 禁止されています 2013-05-01 11:49:44 エラー 403: 禁止されています。

そのファイルで1行しか使用しない場合、機能します。これはおそらく改行文字と関係があることを示唆していますか? 私はUbuntuを使用しています。誰かが wget がこのように振る舞う理由を提案できますか?

4

1 に答える 1

2

ファイルの行末文字を置き換える必要があります。このコマンドを使用してそれを行うことができます

sed -e 's/\r/\n/g' files.list > files.list.new
wget -i files.list.new
于 2013-05-01T12:41:19.977 に答える