2

ページのURLとして名前が付けられた、さまざまなファイルでクロールされたページの生のhtmlを取得しようとしています。Nutchを使用して、インデックス作成部分を除外して生の HTML ページを別のファイルに保存することはできますか?

4

1 に答える 1

2

それを行う直接的な方法はありません。コードを少し変更する必要があります。これこれを参照してください。

于 2012-04-14T02:06:55.063 に答える