0

私はnutch 2.0を使用しています.Parserを実装し、うまく動作するhtmlを解析するためのプラグインを作成しました。

問題は、URL と http コードを取得するために、リダイレクト (301,300) を生成するページも「解析」する必要があることです。私のプラグインは、リダイレクトされたページを無視します。

おそらく他の拡張ポイントを使用して、この情報を取得する方法はありますか?

4

1 に答える 1

1

プロトコル拡張ポイントを実装したので、リダイレクトとロード時間をデータベースに保存できるようになりました。

于 2012-08-09T10:09:00.720 に答える