私はnutch 2.0を使用しています.Parserを実装し、うまく動作するhtmlを解析するためのプラグインを作成しました。
問題は、URL と http コードを取得するために、リダイレクト (301,300) を生成するページも「解析」する必要があることです。私のプラグインは、リダイレクトされたページを無視します。
おそらく他の拡張ポイントを使用して、この情報を取得する方法はありますか?
私はnutch 2.0を使用しています.Parserを実装し、うまく動作するhtmlを解析するためのプラグインを作成しました。
問題は、URL と http コードを取得するために、リダイレクト (301,300) を生成するページも「解析」する必要があることです。私のプラグインは、リダイレクトされたページを無視します。
おそらく他の拡張ポイントを使用して、この情報を取得する方法はありますか?