Nutch には、クロールされたドキュメントを分類するために使用されるステータス コードがいくつかあります。
Nutch が使用するコードの例は次のとおりです。
db_unfetched
db_fetched
db_gone
db_redir_perm
db_redir_temp
db_notmodified
コードの意味を明確に説明している場所はどこにありますか?
ここ Stackoverflow でフォーラムの投稿と回答者を読むと、コードをよく理解できます。また、このページにもいくつかの良い情報があります: http://wiki.apache.org/nutch/CrawlDatumStatesしかし、私は各ステータス コードの意味を説明するページを探しています。