この質問が一般的すぎる可能性がある場合は申し訳ありません。ドキュメントへのリンクがあれば、それでよかったと思います。グーグルは私がそれらを見つけるのを手伝わないでしょう。
NutchがクロールしたWebサイトからファセットを抽出し、Solrがインデックスを作成する方法を理解する必要があります。<meta name="price" content="123.45"/>
Webサイトでは、ページにまたはのようなメタタグがあります<meta name="categories" content="category1, category2"/>
。Nutchにそれらを抽出し、Solrにそれらをファセットとして扱うように指示できますか?
上記の例では、メタ名「categories」をファセットとして扱うように手動で指定したいのですが、コンテンツは動的にカテゴリとして使用する必要があります。
それは意味がありますか?NutchとSolrを使用することは可能ですか、それとも使用方法を再考する必要がありますか?