Simon Willnauer は Lucene Revolution 2011 で DocValues に関するプレゼンテーションを行っています。DocValues とは何か、なぜ優れているのかについての 40 分間の紹介をご覧ください。
Doc Values は、ファセットやハイライトなど、検索に加えて最新の検索プラットフォームが行うすべての「その他のこと」の最適化です。
Solr Community Wiki には、DocValuesとその使用目的の説明もあります。
並べ替え、ファセット、強調表示など、現在検索によく関連付けられている他の機能については、このアプローチはあまり効率的ではありません。たとえば、ファセット エンジンは、ファセット リストを作成するために、結果セットを構成する各ドキュメントに表示される各用語を検索し、ドキュメント ID を取得する必要があります。Solr では、これはメモリに保持され、読み込みが遅くなる可能性があります (ドキュメントや用語などの数によって異なります)。Lucene 4.0 では、新しいアプローチが導入されました。DocValue フィールドは、インデックス時に構築されたドキュメントから値へのマッピングを持つ列指向のフィールドになりました。このアプローチにより、fieldCache のメモリ要件の一部が軽減され、ファセット、ソート、およびグループ化のルックアップが大幅に高速化されます。
それらの実装は、org.apache.lucene.index.DocValuesおよび DocValues の使用をサポートする各フィールド タイプで利用できます (各フィールド タイプは明示的に DocValues を使用する必要があります)。