しばらく前にLucene検索ソリューションを実装しましたが、検索可能な圧縮ファイルインデックスに興味を持ちました。当時、カスタム検索インデックスをどの程度正確に作成するかについての適切な情報が見つからなかったので、誰かが私を正しい方向に向けることができるかどうか疑問に思います。
私の主な関心は、ファイルのフォーマット、圧縮、およびLuceneのドキュメントとフィールドの概念に似たものです。必ずしも言語固有である必要はありませんが、プロセスの完全な説明を含む言語固有の実装があるオンラインリソースを教えていただければ、それでも構いません。