Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
HTMLのセグメントにインデックスを付け、属性をメタデータとしてそのコンテンツにsolrで関連付けることが可能かどうかを調べようとしています。例えば:
<div class="TODO">Content that needs to be indexed</div> <div class="FIXME">Fix the broken</div>
上記の div ブロックのコンテンツは、div ブロックのクラス名に関連付けてインデックスを作成する必要があります。
私はあなたがこれを行うことができるとは思わない. Solr には、すべての HTML エンコーディングを削除する HTML ストリッパーがあります。
ただし、セグメントを自分で解析する必要があります。
セグメントごとに solr ドキュメントを作成すると、メタデータを簡単に追加できます。1 つのドキュメント内では、操作するフィールドのみがあり、div のクラスに応じて、セグメントを追加するフィールドを選択します。