0

HTMLのセグメントにインデックスを付け、属性をメタデータとしてそのコンテンツにsolrで関連付けることが可能かどうかを調べようとしています。例えば:

<div class="TODO">Content that needs to be indexed</div>
<div class="FIXME">Fix the broken</div>

上記の div ブロックのコンテンツは、div ブロックのクラス名に関連付けてインデックスを作成する必要があります。

4

2 に答える 2

0

私はあなたがこれを行うことができるとは思わない. Solr には、すべての HTML エンコーディングを削除する HTML ストリッパーがあります。

ただし、セグメントを自分で解析する必要があります。

セグメントごとに solr ドキュメントを作成すると、メタデータを簡単に追加できます。1 つのドキュメント内では、操作するフィールドのみがあり、div のクラスに応じて、セグメントを追加するフィールドを選択します。

于 2013-06-17T22:02:00.347 に答える