HTML ファイルから全文検索を行うために lucene アプリケーションを変更しようとしていますが、最も近いアンカーも取得したいと考えています。
このHTMLコードがある場合の例として:
.......
<a name="1"></a>
<p style="font-size:12pt;text-align: justify;text-indent:30px;">
closest anchor i would like to find.
</p>
.......
<a name="2"></a>
<p style="font-size:12pt;text-align: justify;text-indent:30px;">
testing full text search.
</p>
.......
文字列「全文検索」を検索すると、html での位置を作成するために、名前 2 のアンカーを取得したいと思います。
これは Solr で可能であると聞いたことがあります。Hibernate Search を Lucene のコア ライブラリとして使用しているため、現在は使用していません。
それで、何かアイデアはありますか?
お時間をいただきありがとうございます!