テキストファイルにインデックスを付けたいと思いました。たくさん検索した後、Apachetikaについて知りました。今、私がApache tikaを研究したいくつかのサイトで、Apache tikaがテキストをXML形式に変換し、それをsolrに送信することを知りました。しかし、変換すると、タグの例が1つだけ作成されます.......インデックスを作成したいテキストファイルは、Tomcatローカルホストアクセスファイルです。このファイルはGB単位です。それと単一のインデックスを保存できません。各行にline-id.......を付けて、一致する行を簡単に取得できるようにします。
これはApacheTikaで実行できますか?