0

こんにちは皆さん、xml docs を介してパスを渡すことで、pdf および word ファイルを検索できるかどうかを教えてください... xml ファイルは次のようになります..

<doc>
    <field name="id">1</field>
    <field name="name">A</field>
    <field name="sk">Acce</field>
    <field name="level">Beginner</field>
    <field name="do">Tuto</field>
    <field name="open">1</field>
    <field name="type">Ct</field>
    <field name="extensis">cl_ex</field>
    <field name="features">Atos</field>
    <field name="downl"></field>
    <field name="source">Atoms</field>
    <field name="description">Ths.</field>
    <field name="file_path">http://www.abcd.com/files/abcd.pdf</field>

  </doc>

  <doc>
    <field name="id">2</field>
    <field name="name">Ar</field>
    <field name="sk">Acrce</field>
    <field name="level">Beginner</field>
    <field name="do">Tuto1</field>
    <field name="open">11</field>
    <field name="type">C1t</field>
    <field name="extensis">cl_exd</field>
    <field name="features">Atos</field>
    <field name="downl"></field>
    <field name="source">ddddd</field>
    <field name="description">Thsdd.</field>
    <field name="file_path">http://www.abcd.com/files/abcd.pdf</field>

  </doc>

したがって、ここでsolrクエリを使用して単語「solr word」を検索すると、ドキュメント内だけで検索するのではなく、ファイル(file_path)内にも移動して単語を検索する必要があります。これに関する提案、支援は役に立ちます..

4

1 に答える 1

0

私が知っていることではありません。

でも、別ルートなら可能です。Apache Tika を使用して pdf/doc ファイルをテキストに抽出し、そのテキストにインデックスを付けて、ドキュメント内を検索できるようにすることができます。

サンプル実装:

pdf -> ティカ

tika -> pdf からのテキスト

PDF からのテキスト && ファイルパス -> solr doc

検索 solr -> 検索がファイルの内容と一致する場合、ファイルパスを含むドキュメントを返します

于 2013-11-14T14:32:01.277 に答える