2

fileSystem データソースがあり、DIH を実行するための dataconfig を作成しました。dataconfig は

<?xml version="1.0" encoding="UTF-8"?>
<データ構成>
    <dataSource type="FileDataSource" />
    <ドキュメント>
        <entity name="pdf" processor="FileListEntityProcessor" baseDir="/path/to/my/pdf" fileName=".*pdf" newerThan="'NOW-3DAYS'" recursive="true" rootEntity="false" dataSource="pdf">
        </entity>
    </ドキュメント>
</dataConfig>

DIHを実行すると、
インデックス作成が完了しました。追加/更新: 0 ドキュメント。0 件のドキュメントを削除しました。
リクエスト: 0、取得: 35924、スキップ: 0、処理: 0

ドキュメントを処理しなかった理由は何ですか?

4

2 に答える 2

1

構成にルート エンティティがありません。エンティティが 1 つしかなく、rootEntity="false" が含まれているため、そこからドキュメントは作成されません。

ファイル情報をスキーマ内のフィールドにマップするには、エンティティ内にいくつかの「フィールド」行を定義する必要もあります。この質問は、docフォルダー内のすべてのドキュメントをsolr FileListEntityProcessorにインデックス付けすることで、必要なものと同様のことを行います。

于 2015-01-28T09:09:54.007 に答える