0

画像形式のインデックスを作成するために IFilter を実装しています。問題の 1 つは写真です。多くのユーザーは大量の写真を所有しており、写真は巨大であり、テキストの読み込みと検索に時間がかかります。

はい、ドキュメントをデジタル化するためにスキャナーの代わりにカメラを使用する人もいますが、IMO の潜在的な問題は、写真カメラでデジタル化されたドキュメントに遭遇する可能性をはるかに上回ります。したがって、私の実装では、写真からテキストをまったく抽出しません。

指定されたファイルが写真画像であることを検出したら、IFilter は何をすべきでしょうか? エラーを示すか、空のテキストを返しますか?

4

1 に答える 1

1

Word フィルターが追跡された変更を処理しない場合、エラーはスローされません。それらをスキップするだけです。あなたの場合、ファイル全体をスキップしていますが、それは同じ原則です。これはエラー状態ではありません。テキストを返さないだけです。

于 2009-10-08T14:35:59.423 に答える