画像形式のインデックスを作成するために IFilter を実装しています。問題の 1 つは写真です。多くのユーザーは大量の写真を所有しており、写真は巨大であり、テキストの読み込みと検索に時間がかかります。
はい、ドキュメントをデジタル化するためにスキャナーの代わりにカメラを使用する人もいますが、IMO の潜在的な問題は、写真カメラでデジタル化されたドキュメントに遭遇する可能性をはるかに上回ります。したがって、私の実装では、写真からテキストをまったく抽出しません。
指定されたファイルが写真画像であることを検出したら、IFilter は何をすべきでしょうか? エラーを示すか、空のテキストを返しますか?