3

Linuxでpdf/chm/djvuファイルを検索するのに役立つツールを書きたいです。それをどうやって進めるかについての指針はありますか?

主な問題は、これらすべてのファイルからのデータの読み取り/インポートです。これは C とシェル スクリプトで実行できますか?

4

3 に答える 3

1

Trackerは Ubuntu 8.04 に同梱されています -- これは Beagle からの重要な切り替えであり、ユーザーはリソース (CPU) を大量に消費し、十分な結果が得られなかったと考えていました。pdf と chm の両方にインデックスを付け、このバグ レポートによると、 djvu にもインデックスを付けます。

于 2008-08-30T08:59:56.063 に答える
1

djvu は画像圧縮形式であることに注意してください (「テキストの画像」、通常はスキャンの結果を圧縮するために最適化されています)。そのため、メタデータ (これは cdleary によって送信されたリンクが参照するものです) を除いて、またはドキュメントで最初に OCR を使用してテキストに変換する場合を除いて、テキストを検索することはできません。

コンテンツがスキャンされた記事/本である PDF の場合も同様です。

于 2008-08-30T09:17:23.477 に答える
0

Beagleのプラグインはどうですか?

既に PDF を検索しますが、他のファイルの種類を追加できます。

関連するウィキペディアのページは次のとおりです: http://en.wikipedia.org/wiki/Beagle_(software)

于 2008-08-30T08:11:37.520 に答える