0

Google ブックスと同じように、書籍全体をオンラインで出版するよう依頼されました。つまり、表示および印刷は可能ですが、ダウンロードはできません。

処理は基本的に「高画質スキャン」ですか?これらの高品質の画像に「透かし」を「大量生成」するオープンソースのソリューションはありますか。元の画像があるとします。ユーザーがオンラインで表示すると、画像を再作成して透かしを追加し、「オンザフライ」で画像の上に他のテキストを追加します。もちろん、そのようなライブラリはPythonに存在します:)

任意のヒント?以前にこれを行ったことがある場合は、共有してください。

ありがとう

4

3 に答える 3

4

残念ながら、Google は書籍をスキャンするために特許取得済みの技術を使用しているため、おそらく従来の方法に固執する必要があります。

Google は、本がスキャナーに置かれたときに本のページの 3 次元形状と角度を検出する、非常に優れた赤外線カメラ技術を作成しました。この情報はOCRソフトウェアに送信され、OCRソフトウェアは歪みを調整して、OCRソフトウェアがテキストをより正確に読み取れるようにします。ビンディングが壊れたり、効率の悪いガラス板がなくなったりすることはもうありません。

基本的に、OCR アプリケーションを使用して本をスキャンする必要があります (tesseract が適しています)。次に、スキャンしたテキストから PDF/画像を生成し、最後に透かしを追加します。これには、 Python Imaging Libraryが最適なツールのようです。

于 2009-10-06T19:26:01.957 に答える
1

Google Books についてはよくわかりませんが、Python Imaging Libraryは透かしを入れることができます (そのためのASPN レシピがあります)。

于 2009-10-06T19:26:49.103 に答える
0

Google の写真 + レーザー グリッド手法の再現に関するスラッシュドットの質問を参照してください。

于 2009-10-06T19:29:51.640 に答える