ruby-on-rails - 光学式文字認識で Ruby と Ubuntu を使用する

Question

私は大学生で、また教科書を買う時が来ました。この四半期には、クラスで必要な本が 20 冊以上あります。ISBN をコピーして Amazon に貼り付けるだけなので、通常はそれほど大したことではありません。ただし、ISBN は私の学校の書籍サイトで画像に変換されます。私がやりたいことは、ISBN を文字列に変換することだけなので、1 つずつ手で入力する必要はありません。画像をテキストに変換するために GOCR を使用しましたが、Ruby スクリプトを使用してプロセスを自動化し、クラスメートにも同じことを行いたいと考えています。

サイトに移動できます。イメージを自分のコンピューター (UBUNTU を実行している) のファイルに保存し、GOCR でイメージを変換し、最後にファイルに保存して、Ruby スクリプトで再びアクセスできるようにするにはどうすればよいですか?

score 3 · Accepted Answer

GOCR は最初は良い選択のように思えますが、私自身の「調査」からわかることによると、品質は日常使用には十分ではありません。画像入力によっては、これが問題を引き起こす可能性があります。うまくいかない場合は、OCR 用の画像をアップロードできる Google ドキュメントの「新」機能を試してください。次に、いくつかのGoogle APIを使用して結果を取得できます（そこにはたくさんありますが、ハッキングが必要なgdata-ruby-utilを使用しています.

OCR 部分に tesseract-ocr を使用することもできます。これもオープンソースであり、活発に開発されています。

回収部分については、超強力で柔軟な hpricot に固執したいと思います。

score 2 · Accepted Answer

クールなプロジェクトのように聞こえますが、ISBN 画像が個別のファイルに保存されていれば、それほど難しくはありません。

これはすべてバックグラウンドで実行できます。

ウェブページをダウンロード (net/http)
各書籍のメタデータ + 画像ファイルを保存 (ペーパークリップ)
すべての画像でGOCRを実行します

必要なのは、URL のリストまたはクローラー (機械化) だけです。その後、大学の HTML ページ用のパーサー (joe の投稿を参照) を作成するのにおそらく数分を費やす必要があります。

ruby-on-rails - 光学式文字認識で Ruby と Ubuntu を使用する

2 に答える 2

Related

Reference