Anyline、microblink、またはその他の SDK を使用したライブ ビデオの代わりに、画像 (アセットなど) に対して OCR を実行することはできますか?
時間が限られているため、Tesseract はオプションではありません。
テストしましたが、結果は非常に不適切です。OpenCv などで改善できることはわかっていますが、期限を守らなければなりません。
編集:
Anyline、microblink、またはその他の SDK を使用したライブ ビデオの代わりに、画像 (アセットなど) に対して OCR を実行することはできますか?
時間が限られているため、Tesseract はオプションではありません。
テストしましたが、結果は非常に不適切です。OpenCv などで改善できることはわかっていますが、期限を守らなければなりません。
編集:
他のものについてはわかりませんが、microblink SDK を使用して単一の画像から読み取ることができます。ここに文書化されています。
ビデオ ストリームから読み取ると、はるかに良い結果が得られますが、それはすべて、正確に何をしようとしているのかによって異なります。何を読もうとしていますか?
身分証明書などからバーコードや MRZ を読み取る場合は、かなりうまく機能します。未加工のテキスト OCR の場合、それほど良くはありませんが、実際にはそれを意図したものではありません。
https://github.com/garnele007/SwiftOCR 機械学習ベース、さまざまなフォント、文字などでトレーニング可能、無料