カメラから撮影した画像からテキストを認識するために、Android プロジェクト用にユーザー tesseract ocr を使用しています。しかし、結果は正確ではありません。opencv を使用して画像を最適化したい。Bitmap.Config.ARGB_8888形式でデコードされたキャプチャされた画像に対して、次のことを達成したいと考えています。
- サイズ変更されたイメージ内のオブジェクトを検出します。
- オブジェクトが識別されたら、元のイメージとの境界線を計算します。(これはカメラアングル効果を取り除くためです)
- 透視変換を適用して、元の画像からオブジェクトを抽出します。
- ホワイトバランスを適用して、明るくなる効果を取り除きます。
tess_two api で提供されている例では、単語の周囲にバウンディング ボックスを描画するなどの画像操作にLeptonicaを使用しています..しかし、私の場合はOpenCVを使用したいです.