私は win フォームの C# アプリケーションで作業しています。アプリケーションは、(テレビ/カメラまたは入力ビデオ ファイル) のようなビデオ デバイスから画像を取得します。次に、それを処理し、テキスト ドキュメントに保存します。
私の質問は、「デジタル ビデオ OCR を作成する方法」です。
チュートリアル/リンク/ソースコードを教えてください。
私は win フォームの C# アプリケーションで作業しています。アプリケーションは、(テレビ/カメラまたは入力ビデオ ファイル) のようなビデオ デバイスから画像を取得します。次に、それを処理し、テキスト ドキュメントに保存します。
私の質問は、「デジタル ビデオ OCR を作成する方法」です。
チュートリアル/リンク/ソースコードを教えてください。
Google Cloud は動画 OCR API を提供します。https://cloud.google.com/video-intelligence/docs/text-detection
動画でこの API を直接呼び出すことができます。テキスト境界ボックスと、動画に関連付けられたタイムスタンプを返します。
OCR 部分にはtesseract-ocr .net エンジン、カメラ メソッドにはEmgu CVから始めます。幸運を。
ビデオ OCR はまだ活発な研究トピックであるため、独自のビデオ OCR エンジンを開発するには、さらに多くの労力を費やす必要があるかもしれません。基本的に、ビデオ OCR フレームワークは、ビデオ シーン カットの検出、テキスト検出、およびビデオ カットからの認識に基づいて構築できます。
シーン カット検出を前処理ステップとして使用して、計算コストを削減します。次に、ビデオ カット フレーム内のテキスト コンテンツの位置と境界をローカライズします。適切なテキスト セグメンテーションと 2 値化技術を使用して、背景からテキスト ピクセルを分離します。最後に、印刷 OCR エンジンを適用してテキスト結果を取得できます。
少量のビデオ データを処理するだけの場合は、mashapeで無料のビデオ OCR レスト APIを使用できます。
あなたまたは他の誰かがこれに取り組んでいる場合、このサイトが非常に役立つことがわかりました.
基本的に、ビデオは静止画像に変換され、それらの画像は OCR 結果を最適化するために処理され、次に各画像が OCR されます。