6

私は win フォームの C# アプリケーションで作業しています。アプリケーションは、(テレビ/カメラまたは入力ビデオ ファイル) のようなビデオ デバイスから画像を取得します。次に、それを処理し、テキスト ドキュメントに保存します。

私の質問は、「デジタル ビデオ OCR を作成する方法」です。

チュートリアル/リンク/ソースコードを教えてください。

4

5 に答える 5

3

Google Cloud は動画 OCR API を提供します。https://cloud.google.com/video-intelligence/docs/text-detection

動画でこの API を直接呼び出すことができます。テキスト境界ボックスと、動画に関連付けられたタイムスタンプを返します。

于 2019-04-07T20:06:26.173 に答える
1

OCR 部分にはtesseract-ocr .net エンジン、カメラ メソッドにはEmgu CVから始めます。幸運を。

于 2013-10-07T12:01:01.033 に答える
1

ビデオ OCR はまだ活発な研究トピックであるため、独自のビデオ OCR エンジンを開発するには、さらに多くの労力を費やす必要があるかもしれません。基本的に、ビデオ OCR フレームワークは、ビデオ シーン カットの検出、テキスト検出、およびビデオ カットからの認識に基づいて構築できます。

シーン カット検出を前処理ステップとして使用して、計算コストを削減します。次に、ビデオ カット フレーム内のテキスト コンテンツの位置と境界をローカライズします。適切なテキスト セグメンテーションと 2 値化技術を使用して、背景からテキスト ピクセルを分離します。最後に、印刷 OCR エンジンを適用してテキスト結果を取得できます。

少量のビデオ データを処理するだけの場合は、mashapeで無料のビデオ OCR レスト APIを使用できます。

于 2014-11-11T20:44:04.707 に答える
0

あなたまたは他の誰かがこれに取り組んでいる場合、このサイトが非常に役立つことがわかりました.
基本的に、ビデオは静止画像に変換され、それらの画像は OCR 結果を最適化するために処理され、次に各画像が OCR されます。

于 2016-03-09T20:46:24.077 に答える