問題タブ [android-vision]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
android - アクティビティに戻った後、CameraSource は null 例外を発生させます
バーコード検出を初期化するアクティビティがあります。次に、別のアクティビティに移動し、戻るボタンを押すと、この例外のループが発生します。
主張して他のアクティビティに戻ると、別の例外が発生します。
CameraSource は onCreate で次のように初期化されます。
android - Android 顔検出 API - 保存されたビデオ ファイル
FaceDetector
Android Vision APIを使用して、ビデオ ファイル (ユーザー ギャラリーの MP4 など) で顔検出/追跡を実行したいと考えています。CameraSourceクラスを使用して、カメラから直接来るストリーム (たとえばandroid-vision github ) で顔追跡を実行する例はたくさんありますが、ビデオ ファイルでは何も見られません。
CameraSource
Android Studio 経由でソースコードを見てみましたが、難読化されていて、元のオンラインを見ることができませんでした。カメラの使用とファイルの使用には多くの共通点があると思います。おそらく、ビデオ ファイルを で再生し、Surface
それをパイプラインに渡します。
Frame.Builder
あるいは、関数setImageData
とがあることがわかりますsetTimestampMillis
。ビデオを として読み取ることができた場合、それをAPIByteBuffer
に渡すにはどうすればよいですか? この質問は似ているFaceDetector
と思いますが、答えはありません。同様に、ビデオをフレームにデコードし、それを に渡します。Bitmap
setBitmap
理想的には、ビデオを画面にレンダリングしたくないので、FaceDetector
API が可能な限り高速に処理を行う必要があります。
android - Android Vision API: 重複を含むすべてのバーコードを読み取ります
このコードを使用して、25 個のバーコードを含むファイルのすべてのバーコードを読み取ります。2 つのバーコードが重複しているため、23 個が返されます。このソリューションが重複を消去することを理解しています。重複した値の消去を回避する解決策はありますか? 重複も含めてすべて読む必要があります。
android - Zbar vs zxing vs Google バーコード API
QR コード スキャナー用の Android アプリケーションを開発しています。Google Android バーコード API と zxing の両方を試しましたが、どちらを使用するのがよいかまだ混乱しており、バーコードを生成するためにもう 1 つのアプリケーションを開発する必要があります。zxing 以外のライブラリはありますか? Qrコードの世代。1 つのアプリが QR コードを生成し、別のアプリがそれをスキャンします。両方のアプリに zxing を使用した方がよいでしょうか。
android - GoogleのFace APIを使用してコーナー/センターX、Y座標を検出するには?
こんにちは。改善された FaceDetection で動作するGoogle の新しい Face API (ここにリンク) を使用しています。返されるものの 1 つは Landmark オブジェクトのリストで、それぞれに使用する X 座標と Y 座標があります。
これらの座標を使用して、画像の中心を把握しようとしていますが、正しい数値を把握することは困難です。
これが私がこれまでに知っていることです:
1)古い方法とは異なり、1000、1000 by -1000、-1000 ではなくなりました。
2)返される座標は float 形式で、"...(0, 0) が画像の左上隅であるランドマークの (x, y) 位置。ポイントは、イメージの範囲内です。」(ソース)
3) これらの座標をログに出力すると、画面サイズ (1440w、2368h) と一致しないように見える数値が表示されます。印刷したときに得られる位置の例は次のとおりです。
- 464.90558,1112.7573
- -19.159714,218.88104
- 28.383072,196.1712
- -130.06908,1071.8779
左上が(0,0)の場合、座標がどのように負になるかがわからないため、これは意味がありません。
問題は、これらの座標はどのように決定されるのかということです。どういうわけか画面のサイズに関してですか?それらは何らかの方法で DP を使用して変換されていますか? 静的キャップはありますか?
皆さんありがとう、
PGMac
android - Android Mobile Vision でパイプラインを使用してテキストを検出するときにフレームを取得する
Google CodeLabs サンプル コードと同じように、パイプラインを使用してテキストを検出しています。CameraSource が TextRecognizer に送信するプレビュー フレームを取得するにはどうすればよいですか?
android - モバイル ビジョン API テキスト検出でカメラ ソースのサイズを縮小する方法
Google Vision API のテキスト検出は、テキストをスキャンするためにフルスクリーンでプレビューします。テキスト検出用の小さな長方形が必要で、認識されたテキストを下のテキストボックスに表示します