問題タブ [android-vision]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
3726 参照

android - アクティビティに戻った後、CameraSource は null 例外を発生させます

バーコード検出を初期化するアクティビティがあります。次に、別のアクティビティに移動し、戻るボタンを押すと、この例外のループが発生します。

主張して他のアクティビティに戻ると、別の例外が発生します。

CameraSource は onCreate で次のように初期化されます。

0 投票する
2 に答える
2263 参照

android - Android 顔検出 API - 保存されたビデオ ファイル

FaceDetectorAndroid Vision APIを使用して、ビデオ ファイル (ユーザー ギャラリーの MP4 など) で顔検出/追跡を実行したいと考えています。CameraSourceクラスを使用して、カメラから直接来るストリーム (たとえばandroid-vision github ) で顔追跡を実行する例はたくさんありますが、ビデオ ファイルでは何も見られません。

CameraSourceAndroid Studio 経由でソースコードを見てみましたが、難読化されていて、元のオンラインを見ることができませんでした。カメラの使用とファイルの使用には多くの共通点があると思います。おそらく、ビデオ ファイルを で再生し、Surfaceそれをパイプラインに渡します。

Frame.Builderあるいは、関数setImageDataとがあることがわかりますsetTimestampMillis。ビデオを として読み取ることができた場合、それをAPIByteBufferに渡すにはどうすればよいですか? この質問は似ているFaceDetectorと思いますが、答えはありません。同様に、ビデオをフレームにデコードし、それを に渡します。BitmapsetBitmap

理想的には、ビデオを画面にレンダリングしたくないので、FaceDetectorAPI が可能な限り高速に処理を行う必要があります。

0 投票する
2 に答える
538 参照

android - Android Vision API: 重複を含むすべてのバーコードを読み取ります

このコードを使用して、25 個のバーコードを含むファイルのすべてのバーコードを読み取ります。2 つのバーコードが重複しているため、23 個が返されます。このソリューションが重複を消去することを理解しています。重複した値の消去を回避する解決策はありますか? 重複も含めてすべて読む必要があります。

0 投票する
1 に答える
8912 参照

android - Zbar vs zxing vs Google バーコード API

QR コード スキャナー用の Android アプリケーションを開発しています。Google Android バーコード API と zxing の両方を試しましたが、どちらを使用するのがよいかまだ混乱しており、バーコードを生成するためにもう 1 つのアプリケーションを開発する必要があります。zxing 以外のライブラリはありますか? Qrコードの世代。1 つのアプリが QR コードを生成し、別のアプリがそれをスキャンします。両方のアプリに zxing を使用した方がよいでしょうか。

0 投票する
1 に答える
1255 参照

android - GoogleのFace APIを使用してコーナー/センターX、Y座標を検出するには?

こんにちは。改善された FaceDetection で動作するGoogle の新しい Face API (ここにリンク) を使用しています。返されるものの 1 つは Landmark オブジェクトのリストで、それぞれに使用する X 座標と Y 座標があります。

これらの座標を使用して、画像の中心を把握しようとしていますが、正しい数値を把握することは困難です。

これが私がこれまでに知っていることです:

1)古い方法とは異なり、1000、1000 by -1000、-1000 ではなくなりました。

2)返される座標は float 形式で、"...(0, 0) が画像の左上隅であるランドマークの (x, y) 位置。ポイントは、イメージの範囲内です。」(ソース

3) これらの座標をログに出力すると、画面サイズ (1440w、2368h) と一致しないように見える数値が表示されます。印刷したときに得られる位置の例は次のとおりです。

  • 464.90558,1112.7573
  • -19.159714,218.88104
  • 28.383072,196.1712
  • -130.06908,1071.8779

左上が(0,0)の場合、座標がどのように負になるかがわからないため、これは意味がありません。

問題は、これらの座標はどのように決定されるのかということです。どういうわけか画面のサイズに関してですか?それらは何らかの方法で DP を使用して変換されていますか? 静的キャップはありますか?

皆さんありがとう、

PGMac

0 投票する
1 に答える
1821 参照

android - Android Mobile Vision でパイプラインを使用してテキストを検出するときにフレームを取得する

Google CodeLabs サンプル コードと同じように、パイプラインを使用してテキストを検出しています。CameraSource が TextRecognizer に送信するプレビュー フレームを取得するにはどうすればよいですか?

0 投票する
1 に答える
2040 参照

android - モバイル ビジョン API テキスト検出でカメラ ソースのサイズを縮小する方法

Google Vision API のテキスト検出は、テキストをスキャンするためにフルスクリーンでプレビューします。テキスト検出用の小さな長方形が必要で、認識されたテキストを下のテキストボックスに表示します