問題タブ [google-vision]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1866 参照

android - Google Vision API グラフィック オーバーレイ付きのキャプチャ画像

私はAPIフェイストラッカーサンプルの1つを使用しており、アプリのアイデアに従って機能するかどうかを確認するためにコードを少し変更しました。私がやりたいのは、顔を検出した後にフェイスマスクを追加したいということです。

これまでに行ったことは、サンプル マスク ドローアブルを追加したことです。顔のポイントを描画する代わりに顔を検出すると、顔追跡長方形にドローアブルを描画します。顔のプレビューにそのマスクが表示されるようになりましたが、その画像をキャプチャしようとすると、マスクを追加したグラフィックオーバーレイではなく、カメラからフレームのみがキャプチャされます。そのマスクをカメラからキャプチャする方法はありますか?

保存中の画像

モバイル画面に表示されている画像

0 投票する
0 に答える
2352 参照

android - Google Vision バーコード リーダー API で懐中電灯/懐中電灯を使用するには?

this questionthis questionに似た質問がありますが、どちらも受け入れられた解決策がありません。

私は基本的に Google Vision バーコード API を使用していますが、懐中電灯を制御する明らかな方法はないようです。

この回答は、このコードを使用することを提案していますが、(試行して失敗したため)アプリに統合する方法がわかりません。

これは私のアクティビティのコードです。これは基本的にカメラ/バーコード スキャナーを起動しBaseActivity、懐中電灯を切り替えるために使用したいmy のメニュー項目も使用します。

0 投票する
0 に答える
446 参照

android - Android 用 Google Vision API を使用してカメラ ビューの上にマーカーを描画する

Android で Google Vision API を使用して、カメラ ビューの上に図形やグラフィックを描画するにはどうすればよいですか?

これまでに見たほとんどのバーコード スキャナーには、バーコードの焦点を合わせやすくするために、画面の中央に点滅する水平線のようなものがあります。しかし、API リファレンスを調べてもまだわかりません。

Google Vision API にはこれを実現する簡単な方法がありますか?

0 投票する
1 に答える
123 参照

gradle - LibGDX: Google Mobile Vision API を LibGDX プロジェクトに追加するには?

答えは簡単かもしれませんが、まだ助けになるものは見つかりませんでした。基本的に、Google Vision API をプロジェクトに追加したいと考えています。私はこれを入れて試しました

このチュートリアルのようにbuild.gradle dependencies、Android モジュールで これは機能しませんでした (別の場所に書くべきでしょうか? わかりません)。現在、この には多くの検査が示されています。には適用できない成分があると言われています。build.gradlegroovy.lang.Closure

Google リポジトリをインストールしました。そして、LibGDX ではないそのチュートリアルを完了しましたが、そこではすべて正常に動作します。

では、LibGDX で動作させるにはどうすればよいでしょうか?

0 投票する
1 に答える
780 参照

java - Eclipse で Google Vision チュートリアル ライブラリを追加しようとすると Maven エラーが発生する

私はこのチュートリアルに従おうとしています。Eclipse と Maven 3.3.3 を使用しています。

そのため、必要な依存関係を pom ファイルに追加することから始めます。これらの依存関係は問題なく動作します。

ただし、これらの依存関係を追加すると:

エラーが発生する

クリックしても実際には何も起こらないので、他に何も見えません。

私がこれまでに試したこと:

これらの依存関係の以前のバージョンをインストールしようとしましたが、うまくいきませんでした。

上記の依存関係の実際のjarファイルをダウンロードし、次を使用してインストールしました:

それらは機能しているように見え、Maven によって正常に認識されました。しかし、コーディングを開始すると、依存関係の一部がインストールされていないことに気付き、あらゆる種類の依存関係エラーが発生し、一部のクラスが認識されませんでした。

関連するすべての Google リポジトリをローカルの Maven リポジトリから削除してから、pom ファイルを再度編集しましたが、次のエラーが発生しました。

そして、それをクリックしても何も起こりません。

現時点では、すべてのアイデアがありません。どんな助けでも大歓迎です。

ありがとう。

0 投票する
1 に答える
207 参照

ocr - Vision API - 単一のテキスト行として認識されない画像を A​​PI に強制的に分析させる

私はGoogle Vision APIを使用してきましたが、実際には解決できない問題があります。これは私が扱っている画像です:

ここに画像の説明を入力

上の画像では、Google Vision API ( IBM (Watson)Microsft (Cognitive Services)でも発生します)は、2,99€ が 1 行として扱われないため、読み取るものであることを理解していません。したがって、出力はすべてしかし、私が彼に期待していること(レーベルの価格を理解する)。

Tesseract を使用していた場合は、-psm 7オプションを使用して 1 つのテキスト行として読み取るように強制することでこれを解決しますが、Google Vision API を使用してこの状況に関するドキュメントを実際に見つけることができません。

誰かが以前に似たようなことをしたことがありますか? この問題を解決する方法がわかりません...

0 投票する
0 に答える
455 参照

android - カメラ アクティビティの進行中にトグル ボタンでトーチをオンにする必要があります。既存のコードに触れずにコード行を追加することによって

私はバーコード デコード アプリケーションを持っています: https://play.google.com/store/apps/details?id=com.barcodereader

スキャンにZbarライブラリとGoogle Vision APIを使用しました

今私が欲しいのは、ユーザーがトーチ(フラッシュ)をオンにするためにアプリバーのボタンをタップした場合にバーコードをスキャンしているときに、オンとオフを逆にする必要があることです。

しかし、問題は、カメラがすべてのパラメーターで既にオンになっているため、ユーザーがボタンをタップしてトーチをオンにすると、進行中のカメラパラメーターを中断する必要があり、私はそれをしたくありません。

既存のカメラパラメータを変更せずにトーチをオンにする別の方法を探しています..

以下は ZBar と Google Vision のカメラ アクティビティです。どちらもカメラ プレビュー用に他のカメラ クラスを使用しています。

そしてGoogleScanner