0

Google Glass アプリケーションで画像認識/コンピュータ ビジョンを実行する無料の方法を見つけようとしています。お金、本の表紙、テキストなど、現実世界のオブジェクトを認識できるものを探しています。理想的には、Google Goggles のように機能します (何らかの理由で Google は Goggle API を作成していません)。私は、クラウドベースのソリューションまたはローカルで実行されるソリューションに対してオープンです。Glass でローカルに画像認識を実行できない場合は、独自のサーバーを実行することもできます。

私はいくつかの異なる技術を調べました。OpenCVは非常に強力に見えますが、照合する画像のライブラリが付属していません。CamFindには、まさに私が必要としている機能を実行するクラウド API がありますが、多額の費用がかかります。

アプリケーションに画像認識を追加する方法について何か提案はありますか? 前もって感謝します!

4

2 に答える 2

1

基本的に同じことを一緒にハッキングして、NYC で開催された Glass Foundry ハッカソン (2013 年) で優勝しました。これは Glass のネイティブ開発キットが発表される前のことだったので、ミラー API だけですべてを行いました。これが私がそれを実装した方法です:

  1. まず、クイックスタートの 1 つを使用して、サーバー側の Glass アプリを作成します。Mirror API を操作してユーザーのタイムラインを操作できるように、正しいスコープを要求します。
  2. カスタム共有ターゲットを公開して、ユーザーが写真を撮ったときにアプリで「共有」できるようにします
  3. 共有すると、サーバーはミラー API から画像とともに POST (マルチパートだと思います) を受け取ります。注:ほとんどの画像認識では、Glass の 5mp ほどの高解像度は必要ないため、すべてを高速化するために画像を大幅に縮小しました。 .
  4. サーバー側で、画像を画像認識サービスにアップロードします。私は、現在は機能していない IQ Engines を使用しました。Google で簡単に検索すると、多くのサービスが表示されます。
  5. 引き続きサーバー側で、画像認識の結果を使用して、結果と画像などを含む新しいカードをユーザーのタイムラインに挿入します。
于 2014-10-06T02:40:49.363 に答える
0

OpenCV には、目、体、およびプレート番号を検出するための haarcascade があります。利用可能な機能については、次のリンクを参照してください。

https://github.com/Itseez/opencv/tree/master/data/haarcascades

目の検出については、以下を参照してください

Opencv - 目が閉じているか開いているかを検出する

于 2014-10-06T04:54:15.453 に答える