現在、車、バス、建物、橋、人間などの画像上のオブジェクトを認識し、インターネットを利用してオブジェクト名としてラベル付けできるiPhone用のアプリを作成しようとしています。
オブジェクト認識自体がデジタル画像処理、ニューラルネットワークなどを必要とする複雑なアルゴリズムであるため、私の問題の解決策を提供する無料のサービスはありますか?
これはAPIを介して実行できますか?
現在、車、バス、建物、橋、人間などの画像上のオブジェクトを認識し、インターネットを利用してオブジェクト名としてラベル付けできるiPhone用のアプリを作成しようとしています。
オブジェクト認識自体がデジタル画像処理、ニューラルネットワークなどを必要とする複雑なアルゴリズムであるため、私の問題の解決策を提供する無料のサービスはありますか?
これはAPIを介して実行できますか?
平面画像を認識したい場合は、Metaio、Qualcomm、Layarの現世代のモバイルAR SDKを使用して、照合する画像をアップロードし、照合を実行できます。
トヨタプリウスやエンパイアステートなど、3Dオブジェクトのセットと自由に一致させたい場合は、同じ手法を適用して、異なる回転で撮影された画像のセットと一致させることができますが、1つのオブジェクトのみを一致させることを選択する必要があります。サービスで使用できる画像データベースのサイズに制限があるため、またはカスタムソリューションについてはそれらの会社に問い合わせてください。最新の技術では平面画像と確実に一致するため、信頼性が高くない場合があります。
一般的なクラス(人間、車、建物)を認識したい場合、これは非常に難しい問題であり、オンラインで操作するのに十分な速さのソリューションはどこにもわかりません(ARソリューションが必要な場合の要件だと思います) -それは公正な仮定ですか?)私が履歴書を勉強してから数年が経ちましたが、当時、視覚的な分類の最も有望な解決策は「視覚的な言葉の袋」アプローチでした。それらを読んでみてください。
Cortexica を見てみましょう。このようなことに非常に役立ちます。
しばらくモバイル AR の作業をしていませんでしたが、前回この作業を行っていたときは、Layarを使用してJunaioの調査を開始していました。これらは単なるテキスト ラベルではなく、3D グラフィックスを対象としているため、ユース ケースではOpenCVを使用したほうがよい場合があります。
Layar (そして Junaio もそうだと思います) は Web アプリのように機能し、コンテンツを自分のサーバーに置き、Layar にリンク先の URL を与えることに注意してください。