問題タブ [object-detection-api]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1527 参照

tensorflow - tensorflow のオブジェクト検出 API はマルチクラス マルチラベル検出をサポートしていますか?

何時間もの調査の結果、オブジェクト検出 API を使用したマルチラベル予測の例を見つけることができませんでした。基本的に、画像内のインスタンスごとに複数のラベルを予測したいと考えています。以下の画像のように:

ここに画像の説明を入力

衣服のカテゴリだけでなく、色やパターンなどの属性も予測したいと考えています。

私の理解では、各属性ごとにより多くの分類ヘッドを第 2 段階の ROI 機能マップに追加し、各属性の損失を合計する必要がありますか? ただし、オブジェクト検出コードでこれを実装するのに問題があります。どの関数を変更し始めるべきかについて、誰かがヒントを教えてくれますか? ありがとうございました。

0 投票する
1 に答える
5480 参照

tensorflow - TensorFlow のオブジェクト検出を使用して歩行者をカウントする

私は機械学習分野に不慣れで、YouTube で見たものやインターネットで読んだものに基づいて、tensorflow のオブジェクト検出 API を使用してビデオ内の歩行者をカウントできる可能性があると推測しました。

その結果、テンソルフローについて調査し、テンソルフローのインストール方法に関するドキュメントを読み、最終的にテンソルフローをダウンロードしてインストールしました。github で提供されているサンプル ファイルを使用して、ここで提供されている object_detection ノートブックに関連するコードを調整しました -> https://github.com/tensorflow/models/tree/master/research/object_detection

画面上の定義された関心領域を横切るオブジェクトの数を報告するように、visualization_utils.py スクリプトに変更を加えながら、収集したビデオで適応したコードを実行しました。つまり、人物クラスのバウンディング ボックスの寸法 (左、右、上、下) を収集し、定義された関心領域を横切るすべての検出をカウントしました (左右のピクセル値を持つビデオ フレーム上の 2 つの仮想垂直線のセットを想像してください。次に、検出された境界ボックスの左右の値を定義済みの値と比較します)。ただし、この手順を使用すると、プログラムによって検出されたにもかかわらず、多くの歩行者が見つかりません。つまり、プログラムはそれらを人として正しく分類しますが、カウントのために定義した基準を満たさない場合があるため、カウントされません。私が開発しようとしている単純な方法を使用するのではなく、コードを使用して一意の歩行者をカウントするより良い方法があるかどうかを知りたいです。私が使用しているアプローチは正しいものですか? 他のより良いアプローチはありますか?どんな種類の助けにも感謝します。

私は機械学習の専門家ではなく、単なる初心者なので、気楽にやってください。