私は機械学習分野に不慣れで、YouTube で見たものやインターネットで読んだものに基づいて、tensorflow のオブジェクト検出 API を使用してビデオ内の歩行者をカウントできる可能性があると推測しました。
その結果、テンソルフローについて調査し、テンソルフローのインストール方法に関するドキュメントを読み、最終的にテンソルフローをダウンロードしてインストールしました。github で提供されているサンプル ファイルを使用して、ここで提供されている object_detection ノートブックに関連するコードを調整しました -> https://github.com/tensorflow/models/tree/master/research/object_detection。
画面上の定義された関心領域を横切るオブジェクトの数を報告するように、visualization_utils.py スクリプトに変更を加えながら、収集したビデオで適応したコードを実行しました。つまり、人物クラスのバウンディング ボックスの寸法 (左、右、上、下) を収集し、定義された関心領域を横切るすべての検出をカウントしました (左右のピクセル値を持つビデオ フレーム上の 2 つの仮想垂直線のセットを想像してください。次に、検出された境界ボックスの左右の値を定義済みの値と比較します)。ただし、この手順を使用すると、プログラムによって検出されたにもかかわらず、多くの歩行者が見つかりません。つまり、プログラムはそれらを人として正しく分類しますが、カウントのために定義した基準を満たさない場合があるため、カウントされません。私が開発しようとしている単純な方法を使用するのではなく、コードを使用して一意の歩行者をカウントするより良い方法があるかどうかを知りたいです。私が使用しているアプローチは正しいものですか? 他のより良いアプローチはありますか?どんな種類の助けにも感謝します。
私は機械学習の専門家ではなく、単なる初心者なので、気楽にやってください。