9

現在、人間の追跡を含むコンピューター ビジョン アプリケーションの開発を開始しています。このプロジェクトで記録されるビデオのグラウンド トゥルース メタデータを構築したいと考えています。メタデータはおそらく手作業でラベル付けする必要があり、主に画像内の人間の位置で構成されます。メタデータを使用してアルゴリズムのパフォーマンスを評価したいと考えています。

もちろん、qt や opencv などを使用してラベリング ツールを構築することもできますが、これには何らかのデファクト スタンダードがあるのではないかと考えていました。私はViperに出くわしましたが、それは死んでいるようで、思ったほど簡単には機能しません. それ以外は、あまり見つけていません。

ラベル付けと評価の両方に使用するソフトウェア/標準/方法に関する推奨事項はありますか? 私の主な好みは、C++ 指向のものを使用することですが、これは厳しい制約ではありません。

よろしくお願いします!トム

4

4 に答える 4

5

私はvaticをもう一度見て、それを機能させました。これは、商用サービスを介したクラウドソーシングを目的としたオンラインビデオ注釈ツールであり、Linux上で実行されます。ただし、オフラインモードもあります。このモードでは、このソフトウェアの利用に使用されるサービスは不要であり、ソフトウェアはスタンドアロンで実行されます。

インストールは、同封のREADMEファイルに非常に詳しく説明されています。これには、とりわけ、appacheとmysqlサーバー、いくつかのpythonパッケージ、ffmpegのセットアップが含まれます。READMEに従えば、それほど難しくはありません。(プロキシに問題があると述べましたが、これはこのソフトウェアパッケージとは関係ありませんでした)。

オンラインデモを試すことができます。デフォルトの出力は次のようになります。

0 302 113 319 183 0 1 0 0 "person"
0 300 112 318 182 1 1 0 1 "person"
0 298 111 318 182 2 1 0 1 "person"
0 296 110 318 181 3 1 0 1 "person"
0 294 110 318 181 4 1 0 1 "person"
0 292 109 318 180 5 1 0 1 "person"
0 290 108 318 180 6 1 0 1 "person"
0 288 108 318 179 7 1 0 1 "person"
0 286 107 317 179 8 1 0 1 "person"
0 284 106 317 178 9 1 0 1 "person"

各行には、スペースで区切られた10以上の列が含まれています。これらの列の定義は次のとおりです。

1   Track ID. All rows with the same ID belong to the same path.
2   xmin. The top left x-coordinate of the bounding box.
3   ymin. The top left y-coordinate of the bounding box.
4   xmax. The bottom right x-coordinate of the bounding box.
5   ymax. The bottom right y-coordinate of the bounding box.
6   frame. The frame that this annotation represents.
7   lost. If 1, the annotation is outside of the view screen.
8   occluded. If 1, the annotation is occluded.
9   generated. If 1, the annotation was automatically interpolated.
10  label. The label for this annotation, enclosed in quotation marks.
11+ attributes. Each column after this is an attribute.

ただし、xml、json、pickle、labelme、pascalvocで出力を提供することもできます

ですから、全体として、これは私が望んでいたことを実行し、使いやすいものでもあります。私はまだ他のオプションに興味があります!

于 2012-06-14T14:24:38.760 に答える
3

LabelMeは、もう 1 つのオープンな注釈ツールです。私の特定のケースにはあまり適していないと思いますが、それでも言及する価値があります。ブロブのラベル付けに向けられているようです。

于 2012-06-14T15:07:00.577 に答える
2

これは、コンピューター ビジョンのすべての実践者が直面する問題です。本気なら、クラウドソーシングでやってくれる会社があります。でも、このサイトにリンクを張るべきかどうかはわかりません。

于 2012-05-31T08:27:53.687 に答える
1

画像分析用のモデルをトレーニングするためのグラウンド トゥルース データ セットを構築するための画像注釈に使用するツールを探すのと同じ問題がありました。

注釈に多角形のアウトラインが必要な場合、LabelMe は確実なオプションです。私は以前にそれを使用したことがありますが、うまく機能し、3D 特徴抽出に関してはいくつかのクールな機能が追加されています。LabelMe に加えて、 LabelDというオープン ソース ツールも作成しました。注釈を行うためのツールをまだ探している場合は、チェックしてみてください。

于 2016-08-24T22:55:44.017 に答える