3

オブジェクト検出用の分類器を構築するアルゴリズムを探しています。分類子は、オブジェクトの特徴を介して交通シーン内の車を検出するために使用されます。ブースティングや複数インスタンス学習などのアルゴリズムを調べましたが、私の状況には適していないようです。ポジティブ サンプルとネガティブ サンプルの 2 つのデータセットがありますが、これらのセットにはわずかな割合のエラー (<10%) が含まれています。私の目標は、人間の介入なしにオンラインでデータセットを生成することであるため、データセットのエラーを手動で削除することはできません。

だから私の質問は、正と負のトレーニングセットで比較的小さな割合のエラーを処理できる分類器をトレーニングするための適切なアルゴリズム(存在する場合)を知っている人はいますか?

ありがとう、トム

4

1 に答える 1

0

すべての実世界のデータにはエラーがあります。特定のエラーがわかっている場合は、トレーニングする前にそれらをフィルタリングする必要があります。これらのエラーを検出する最善の方法は、分類子を段階的にトレーニングすることです。コーパスに追加して新しい分類子を再トレーニングするたびに、精度、再現率、および F1 をチェックする必要があります。新しい分類器のパフォーマンスが悪い場合は、取り消さなければならない作業コーパスにガベージを追加したことがわかります。

正確性を損なうため、コーパスにゴミを残してはいけません。信頼できないソースからデータを取り込んでいる場合、分類器を意図的に悪いデータで破壊する可能性があります。したがって、ゴールド スタンダード コーパスを確実に維持するために、新しいデータが分類器にフィードされる前に、ある種のフィルターまたはドメインの専門家が新しいデータを調べる必要があります。

于 2013-03-12T22:41:25.917 に答える