教師あり学習と教師なし学習の違いを理解しています。
教師あり学習は、ラベル付けされたデータを使用して分類器を「教える」方法です。
教師なし学習では、たとえばクラスタリングを使用して、分類器が「それ自体で学習」できます。
しかし、「弱教師あり学習」とは何でしょう?その例をどのように分類しますか?
教師あり学習と教師なし学習の違いを理解しています。
教師あり学習は、ラベル付けされたデータを使用して分類器を「教える」方法です。
教師なし学習では、たとえばクラスタリングを使用して、分類器が「それ自体で学習」できます。
しかし、「弱教師あり学習」とは何でしょう?その例をどのように分類しますか?
以下のいくつかのコメントが言及しているように、状況は私が 2013 年に最初に書いたほど単純ではありません。
一般的に受け入れられている見解は、
私の元の回答に沿った分類もあります。たとえば、Zhi-Hua Zhou の 2017 です。弱い教師あり学習の簡単な紹介では、弱い教師あり学習を包括的な用語と見なしています。
つまり、弱教師あり学習では、限られた量のラベル付きデータを使用します。
このデータをどのように選択し、正確に何を行うかは、方法によって異なります。一般に、簡単に取得できる限られた数のデータを使用したり、実際の違いを生み出したりしてから、残りを学習します。ブートストラップは、弱い教師あり学習で使用できる方法だと考えていますが、以下のベンのコメントが示すように、これは一般的に受け入れられている見解ではありません。
たとえば、Chris Bieman の 2007 年の論文を参照してください。概要については、ブートストラップ/弱教師あり学習について次のように述べています。
自己トレーニングとも呼ばれるブートストラップは、さらに少ないトレーニング例を使用するように設計された学習形式であるため、弱い教師付きと呼ばれることもあります。ブートストラップは、いくつかのトレーニング例から始まり、分類器をトレーニングし、再トレーニングのためにこの分類器によって生成された肯定的な例を使用します。トレーニング例のセットが大きくなるにつれて、パフォーマンスの低下につながる可能性のある否定的な例が多すぎて肯定的なものとして誤分類されない限り、分類器は改善されます。
たとえば、品詞のタグ付けの場合、通常、HMM (または最大エントロピーなど) タガーを 10,000 の単語でトレーニングし、それぞれに POS を付けます。監視が弱いタグ付けの場合は、数百語の非常に小さなコーパスを使用するだけで済みます。タガーを取得し、それを使用して 1000 語のコーパスにタグを付けます。その上でタガーをトレーニングし、それを使用してさらに大きなコーパスにタグを付けます。明らかに、これよりも賢くなる必要がありますが、これは良いスタートです。(ブートストラップされたタガーのより高度な例については、このペーパーを参照してください)
注: 弱い教師あり学習は、ノイズの多いラベルを使用した学習を参照することもできます (そのようなラベルは、ブートストラップの結果である必要はありません)。