0

多値パラメーターである機能「スキル」があります。分類の特徴として使いたい。それを使用してモデルをトレーニングする方法がわかりません。

たとえば、ジョブには特定の必須スキル (Java、Node.js、MVC など) があり、ジョブごとに異なる可能性があります。パラメータの1つとしてスキルを使用する必要があります。

どんな助けでも大歓迎です。ありがとう。

4

1 に答える 1

2

多値機能を処理する一般的な方法は、それらを分割することです。データセットで考えられるすべてのスキルがわかっている場合は、個々のスキルごとに機能を作成します。スキルがサンプルに存在する場合、対応する特徴は 1 であり、そうでない場合は 0 です。

例えば

skill = "Java,MVC"

複数の機能に変わります:

Java = 1, Node.js = 0, MVC = 1

この方法の欠点は、多くの異なるスキルを持っている場合、特徴空間が爆発することです。これは、モデルが過剰適合しやすくなることを意味します。

于 2015-12-15T08:47:20.237 に答える