1

練習のために、ニューラル ネットワークを使用して、2009 年のカップで知識発見とデータ マイニングに関する ACM Special Interest Groupによって述べられた分類 (2 クラス) の問題を解決することにしました。私が見つけた問題は、データセットに多くの「空の」変数が含まれており、それらを処理する方法がわからないことです。さらに2問目が登場。文字列などの他の非 10 進数の処理方法。あなたのベストプラクティスは何ですか?

4

1 に答える 1

1

ほとんどのアプローチは数値機能を必要とするため、カテゴリ別の機能はカウントに変換する必要があります。たとえば、特定の文字列がインスタンスの属性の中に存在する場合、その数は 1 であり、そうでない場合は 0 です。2 回以上発生すると、それに応じて数が増加します。この観点から、存在しない (または「空」である) 機能のカウントは 0 です。属性名は一意である必要があることに注意してください。

于 2012-10-11T11:10:09.007 に答える