通常の 2 クラスまたはマルチクラスの分類問題では、Naive Bayes や SVM などの有名な機械学習アルゴリズムを使用して、モデルをトレーニングおよびテストできます。私の問題は、ラベル変数が「20% 雨、80% 乾燥」または「30% 曇り、70% 雨」などの形式の気象データを受け取ったことです。この問題にどのように対処すればよいですか? どうにかして問題を回帰に変換する必要がありますか? その場合、データに 3 つのラベル (雨、乾燥、曇り) がある場合、パーセンテージ情報を連続値に変換する正しい方法は何でしょうか? 御時間ありがとうございます
2 に答える
1
Rain、Dry、Cloud という 3 つの出力ラベルを持つニューラル ネットワークをお勧めします。
ラベルが「20 % の雨」のデータがある場合、インスタンスの重みは 0.2 になります。「雨」ラベルがない場合は、「false」を含める必要があります。他のアプローチは、同じ変換規則を持つ 3 つの異なる回帰分類器です。回帰の方がうまくいくと思います。
ニューラル ネットワークは、3 つすべての回帰/分類を一度に実行でき、相互に影響を与える可能性があるため、適切な選択です。さらに、トレーニング アルゴリズムは簡単です。
于 2011-02-20T19:00:59.267 に答える
1
「20% 雨、80% 乾燥」および「30% 曇り、70% 雨」という表現が確率を表すと仮定すると、クラスは相互に排他的であり、可能な順序関係 (「乾燥 > 曇り > 雨」など) を無視できると仮定します。 ") その中でも、多項ロジスティック回帰などのモデルは、グループ化または複製されたかのように、これらの値に適合する場合があります。
たとえば、カルバック・ライブラーの発散を最小限に抑える、他のアドホックな手順も採用できると思います。
于 2011-02-21T02:44:20.557 に答える