こんにちは、逆伝播を使用してトレーニングされる単純な多層ネットワークを構築しています。現時点での私の問題は、データセット内の一部の属性が公称 (非数値) であり、それらを正規化する必要があることです。私は最善のアプローチが何であるかを知りたかったのです。私は、属性ごとに個別の値がいくつあるかを数え上げ、それぞれに 0 と 1 の間の等しい数を割り当てるという方針に沿って考えていました。たとえば、属性の 1 つに A から E の値があった場合、次のようにすると適切でしょうか?:
A = 0
B = 0.25
C = 0.5
D = 0.75
E = 1
私の質問の 2 番目の部分は、出力を非正規化して公称値に戻すことです。数値表現を取得するために、最初にデータセット内の個別の出力属性値ごとに上記と同じことを行いますか? また、ネットワークから出力を取得した後、どちらの数値に近いかを確認するだけですか? たとえば、出力として 0.435 を取得し、出力属性値が次のように割り当てられた場合:
x = 0
y = 0.5
z = 1
y (0.5) である出力 (0.435) に最も近い値を見つけるだけですか?