一時データに 1D CNN を使用しています。2 つの機能 A と B があるとします。A と B の比率 (つまり、A/B) は重要です。この機能を C と呼びましょう。機能 C を明示的に計算して含める必要があるかどうか、またはCNN は、与えられた機能 A と B から機能 C を理論的に推測しますか?
深層学習では、相関性の高い機能 (機能 C など) を除外するのが最善であることは理解していますが、その理由はわかりません。
一時データに 1D CNN を使用しています。2 つの機能 A と B があるとします。A と B の比率 (つまり、A/B) は重要です。この機能を C と呼びましょう。機能 C を明示的に計算して含める必要があるかどうか、またはCNN は、与えられた機能 A と B から機能 C を理論的に推測しますか?
深層学習では、相関性の高い機能 (機能 C など) を除外するのが最善であることは理解していますが、その理由はわかりません。
短い答えはノーです。A/B
標準の DNN レイヤーを使用しても、この関係は自動的に取得されません。標準のレイヤーConv/Dense
は行列の乗算演算のみを実行するためです。
説明を簡単にするために、入力フィーチャが 2 次元であると仮定します。最初の次元はA
で、2 番目の次元は ですB
。この機能にレイヤーを適用すると、Conv
単純に重み行列w
とバイアスが学習されますb
y = w * [f_A、f_B] + b = w_A * f_A + w_B * f_B + b
ご覧のとおり、この表現ではA
との間の比率演算を模倣したり近似したりする方法はありませんB
。
featureや とC
同じようにfeature を使用する必要はありません。代わりに、フィーチャを個別の入力として保持することをお勧めします。そのダイナミック レンジはおよびのダイナミック レンジとは大きく異なる可能性があるためです。これは、各入力に独自の特徴抽出レイヤーがあり、両方の入力から得られた特徴を連結してターゲットを予測できる複数入力ネットワークを持つことができることを意味します。A
B
C
A
B