データセットで LSTM ニューラル ネットワーク (Keras パッケージ) を使用しましたが、モデルに依存しない方法を使用して、予測に対する変数の影響を見つけたいと考えています。データセットは 3 次元の配列です。IDごとに可変のタイムステップを持つ、それぞれ独自のシーケンスを持つ複数のIDがあります。私のデータセットの形状は次のようになります: (18610, 151, 18) (ID、時間ステップ、変数) および 1 つの時間ステップでの 1 つの ID の変数出力は次のようになります (予測クラス 1):
[2.00000000e+00 0.00000000e+00 2.10544316e-03 1.56082309e-03
0.00000000e+00 1.01647775e-01 0.00000000e+00 4.28571559e-01
6.95422174e-01 8.52459016e-01 1.20027614e-01 1.00000000e+00
0.00000000e+00 0.00000000e+00 0.00000000e+00 0.00000000e+00
0.00000000e+00 1.00000000e+00] 1
すべてのモデルに依存しないメソッド (私が見つけた限り) は、これらの 3 次元の配列データ セットでは機能しません。モデルを解釈できるように、変数の効果を見つける方法はありますか (Lime、部分依存プロット、または Shapley を使用しますか?)。全体的な解釈を調べるには、部分依存プロットを使用することをお勧めします。
これを行う方法を知っている人はいますか(サンプルコード付き)? よろしくお願いします!