1

したがって、基本的には、次のような長さが等しくないトレーニングおよびテスト データ セット (一連の配列) を扱っています。

a: {true, [1,3, 4, 5, 5, 8 ,10 ,10]}
b: {true, [1,3, 25, 18 ,1 ,10]}
c: {false, [1, 8 ,10]}
d: {false, [1,3  ,10 ,10]}

私は機械学習分野に不慣れで、これらの長さが等しくない入力配列を同じ長さにする方法に行き詰まっているため、既存の機械学習アルゴリズムを簡単に活用できます..

現在、Largest Common Sequence を使用して、長さが異なる入力配列間の類似性を見つけることが考えられます。

しかし、基本的に LCS 情報を取得した後、入力配列を同じ長さの配列に変換するにはどうすればよいでしょうか..?

私は正しい道を進んでいますか?誰か助けてくれませんか?

4

2 に答える 2

1

このようなタスクに対する一般的な解決策はありません。すべては、データが実際に何を表しているかによって異なります。さまざまな長さのデータでうまく機能する数十の特徴抽出手法がありますが、特定の機能の選択は特定のタスクによって異なります。可変長表現を固定長表現にする普遍的な方法はありませんし、ありえません。LCS は非常に奇妙なアプローチのように見えますが、これは非常に間違った結果をもたらすはずです (少なくとも一般的なケースでは、この特定の問題では意味があるかもしれません)。この場合 (LCS には意味があります) 、新しい表現の1 つの次元が返されます。これは、新しいベクターの1 つの機能にすぎません。合理的な機械学習手法を適用するには、さらに多くの技術が必要です。

于 2014-04-28T07:04:07.790 に答える
0

固定の入力と出力を必要とするほとんどの ML アルゴリズム。完全畳み込みニューラル ネットワークまたは再帰型ニューラル ネットワークは、さまざまな入力と出力で機能します。

しかし、あなたの状況では、最大をgrtすることをお勧めします。配列の長さを変更し、max よりも項目が少ない配列にゼロを追加します。

于 2017-08-19T20:52:35.830 に答える