machine-learning - 多くの次元でのバイナリ範囲の一致の検索

Question

私は質問を明確にし、単純化しました：

次のようなデータがあります。

011100111110100111
111111111111110010
111100001111000011

データストリームの 1D レーン。各行は、1 または 0 を持つタイプの存在を示します。タイプは、ストリーム全体にチャンクで存在する傾向があります。行の垂直方向の順序は重要ではありません。

「1」グループの開始時と、「 1 」グループがすべての行/次元にわたって重なっている場所の両方で、次元が 2 つ以上のインデックスで一致するパターンを探しています。

比率が維持されている場合、パターンは近くの隣接するインデックスとオフセットできます。

D = ディメンション/行 N = ストリーム内のインデックス

(( D1(N), D25(N+4), D900(N-1) ), ( 3, 67, 90, 3000 ))

複数の場所で発生する可能性のあるパターンマッチの例。N の Dimension01、インデックス N + 4 の Dimension25、インデックス N -1 の Dimension900 は、インデックス 3、67、90、および 3000 で発生します。

返されるパターン:

一致するインデックスの数またはパターン内の次元の数によって並べ替えられます。
少なくとも 2 つの点で少なくとも 2 つの寸法を一致させる

これについてどうすればよいですか？

score 0 · Accepted Answer

私が理解している限り、Frequent Itemsset Miningのアプローチは、あなたが探しているものかもしれません。出発点として、有名なAprioriアルゴリズムを調べます。これは、例で「1」要素の共通ブロックを検出する最も基本的な手法の 1 つです (各列を独立した次元として解釈できると仮定し、次元間の特定のセマンティック/関係。次元の順序が意味を持つようになるため、問題が修正されます)。

machine-learning - 多くの次元でのバイナリ範囲の一致の検索

返されるパターン:

1 に答える 1

Related

Reference