0

私は質問を明確にし、単純化しました:

次のようなデータがあります。

011100111110100111
111111111111110010
111100001111000011

データ ストリームの 1D レーン。各行は、1 または 0 を持つタイプの存在を示します。タイプは、ストリーム全体にチャンクで存在する傾向があります。行の垂直方向の順序は重要ではありません。

「1」グループの開始時と、「 1 」グループがすべての行/次元にわたって重なっている場所の両方で、次元が 2 つ以上のインデックスで一致するパターンを探しています。

比率が維持されている場合、パターンは近くの隣接するインデックスとオフセットできます。

D = ディメンション/行 N = ストリーム内のインデックス

(( D1(N), D25(N+4), D900(N-1) ), ( 3, 67, 90, 3000 ))

複数の場所で発生する可能性のあるパターン マッチの例。N の Dimension01、インデックス N + 4 の Dimension25、インデックス N -1 の Dimension900 は、インデックス 3、67、90、および 3000 で発生します。

返されるパターン:

  • 一致するインデックスの数またはパターン内の次元の数によって並べ替えられます。
  • 少なくとも 2 つの点で少なくとも 2 つの寸法を一致させる

これについてどうすればよいですか?

4

1 に答える 1

0

私が理解している限り、Frequent Itemsset Miningのアプローチは、あなたが探しているものかもしれません。出発点として、有名なAprioriアルゴリズムを調べます。これは、例で「1」要素の共通ブロックを検出する最も基本的な手法の 1 つです (各列を独立した次元として解釈できると仮定し、次元間の特定のセマンティック/関係。次元の順序が意味を持つようになるため、問題が修正されます)。

于 2014-01-23T15:18:43.223 に答える