3

パターンを見つけて、所有している HEX ファイルの出現回数で並べ替えたいと思います。

私は特定のパターンを探しているのではなく、そこで起こっている出来事の統計を作成して並べ替えるだけです。

DB0DDAEEDAF7DAF5DB1FDB1DDB20DB1BDAFCDAFBDB1FDB18DB23DB06DB21DB15DB25DB1DDB2EDB36DB43DB59DB32DB28DB2ADB46DB6FDB32DB44DB40DB50DB87DBB0DBA1DBABDBA0DB9ADBA6DBACDBA0DB96DB95DBB7DBCFDBCBDBD6DB9CDBB5DB9DDB9FDBA3DB88DB89DB93DBA5DB9CDBC1DBC1DBC6DBC3DBC9DBB3DBB8DBB6DBC8DBA8DBB6DBA2DB98DBA9DBB9DBDBDBD5DBD9DBC3DB9BDBA2DB84DB83DB7DDB6BDB58DB4EDB42DB16DB0DDB01DB02DAFCDAE9DAE5DAD9DAE2DAB7DA9BDAA6DA9EDAAADAC9DACADAC4DA92DA90DA84DA89DA93DAA9DA8CDA7FDA62DA53DA6EDA

これは HEX ファイルの抜粋です。例として、以下を取得したいと思います。

BDBDBDのXX回の発生

B93DのXX回の出現

ファイルをマイニングしてその出力を生成する方法はありますか?

4

3 に答える 3

2

もちろん。スライディング ウィンドウを使用してカウントを作成します (リンクは Perl 用ですが、アルゴリズムを理解するには一般的なようです)。パターンの名前はN-gramsです。ただし、最大パターンを制限する必要があります。

于 2009-12-14T21:45:07.583 に答える
0

正規表現を使用して、検索するパターンを作成できます。

必要な正規表現は非常に単純です。検索している正確なフレーズを使用してください。次に、使用している (指定しなかった) 言語に、一致数をカウントできる正規表現関数が必要です。

これを使用して、簡単なカウンターを作成します。

于 2009-12-14T21:35:01.217 に答える