2

バイト配列があり、このバイト配列の内容が別のより大きな配列内に連続シーケンスとして存在するかどうかを判断したいと考えています。これを行うための最も簡単な方法は何ですか?

4

3 に答える 3

3

単純なアプローチは次のとおりです。

public static bool IsSubsetOf(byte[] set, byte[] subset) {
    for(int i = 0; i < set.Length && i + subset.Length <= set.Length; ++i)
        if (set.Skip(i).Take(subset.Length).SequenceEqual(subset))
            return true;
    return false;
}

より効率的なアプローチについては、KMPなどのより高度な文字列一致アルゴリズムを検討してください。

于 2009-06-19T23:25:40.910 に答える
3

いくつかの文字列検索アルゴリズムを適応させてみてください。最速の 1 つはBoyer-Mooreです。それもとても簡単です。バイナリ データの場合、Knuth-Morris-Prattアルゴリズムも非常に効率的に機能する可能性があります。

于 2009-06-19T23:29:31.180 に答える
0

これは、この回答の 1/1 ポートです: Searching for a sequence of Bytes in a Binary File with Java

そうするための非常に効率的な方法です:

public static class KmpSearch {

    public static int IndexOf(byte[] data, byte[] pattern) {
        int[] failure = ComputeFailure(pattern);

        int j = 0;
        if (data.Length == 0) return -1;

        for (int i = 0; i < data.Length; i++) {
            while (j > 0 && pattern[j] != data[i]) {
                j = failure[j - 1];
            }
            if (pattern[j] == data[i]) { j++; }
            if (j == pattern.Length) {
                return i - pattern.Length + 1;
            }
        }
        return -1;
    }


    private static int[] ComputeFailure(byte[] pattern) {
        int[] failure = new int[pattern.Length];

        int j = 0;
        for (int i = 1; i < pattern.Length; i++) {
            while (j > 0 && pattern[j] != pattern[i]) {
                j = failure[j - 1];
            }
            if (pattern[j] == pattern[i]) {
                j++;
            }
            failure[i] = j;
        }

        return failure;
    }
}
于 2010-03-23T03:03:34.537 に答える