java - 可変長ビット文字列のバイナリデータを検索するにはどうすればよいですか?

Question

Javaで可変長ビット文字列を使用してバイナリデータをデコードする最良の方法を誰か教えてもらえますか?

例えば：

バイナリデータは 10101000 11100010 01100001 01010111 01110001 01010110 です。

次の 01、100、110、1110、1010 のいずれかの最初の一致を見つける必要があるかもしれません...

この場合、一致は 1010 になります。残りのバイナリデータについても同じことを行う必要があります。ビット文字列の長さは最大 16 ビットで、バイト境界を越えることができます。

基本的に、ヘッダーのハフマンテーブルから作成したビット文字列を使用して、JPEG をハフマンデコードしようとしています。私はそれを行うことができますが、それは非常に面倒です。バイナリデータを含むすべてを最初に Stringbuffers に変換していますが、それが正しい方法ではないことはわかっています。

文字列バッファにすべてをロードする前に、バイナリの数値だけを使用してみましたが、もちろん、00011 のようなコードの先頭の 0 を無視することはできません。ビットごとの演算子などを使用して、何らかの巧妙な方法があるはずです。これですが、ビットマスクや左方向シフトなどを説明するページをじっと見つめていましたが、まだ手がかりがありません!

助けてくれてありがとう！

編集：

すべての提案をありがとう。ハフマンのものでは標準的な方法のように思われるので、私は二分木アプローチを採用しました。ハフマンコードはツリーを使用して作成されるため、これは非常に理にかなっています。また、検索に必要なバイナリデータを大きな整数に格納する方法についても検討します。複数の回答を正解としてマークする方法がわかりませんが、ありがとうございます。

score 3 · Accepted Answer

ハフマン符号化データをデコードしているので、バイナリツリーを作成する必要があります。ここで、葉はデコードされたビット文字列をデータとして保持し、各ハフマンコードのビットは対応するデータへのパスです。ハフマンコードのビットは、ビットシフトおよびビットマスク操作でアクセスされます。葉に到達したら、その葉でデータを出力し、ツリーのルートに戻ります。非常に高速で効率的です。

score 1 · Accepted Answer

試してみることをお勧めします。プレフィックス検索用に明示的に設計されています。あなたの場合、それはバイナリトライになります。

java - 可変長ビット文字列のバイナリ データを検索するにはどうすればよいですか?

5 に答える 5

Related

Reference

java - 可変長ビット文字列のバイナリデータを検索するにはどうすればよいですか?