これをaaabccba
入力文字列と見なすと、入力baaacacb
に Burrows-Wheeler 変換を適用した後の出力文字列になります。c
出力を観察すると、2 つの塊が分離されていることがわかります。明らかに、入力文字列は出力よりも優れた圧縮になります。
入力文字列に Burrows-Wheeler 変換を適用するかどうかを決定する方法は? 決定を下すために何らかの迅速な分析を行うことはできますか?
これをaaabccba
入力文字列と見なすと、入力baaacacb
に Burrows-Wheeler 変換を適用した後の出力文字列になります。c
出力を観察すると、2 つの塊が分離されていることがわかります。明らかに、入力文字列は出力よりも優れた圧縮になります。
入力文字列に Burrows-Wheeler 変換を適用するかどうかを決定する方法は? 決定を下すために何らかの迅速な分析を行うことはできますか?
BWT よりもはるかに高速なもの、たとえばlz4で圧縮してみて、どれだけ圧縮されるかを確認してください。次に、実験を通じて、アプリケーションに対して導出した基準に基づいて、BWT を適用する比率のしきい値を設定できます。