整数のデータシーケンスをソートしました。2 つの数値の最大差は 3 です。たとえば、データは次のようになります。
Data: 1 2 3 5 7 8 9 10 13 14
Differences: (start 1) 1 1 2 2 1 1 1 3 1
差分値を保存するよりも、このタイプのシーケンスを保存 (圧縮) するより良い方法はありますか? 辞書ベースの方法を使用すると、数値 1、2、および 3 のランダム性が原因で圧縮に失敗したためです。「PAQ」スタイルの圧縮を使用すると、結果は良くなりますが、それでも満足できるものではありません。ハフマンおよび算術コーダーは、辞書ベースの方法よりも悪いです。
予測で何か方法はありますか?
たとえば、元のデータに対して回帰を使用し、差異を保存するよりも (小さいか、より一貫性がある可能性があります)。
または、違いのヒストグラムに基づいて何らかの予測を使用しますか?
または、まったく異なる何か....またはまったく不可能です(私の意見では、これが本当の答えです:))