1

私は最も頻繁な英語の単語を使用してテキストの大きなブロックを圧縮することを考えていましたが、lzwがこれをより良い方法で達成しているように見えるので、今では効率的ではないかと思います。

それでも、文章の構造を分析してデータの小さなチャンクにうまく整理することができ、解凍したときの構造はまったく同じではないため、文字を1つずつ圧縮するという感覚を揺るがすことはできません。 、従来の圧縮方法を使用できます。

「基本的な」NLPはそれを可能にしますか?

4

1 に答える 1

0

NLP?

標準の圧縮技術は、文字の代わりに単語に適用できます。これらの手法は、前の単語に基づいて、次の単語が何であるかに確率を割り当てます。ただし、文字よりもはるかに多くの単語が存在するため、これは実際には見たことがありません。その結果、低次のモデルでさえ、法外なメモリ使用量と過剰な実行時間が発生します。

于 2012-10-13T06:21:00.650 に答える