4

ブロック サイズの影響と、DCT 圧縮で係数を選択する最善の戦略を理解しようとしています。基本的に私はここに書いたことを聞きたいです:

ビデオ圧縮: 離散コサイン変換とは?

最も原始的な圧縮を仮定しましょう。画像のブロックを作る。各ブログで DCT を実行し、いくつかの係数をゼロにします。

私の理解では、ブロックが小さいほど良いです。小さいブロックは、ピクセルがより相関していることを意味するため、DCT スペクトルのエネルギーはより「コンパクト」になります。高速で変化する画像 (高周波) では、より強調する必要があります。

係数の特定の割合をゼロにするとしましょう。ブロックのサイズが小さいか大きいかを問わず、最高の画質になるのはどれでしょうか? 10%、25%、50%、75% としましょう。異なるパーセンテージに対する別の答えだと思いますか?

もう 1 つの問題は、そのままにしておく係数をどのように選択するかです。エネルギーではなく場所に基づいて決定を下す必要があるとしましょう。左上隅から正方形を取りますか? DCT スペクトルの多くのブロックを平均して、左上隅から三角形を取得するのが最善であると結論付けました。どう思いますか?

有効な議論ができることを願っています。

4

1 に答える 1

9

ご質問の本質は画質に関するものと思われます。このテーマについてはかなりの文献が作成されており、その結果、画質を判断するのは困難です。

信号対雑音比 (SNR) や平均二乗誤差 (MSE) などの標準的な数学的誤差測定は、定量的な答えを与えることができますが、これらが視聴者の主観的な意見とうまく相関しないことはよく知られています。最終的な権限。視聴者の心理視覚モデルに基づくものであっても、他の方法はありません (例: SA Karunasekera と NG Kingsbury、「人間の視覚感度に基づいて画像内のアーティファクトをブロックするための歪み測定」、IEEE Trans. on Image Proc. vol. 4 , no. 6, June 1995, pp. 713 –724; M. Miyahara, K. Kotani, and VR Algazi, “Objective picture quality scale (PQS) for imagecoding,” IEEE Trans. on Comm. vol. 46, no. 9, Sept. 1998, pp. 1215 –1226)、SNR より優れていることが証明されています。

さらに、画像の種類 (線画、漫画、写真、ポートレートなど) を変えると、特定の種類の圧縮歪みがより顕著になります。ある画像ではモスキート ノイズが好ましくない場合がありますが、別の画像では階段のノイズが原因である可能性があります。

要するに、「最高の画質を実現するにはどうすればよいか」というあなたの質問に対する完璧な答えはありません。

そうは言っても、DCT に関連するいくつかのことを言うことができます。ブロックの DCT のピクセルは、左上隅 [(0,0)->(0,1)->(1,0)->(2 ,0)->(1,1)->(0,2)->etc.]、三角形の選択が反映されます。ピクセルが左上隅に近いほど、そこに含まれる情報は滑らかになり [実際、(0,0) DCT 値はブロック全体の平均です]、その隅から離れるほど、 「高頻度」の詳細が表示されます。画像の左上に近づくほど、その DCT 係数によって表現される水平方向と垂直方向の詳細が多くなり、ブロックの対角線に近づくほど、対角線の詳細が多くなります。

簡単に言うと、非可逆圧縮では、通常、目に見えない「詳細」の一部を破棄する必要があります。(「より滑らかな」DCT 値を破棄すると、深刻な歪みが発生します。) 破棄する DCT 値が多いほど、圧縮率は高くなりますが、歪みも大きくなります。

ブロックサイズに関しては、すべて依存します。ブロック内の分散と詳細が多ければ多いほど、係数を捨てることで失うものも多くなります。一部の圧縮アルゴリズムは、同じ画像内で異なるブロック サイズを適応的に使用するため、詳細度の高い領域はより多くの小さなブロックを受け取り、滑らかな領域はより少なくて大きなブロックを受け取ります。

1 つのブロック サイズを使用するアルゴリズムの場合、JPEG や MPEG などでは 8x8、16x16、32x32 が一般的です。それらを圧縮するために必要な処理は、適応ブロック サイズよりも小さくなりますが、品質も一般的に低くなります。

于 2009-12-24T15:56:17.763 に答える