5

VP8デコードフレーズに関するある調査で、「6タップフィルターはいずれにしても6タップフィルターになり、違いは通常係数のみにある」ことがわかりました。では、6 タップ フィルターとは、どのように機能するのでしょうか。

では、6 タップ フィルターとは何か、またコーデック間でどのように異なるのか説明していただけますか?

4

2 に答える 2

4

ビデオ コーデックには、これらのフィルタが通常使用される場所が 2 つあります。

動き予測・補償

ビデオ コーデックは、フレーム間の冗長性も取り除くため、静止画像コーデックよりもはるかに圧縮率が高くなります。これは、モーション推定とモーション補償を使用して行われます。エンコーダーは、画像を画像データの長方形のブロック (通常は 16x16) に分割し、現在コーディングされているブロックに可能な限り類似している、以前にコーディングされたフレームでブロックを見つけようとします。その後、エンコーダーは差分と、この良好な一致を見つけた場所へのポインターのみを送信します。これが、画像コーデックが 1:10 の圧縮を得るのに対し、ビデオ コーデックが約 1:100 の圧縮を得る主な理由です。ここで、シーン内のカメラまたはオブジェクトがフル ピクセルではなく、実際には半分または 4 分の 1 ピクセル移動することがあると想像できます。画像がスケーリング/補間されている場合は、より良い一致が見つかります。これらのフィルターはそのために使用されます。このフィルタリングを行う正確な方法は、多くの場合、コーデックごとに異なります。

デブロッキング

このようなフィルターを使用するもう 1 つの理由は、使用されている変換からアーティファクトを削除することです。静止画像のコーディングと同様に、画像データを「エネルギーを圧縮する」別の空間に変換する変換があります。たとえば、この変換の後、青空のような均一な色を持つ画像セクションは、色の数値が 1 つだけで、残りのデータはすべてゼロのデータになります。これをすべてのピクセルに青を格納する元のデータと比較すると、多くの冗長性が削除されています。変換 (DCT、KLT、整数変換の場合は Google) の後、ゼロは通常破棄され、残りのあまり関連性のないデータは、元のデータよりも少ないビット数でコード化されます。画像のデコード中にデータが捨てられてしまったので、これにより、隣接するブロックの 8x8 または 16x16 の間にエッジが生じることがよくあります。これらのエッジを再び滑らかにする別の平滑化フィルターがあります。

于 2012-07-25T12:15:35.877 に答える
3

6 タップ フィルターは、6 次の FIR または IIR フィルター (おそらく FIR) です。係数は、フィルタの周波数応答を決定します。構造、係数、およびサンプルレートを知らなければ、フィルターについてこれ以上多くを語ることはできません。

于 2011-05-04T16:41:01.040 に答える