filter - 6 タップフィルターとは何ですか? また、コーデック間でどのように異なるのですか?

Question

VP8デコードフレーズに関するある調査で、「6タップフィルターはいずれにしても6タップフィルターになり、違いは通常係数のみにある」ことがわかりました。では、6 タップフィルターとは、どのように機能するのでしょうか。

では、6 タップフィルターとは何か、またコーデック間でどのように異なるのか説明していただけますか?

score 4 · Accepted Answer

ビデオコーデックには、これらのフィルタが通常使用される場所が 2 つあります。

動き予測・補償

ビデオコーデックは、フレーム間の冗長性も取り除くため、静止画像コーデックよりもはるかに圧縮率が高くなります。これは、モーション推定とモーション補償を使用して行われます。エンコーダーは、画像を画像データの長方形のブロック (通常は 16x16) に分割し、現在コーディングされているブロックに可能な限り類似している、以前にコーディングされたフレームでブロックを見つけようとします。その後、エンコーダーは差分と、この良好な一致を見つけた場所へのポインターのみを送信します。これが、画像コーデックが 1:10 の圧縮を得るのに対し、ビデオコーデックが約 1:100 の圧縮を得る主な理由です。ここで、シーン内のカメラまたはオブジェクトがフルピクセルではなく、実際には半分または 4 分の 1 ピクセル移動することがあると想像できます。画像がスケーリング/補間されている場合は、より良い一致が見つかります。これらのフィルターはそのために使用されます。このフィルタリングを行う正確な方法は、多くの場合、コーデックごとに異なります。

デブロッキング

このようなフィルターを使用するもう 1 つの理由は、使用されている変換からアーティファクトを削除することです。静止画像のコーディングと同様に、画像データを「エネルギーを圧縮する」別の空間に変換する変換があります。たとえば、この変換の後、青空のような均一な色を持つ画像セクションは、色の数値が 1 つだけで、残りのデータはすべてゼロのデータになります。これをすべてのピクセルに青を格納する元のデータと比較すると、多くの冗長性が削除されています。変換 (DCT、KLT、整数変換の場合は Google) の後、ゼロは通常破棄され、残りのあまり関連性のないデータは、元のデータよりも少ないビット数でコード化されます。画像のデコード中にデータが捨てられてしまったので、これにより、隣接するブロックの 8x8 または 16x16 の間にエッジが生じることがよくあります。これらのエッジを再び滑らかにする別の平滑化フィルターがあります。

score 3 · Accepted Answer

6 タップフィルターは、6 次の FIR または IIR フィルター (おそらく FIR) です。係数は、フィルタの周波数応答を決定します。構造、係数、およびサンプルレートを知らなければ、フィルターについてこれ以上多くを語ることはできません。

filter - 6 タップ フィルターとは何ですか? また、コーデック間でどのように異なるのですか?

2 に答える 2

Related

Reference

filter - 6 タップフィルターとは何ですか? また、コーデック間でどのように異なるのですか?