私は圧縮アルゴリズムをあまり使用していないので、しばらくお待ちください。これは、一部の人には明らかかもしれません。ストリーミングビデオが遅れ始めたときに私がいつも気づいたことがあります。この質問を見たとき、私は興味があったことに気づきました。
私はピクセル自体について話しているのではなく、圧縮から生じるグリッドのようなレイアウトについて話しているのです。これはどのようなアルゴリズムまたは手法を示していますか?それについて何を教えてもらえますか?
私は圧縮アルゴリズムをあまり使用していないので、しばらくお待ちください。これは、一部の人には明らかかもしれません。ストリーミングビデオが遅れ始めたときに私がいつも気づいたことがあります。この質問を見たとき、私は興味があったことに気づきました。
私はピクセル自体について話しているのではなく、圧縮から生じるグリッドのようなレイアウトについて話しているのです。これはどのようなアルゴリズムまたは手法を示していますか?それについて何を教えてもらえますか?
MPEG-2に関するこのウィキペディアの記事をご覧ください。その一部を引用するには:
簡単に言うと、生のフレームは8ピクセル×8ピクセルのブロックに分割されます。各ブロックのデータは、離散コサイン変換によって変換されます。結果は、係数の8x8行列です。変換は、空間変動を周波数変動に変換しますが、ブロック内の情報は変更しません。元のブロックは、逆余弦変換を適用することで正確に再作成できます。
言い換えると、表示されるグリッドのような構造は、このDCTが8x8ブロックのピクセルに適用された直接的な効果です。
ブロックの根拠は、場所と頻度のトレードオフに関連しています。イメージは、圧縮によるアーティファクトがより局所化されるように、スペクトル ドメイン ( DCT )での圧縮の前にブロックに分割されます。標準の JPEG では、ブロックは画像全体で一定のサイズです。JPEG2000 などの最近の形式では、ブロックはウェーブレットを使用して画像に適合されます。ビデオ形式の詳細については詳しくありませんが、理論的根拠は同じです。
これは、オーディオ コーディング (mp3) の場合と同じ現象です。オーディオ ファイル全体のスペクトルを計算する代わりに、ファイルをいくつかのサンプル (通常、44.1 kHz 信号の場合は数百) のいくつかのセクションに分割します。同様に、圧縮データの破損 (ネットワーク、ファイルの破損) がある場合、ウィンドウの欠落によるノイズが聞こえます。
これはマクロブロッキングと呼ばれます。