動画像の高能率符号化
--- 動画をできるだけ小さなデータ量で,できるだけ原画に忠実に記録する技術 ---
次の画像は,有名なテスト動画像である”フラワーガーデン”の第1フレームで,
サイズは横176画素x縦120画素です.一般に,
カラー画像では,ひとつの画素(ピクセル)は
赤R,緑G,
青Bの3原色で表され,RGB各データは256階調の
8ビット=1バイトで表されます.

フラワーガーデン第1フレーム
さて,”動画像”とは,”静
止画像”を時間的に並べたもので,我々の見ているテレビジョンでは
毎秒30枚の静止画像が送られてきています.映画では
毎秒24枚の画像が表示されています.
いま,サイズ176x120の”フラワーガーデン”が毎秒30枚伝送される場合の毎秒当た
りのデータ量を計算してみると,
- 176 × 120 × 30 × 3 = 1.9 [MByte/s]
となります.こんなに小さな画像であっても,毎秒約2[MByte]ものデータ量となり,
例えば640MByteの容量を持つCD-ROMに記録する場合を想定すると,
- 640 ÷ 2 = 320 [秒] = 6分20秒
しか記録できないことになります.このため,動画をできるだけ小さなデータ量で,
できるだけ原画に忠実に記録する技術= 動画像の高能率符
号化/圧縮符号化 技術が必要となるのです.
では,この研究で我々の目指す目標を簡単に説明しましょ
う.過去,動画像の圧縮符号化のため,非常に多くの方式が提案されてきまし
たが,一般にこれらに共通して,
- 総データ量を小さくして,”高く”圧縮すると, 原画像との忠実度は
低くなり,画質は悪化する.
- 逆に”軽く”圧縮すると, 原画像との忠実度が高くなり,画質は向上する.
という性質があります.そのため,性能の高い圧縮方
式とは,
- 小さなデータ量で = 1画素当たりの平均データ量を
小さく
- 原画像に忠実に = 原画像との誤差を小さく,
画質を高く
を同時に実現できるものと言えます.
圧縮画像の画質(きれいさ)は,一般に,PSNR[dB]と
いう尺度で計測されます.この値が大きいほど美しい画像/原画像に忠実な画像です.
ざっくり言うと,
- PSNR=40[dB]では,原画像と見分けがつかないくらい美しい
- PSNR=30[dB]では,劣化が目につく
- PSNR=20[dB]では,非常に汚く,見るに耐えない
ような画像と言えます.次の3つが,それぞれPSNR=20,30,40[dB]の画像です.

20[dB]/0.911[bit/pixel]
|

30[dB]/3.27[bit/pixel]
|

40[dB]/5.81[bit/pixel]
|
現在,最も広く用いられている動画像の圧縮符号化方式は,良く知られた
MPEG方式です.先の”フラワーガーデン”の動画像に対し,
データ量もしくは圧縮率を変えながら画質を評価したものが下のグラフです.
※ グラフ中の画質1,画
質2,画質3の点をクリックすると,
対応する動画像を見ることができます.
フラワーガーデン0〜59フレームをMPEGで圧縮した結果
上の図から,高い圧縮率(小さなデータ量)でありながら高い画質を保つ
ような圧縮符号化方式ほど,グラフの曲線(データ量--画質曲線)は
左上に来ることが判ります.つまり,
良い圧縮符号化方式とは...
我々は,この図のように,”データ量--画質曲線”がなるべく
左上に来るような方式の開発を目指しています.もちろん,MPEG方式を上回る方式で
なければなりません.
高能率方式を開発するための我々のアプローチを簡単に紹介
しましょう.
MPEG方式では,基本的に,1フレーム,1フレームを順に圧縮符号化しています.

MPEG圧縮符号化の基本
一方,我々は主として,何枚かのフレームを”まと
めて”符号化する方式を検討しています.

我々の目指す圧縮符号化の基本
これは,情報理論が教えるように,
データを圧縮する際には,なるべく多くのデータを溜めて一気に圧縮する方が
高い効率が実現できる
という事実に基づいています.
良く知られているように,MPEGでは離散コサイン変換(DCT)という変換が用いられ,
次世代の静止画圧縮符号化方式であるJPEG2000ではウエーブレット変換(WLT)が
用いられています.これらの方式では,上記「変換」を画像の縦と横の
2方向(2次元)にしか適用しませんが,我々の方式ではフレー
ム方向を加えた3方向(3次元)に適用します.さらに,動画像圧縮で広く
用いられている動き推定/動き補償をも併用します.
これらを工夫し,可能な限り性能の高い方式を見出すことを目標としています.
詳しくは,発表文献をご参照下さい.