encoding

動画像の高能率符号化

--- 動画をできるだけ小さなデータ量で，できるだけ原画に忠実に記録する技術 ---

　次の画像は，有名なテスト動画像である”フラワーガーデン”の第1フレームで，サイズは横176画素x縦120画素です．一般に，カラー画像では，ひとつの画素（ピクセル）は赤R，緑G，青Bの3原色で表され，RGB各データは256階調の 8ビット=1バイトで表されます．

フラワーガーデン第1フレーム
　さて，”動画像”とは，”静止画像”を時間的に並べたもので，我々の見ているテレビジョンでは毎秒30枚の静止画像が送られてきています．映画では毎秒24枚の画像が表示されています．

　いま，サイズ176x120の”フラワーガーデン”が毎秒30枚伝送される場合の毎秒当たりのデータ量を計算してみると，

176　×　120　×　30　×　3　＝　1.9 [MByte/s]

となります．こんなに小さな画像であっても，毎秒約2[MByte]ものデータ量となり，例えば640MByteの容量を持つCD-ROMに記録する場合を想定すると，

640　÷　2　＝　320 [秒] 　＝　6分20秒

しか記録できないことになります．このため，動画をできるだけ小さなデータ量で，できるだけ原画に忠実に記録する技術＝ 動画像の高能率符号化/圧縮符号化技術が必要となるのです．

　では，この研究で我々の目指す目標を簡単に説明しましょう．過去，動画像の圧縮符号化のため，非常に多くの方式が提案されてきましたが，一般にこれらに共通して，

総データ量を小さくして，”高く”圧縮すると，原画像との忠実度は低くなり，画質は悪化する．
逆に”軽く”圧縮すると，原画像との忠実度が高くなり，画質は向上する．

という性質があります．そのため，性能の高い圧縮方式とは，

小さなデータ量で　＝　1画素当たりの平均データ量を小さく
原画像に忠実に　＝　原画像との誤差を小さく，画質を高く

を同時に実現できるものと言えます．

　圧縮画像の画質（きれいさ）は，一般に，PSNR[dB]という尺度で計測されます．この値が大きいほど美しい画像/原画像に忠実な画像です．ざっくり言うと，

PSNR=40[dB]では，原画像と見分けがつかないくらい美しい
PSNR=30[dB]では，劣化が目につく
PSNR=20[dB]では，非常に汚く，見るに耐えない

ような画像と言えます．次の3つが，それぞれPSNR=20，30，40[dB]の画像です．

20[dB]/0.911[bit/pixel]

30[dB]/3.27[bit/pixel]

40[dB]/5.81[bit/pixel]

　現在，最も広く用いられている動画像の圧縮符号化方式は，良く知られた MPEG方式です．先の”フラワーガーデン”の動画像に対し，データ量もしくは圧縮率を変えながら画質を評価したものが下のグラフです． ※ グラフ中の画質1，画質2，画質3の点をクリックすると，対応する動画像を見ることができます．

フラワーガーデン0～59フレームをMPEGで圧縮した結果

　上の図から，高い圧縮率（小さなデータ量）でありながら高い画質を保つような圧縮符号化方式ほど，グラフの曲線（データ量--画質曲線）は左上に来ることが判ります．つまり，

良い圧縮符号化方式とは．．．

我々は，この図のように，”データ量--画質曲線”がなるべく左上に来るような方式の開発を目指しています．もちろん，MPEG方式を上回る方式でなければなりません．

　高能率方式を開発するための我々のアプローチを簡単に紹介しましょう． MPEG方式では，基本的に，1フレーム，1フレームを順に圧縮符号化しています．

MPEG圧縮符号化の基本

　一方，我々は主として，何枚かのフレームを”まとめて”符号化する方式を検討しています．

我々の目指す圧縮符号化の基本

これは，情報理論が教えるように，

データを圧縮する際には，なるべく多くのデータを溜めて一気に圧縮する方が高い効率が実現できる

という事実に基づいています．

　良く知られているように，MPEGでは離散コサイン変換（DCT）という変換が用いられ，次世代の静止画圧縮符号化方式であるJPEG2000ではウエーブレット変換（WLT）が用いられています．これらの方式では，上記「変換」を画像の縦と横の 2方向（2次元）にしか適用しませんが，我々の方式ではフレーム方向を加えた3方向（3次元）に適用します．さらに，動画像圧縮で広く用いられている動き推定/動き補償をも併用します．これらを工夫し，可能な限り性能の高い方式を見出すことを目標としています．

動画像の高能率符号化

--- 動画をできるだけ小さなデータ量で，できるだけ原画に忠実に記録する技術 ---

我々は，この図のように，”データ量--画質曲線”がなるべく 左上に来るような方式の開発を目指しています．もちろん，MPEG方式を上回る方式で なければなりません．

MPEG圧縮符号化の基本

我々の目指す圧縮符号化の基本

データを圧縮する際には，なるべく多くのデータを溜めて一気に圧縮する方が 高い効率が実現できる

詳しくは，発表文献をご参照下さい．

我々は，この図のように，”データ量--画質曲線”がなるべく左上に来るような方式の開発を目指しています．もちろん，MPEG方式を上回る方式でなければなりません．

データを圧縮する際には，なるべく多くのデータを溜めて一気に圧縮する方が高い効率が実現できる