デジタルハイビジョンの画質について書きます。
2009年04月12日(日) 初版
2009年04月13日(月) 02版
2009年04月14日(火) 03版

戻る
とくばん から EXILE Someday
激しいダンス映像の為、ブロックノイズだらけの画像


なお、ほとんどの画面はこんな風に綺麗です。

ここの記述は価格.COMのクチコミの書き込みを元に書きました。
価格コム
地上デジタルハイビジョン放送を見ていて、画面が破綻した状態が多々散見されます。
【ハイビジョンって綺麗か?】
ニセモノの良心〜2006年06月11日/ハイビジョンって綺麗か?
【地上デジタルテレビジョン放送とは?】
地上デジタルテレビジョン放送
【ハイビジョンとは?】
ハイビジョン
特に気になるのが、フジテレビジョン系列で放送されている『笑っていいとも!』
のテレフォンショッキングのコーナーです。
どんな時に破綻するかというと・・・・
1.画面が切り替わった直後に
2.出演者が動くと、動いた部分がブロック状になる。
で、何でこんな事になるのかいくつか調べてみました。
まず、サンプル画像です。

笑っていいとも!に出ていた”つるのたけし”さんのまばたきのシーンです。
まばたきの瞬間、目の動きが早すぎて画像がブレルのならば判るのですが、
何だか目に縦に線が沢山走っています。
これは何でしょう?
次にこれです。

タモさんですが、顔に四角いブロックが出来ています。
これが、MPEG2圧縮特有のブロックノイズです。
【MPEG2とは?】
MPEG2
【ブロックノイズって何?】
ブロックノイズ
【動画圧縮って何?】
動画・・・動画圧縮
ブロックノイズを知る前に、MPEG2の画像圧縮の仕組みを簡単に説明します。

これは、草原(動かない)をバックに画面の中を風船が横切って行く図です。
MPEG2では、一番初めの図はそのまま圧縮しますが、2個目以降は
1個目の図との差だけを圧縮して記録します。
こうすることで、大幅にデータ量を小さくできます。
データ量としては、1個目が多く、続く2つは風船の分だけです。

さて、1個目の画像の後で、画面が切り替わって、全く違う絵が写ったら
どうなるでしょう?

2個目の画像の時に大量のデータが発生します。この大量のデータが曲者の様です。

DVDやブルーレイ、そして、インターネット経由の画像配信サービス
では、データを記録もしくは送信する量(ビットレート)を変えます。
これを可変ビットレート、VBRと言います。
【DVDって何?】
DVD
【ブルーレイって何?】
Blu-ray Disc
【可変ビットレートVBRって何?】
VBR
例えば、DVDソフトを作成する時に、画面が切り替わったり、撮影して
いる人や物が大きく動いている箇所ではビットレートを上げ、静止画が
続く場面ではビットレートを下げています。
これに対して、テレビ放送では、送信できるビットレートは一般的には一定です。
これをCBR、固定ビットレートと言います。元々送信できるビットレートが沢山あるならば、問題ありません。しかし、画像を圧縮しても、送信限界を超えるデータが発生したら、どうなるでしょう?
データを捨てる事になります。画面が切り替わって、かつ、切り替わった画面が大きく動いている時がこれに相当します。
次にMPEG2のGOPと言う、画面のグループについて見ていきます。
【GOPとは?】
GOP
MPEG2では、Iピクチャー、Pピクチャー、Bピクチャーという3つのデータを使い分けます。

I ピクチャーは入ってきた画像をそのまま圧縮します。従って、I ピクチャーがあれば、1つの画面が再現できます。
次にPピクチャーですが、1つ前のIピクチャーかPピクチャーとの差を求め、圧縮します。
最後に、Bピクチャーですが、前後のI ピクチャーかPピクチャーを使って前後の差を圧縮します。
I ピクチャーは単に圧縮しただけなので大量のデータが発生します。I ピクチャーは時間軸の圧縮をしていません。
Pピクチャーは前の画像との差だけを記録するので通常、データは小さくなります。Pピクチャーは時間軸の圧縮を使っています。
Bピクチャーは、前後の画面から差分のデータを作り、データはさらに少なくなります。
ピクチャーの並びは通常、
I B B P B B P B B P B B P B B・・・・ という15個を1つのグループとします。これをGOPと言います。
つまり、15フレームに1個しか完全な画像は無い事になります。時間にすると0.5秒です。逆に言うと、0.5秒以上は画像の破綻は伝搬しないということです。ただし、0.5秒毎に別々の動く画面に切り替わったら、破綻し続けます。
なを、この並びは別の構成もとれます。
例えば、I P I P I P I P ・・・・という構成もとれます。こうすると、画面が破綻する事は少なくなりますが、MPEG2圧縮の恩恵は受けられなくなり、データ量が多くなってしまいます。
I I I I I ・・・・・ という構成にすれば、絶対破綻しなくなりますが、これではMPEG2ではなく、まるでモーションJpegです。
地上デジタル放送ではこの画面の破綻がよく起きます。BSではあまり起きません。
これは、地上デジタル放送が約17Mbpsで伝送しているのに対して、BSでは24Mbpsまで余裕があるからです。

録画データを見ると、地上デジタル放送のビットレートは16.74Mbps(上記では画像のみに見えるが、データ放送と音声込みこみらしい)、音声は256kbps(普通のステレオ時)です。
音声には5.1chステレオ(サラウンド)やBモード(相当)ステレオもあります。
【BS放送のビットレートの情報】
BS放送のビットレート
地上デジタル放送でも、録画放送では破綻がめったに起きません。笑っていいとも!は生放送でかつ全国ネットです。それから、放送局のスタジオではなく、スタジオアルタでの収録です。
ここに何か違いがあるのかもしれません。録画放送に使っているMPEG2エンコーダーが賢いのかもしれません。即時に放送しなくていいので、DVDのオーサリングの様に、2パス
エンコード(1回エンコードして、破綻する部分を記録して、そこに重点的にビットレートを配分して再度エンコードする)をしているのかもしれません。
もしかしたら、笑っていいとも!は、スタジオアルタに有る、安価な性能の劣るエンコーダーで圧縮してからフジテレビに送っているのかもしれません。こればっかりは判りませんが。。。。。
では、どうすればいいのでしょう?
DVD等では、GOPの構造を変える事で対応することがあるそうです。
本来、PやBピクチャーであるタイミングであっても、画面ががらりと変わったら、シーンチェンジを検出して強制的にそこだけI ピクチャーに置き換えるそうです。
しかし、記録媒体であるDVDと違って、固定ビットレートである放送ではこの方法は使えないのかもしれません。
考えたのですが、こんなのはどうでしょう?

エンコーダーは2種類用意します。1つは通常のエンコーダーです。2個目は入ってきた画像に空間フィルターをかけ、高域成分をカットしてからエンコードします。この画像はちょっとぼけた画像になります。あんまりボケると違和感がありますので、2/3程度にします。この段階で、出力されるデータも2/3程度に抑えられます。
通常のエンコーダーの出力を監視します。画面チェンジなどがあって、ビットレートオーバーが検出されたら、このGOPの15フレームは、低解像度のエンコードデータを送出します。
問題点としては、画面が変わる前から画面の解像度が不自然に落ち、0.5秒間ボケ、急に復旧することです。
次の案としては、
1.Iピクチャーとして高ビットレート(通常)と低ビットレートの2つを用意しておく。解像度は制限しない。
2.画面が切り替わったら、そこのGOPは低ビットレートのデータを使う。
3.余った帯域は画面変化後のPとBピクチャーに重点的に配分し、画面の破綻の伝搬を防ぐ。
別の案としては、3タイプの解像度でエンコードしておき、画面が変わる瞬間と前後だけ低解像度として、高解像度=>中解像度=>低解像度=>中解像度=>高解像度と切り替える。これによって、画面が切り替わった瞬間に大量のデータが発生してデータがあふれるのを防止する。

他には、もう、特許出願されているだろうけど、人の顔や体を検出してそこに重点的にビットレートを配分すれば、気になるブロックノイズが減るでしょう。
=>監視カメラ用の圧縮方式として2009年3月に発表有り。ただしH.246。
ところで、笑っていいとも!で使っているエンコーダー、新しくならないかな・・・・
ブロックノイズが激しいんですけど。。。
シーンチェンジ後のタモリさん

シーンチャンジ直前の画像

シーンチェンジ直後の矢部さん。顔がブロック状になっている。

約0.5秒後、Iピクチャーで画像が更新され、安定した画像

画像を20kbのJPEGに圧縮する時に、そのままではブロックノイズが出てしまう場合でも、解像度を半分に落とせば同じ20kbでもブロックノイズが出ません。2者選択ならば、どちらが自然でしょうか?

【参考情報】
【「デジタル放送用HDTV 高圧縮技術に関する研究開発」2003】
「デジタル放送用HDTV 高圧縮技術に関する研究開発」
【まんぼうのつれづれ日記/デジタル放送のパラメータ】
デジタル放送のパラメータ
【NEC技報2004エンコーダの開発】
エンコーダの開発
2パス・リアルタイム・エンコード。地上デジタル放送で使用。
【東芝レビューVol.59No.2(2004)/地上デジタル放送用スタジオシステム機器】
地上デジタル放送用スタジオシステム機器エンコーダ
新映像符号化アルゴリズムによりBSデジタル放送での18 Mbpsの画質を14 Mbps以下で実現。VBR(Variable Bit Rate)化。低ビットレート時の余った帯域はデータ放送で使用可能。
【Renesas EDGE 動画像のリアルタイム圧縮符号化技術】
エンコード・ビットレート例
【H18.NHKスーパーハイビジョン・エンコーダーMPEG2版】
スーパーハイビジョン
【マルチメディア技術論・2007.6.18 藤木文彦殿】
MPEG画像圧縮の理論、I,P,Bピクチャ−
【2004年・NEC/地上デジタルテレビジョン放送送出用エンコーダVC-5300】
エンコーダのパンフ
HDTVにて11Mbpsのビットレートでも高画質を実現。VBR(Variable Bit Rate)符号化対応。
【2004年・NEC/地上デジタルテレビジョン放送送出用エンコーダVC-5300】
NEC技報2004
【可変ビットレートVBRについて】

記録メディアであるDVDやブルーレイでは、定速より早いレートでのデータ転送が可能です。ですから、DVD等で可変ビットレートを実施すると、瞬間的に標準転送レート以上のデータを転送でき、これで画質を良くでます。しかし、放送は固定の帯域をいかに使うかしかありません。新しいエンコーダー(と言っても2003〜2004年ごろ)ではVBRが使えます。ただし、今の地上デジタルの最大転送レートは約17Mbpsであることに変わりません。瞬間的にデータ放送の領域を使いきって放送でき、静止画の時にデータ放送のデータを送ることができます。どこの放送局がVBRを使っているのか、使っていないのかは、???????
【地上デジタルとBSデジタルのビットレートについて】

計算上、ほとんどのBSデジタル放送は最大26.1Mbpsまで伝送可能です。ただし、画像の他に、音声(0.3Mbps程度?)、データ放送(?Mbps)、EPGデータ(?Mbps)などにも帯域を割らねばなりません。どうやら、BS放送は瞬間的には24Mbpsを超え、25Mbpsまで伝送している様です。地上デジタルはどう頑張っても16.7Mbps。たぶん15Mbpsが限界ではないでしょうか?BS12ch=TwellVを見ていると、動きが少ない番組ばかり(ショップチャンネルばかり)なので破綻した画面を見ることがありません。新しいエンコーダーを使っているのでしょうか??????
戻る
|