5.3 人間の目の特性(階調に対する感度)
前ページ
人間の目は輝度変化(明るさの変化)には敏感に反応しますが、色調の変化には比較的鈍感です。単調な画像で変化があまりはっきりしない領域部分(低周波領域)については、ちょっとした輝度/色の階調差に気が付きますが、変化の激しい領域(高周波領域)では少ない階調でもあまり不自然には感じません。つまり色調変化のデータ、或いは変化の激しい部分のデータを多少廃棄しても、人間にはその違いを区別することが難しい、と言うことになります。これはjpeg圧縮の際、変化に富み輪郭があいまいな画像の多い自然の風景の場合に圧縮の影響が少なく、コントラストがはっきりしており且つ輪郭以外は高周波成分が少ないCG画像では輪郭部分の歪みが目立ち易くなります。
これも、人の目が、変化の少ない平坦な部分から急に状態が変わるような部分は、 その変化点を注視するように見る習性があるためです。こういう特質を利用することで、画質の劣化をあまり「感じさせず」なおかつ高い圧縮が実現できます。
上図では、各色を256階調から2階調まで段階的に減らした画像を表示しています。左上から右にそれぞれ8,7,6,5ビットと左下から右にそれぞれ4,3,2,1ビット表示の画像です。上図のようにある程度複雑な(変化に富んだ)画像の場合には、階調を圧縮してもかなり人形と服の紋様の判別が可能となります。一方図柄と色の変化の少ない画像について同様に各色を256階調から2階調まで段階的に減らした画像を、下図に表示しています。左上から右にそれぞれ8,7,6,5ビットと左下から右にそれぞれ4,3,2,1ビット表示の画像です。この場合には変化の少ない領域での違いがかなり明瞭に判別できます。
以上に示した画像について、2階調でもある程度の判別ができるのは3色の情報があるためで、これが白黒画像になると以下のようになります。複雑な紋様だと8階調程度、単調な紋様だと32階調程度がある程度自然に見ることができる限界になります。
次ページ 2014.10.10作成 2019.8.13改定
小川技研サイト
空間FFT
・画像を一度周波数領域にフーリエ変換(FFT)した後、周波数領域で目的に合わせて編集し、周波数領域から画像空間領域に逆フーリエ変換(IFFT)して画質の改善を行います。
・周波数領域では空間周波数軸の原点を中心として、中心付近が低周波帯域で外側が高周波帯域になります。画像中の濃度エッジ成分は高周波成分を多く含むので、平滑化では高周波成分を削除し、エッジ先鋭化では低周波域を削除します。
・周期的な雑音はFFT変換によりスペクトルのピークを原点の回りに形成するので、それらを除去して周期的な雑音が除去できます。
光と視覚
・L.J.スナイダーによる フェルメールと天才科学者/ 17世紀オランダの「光と視覚」の革命, 黒木章人/訳,原書房(2019)には顕微鏡や望遠鏡に関する面白い逸話が記載されており、研究の合間に読むのに適した本です。
・下段の脳の画像処理で紹介した専門書では、具体的な対象に関する知識は深まりますが、過去から現在までにどのように科学が発展してきたのかその背景で当時の生活や人生観が研究の進捗にどのように作用したのかについての知識は得ることが出来ません。
・この本の舞台となったデルフトには5回行っており、いづれの訪問でもフェルメールとレーゥエンフックが住んでいたマルクト広場に面した宿に宿泊しました。観光案内で両者に関しても知ってはいましたが、当時はあまり両者に興味は持っておらず、記憶にも残っていないことが悔やまれます。
脳の画像処理
・最近の神経科学分野の研究によると、脳の一次視覚野では視覚情報はウェーブレット変換され 時間空間周波数領域の情報が多数のV1細胞の加減算で処理されている、とか。
・複数の一次視覚野の情報が統合されて高次視覚野へと流れ、位置と動きの情報を制御する背側経路と形と認識の情報を制御する腹側経路の二つに分かれて処理される。
・背側経路では、MT野からMST野へと続く複数の一次視覚野情報の統合過程での実質的加減算により、位置と動きとが情報処理されていることになる。
・腹側経路では空間周波数領域で曲率などを求めている。
・画像処理では、ピクセル情報から複雑な演算を行って特徴を抽出しているが、人間の脳は非常にエレガントな演算で、効率的に視覚情報を得ていることになる。
「質感の科学 / 知覚・認知メカニズムと分析・表現の技術」小松英彦, 朝倉書店(2016.10)