7.人の目と機械の目     7.2 統計的処理

7.2 統計的処理

前ページ

 画像を改質あるいは強調する第一段階は、ヒストグラムを利用する方法です。アーク溶接では、アークの部分が背景に比べて格段に明るく、8ビット256階調では背景とアークの両方を明確に定量化することはできません。特定の近赤外波長域を撮影するか、CMOSカメラの入力部分を工夫して対数に変換して感度帯域を広げるなどの輝度変換が必要となります。まず、通常のアークの映像で考察していきます。
 上図左端に示したアークのカラー映像をYUV変換し、中央にYの映像のみを用いて表示しています。右端の映像は中央のY画像輝度のヒストグラムを平滑化して表示した例です。アーク近傍を切り出して表示しています。中央のY信号を用いた映像は、左端の映像の特徴を明瞭に表現しています。一方、右端の映像は雑音が多く元の情報が消えてしまい、状況を判別しにくくなっています。
 アークの領域に比較して、背景部の面積が大きくかつ輝度が0近くに集中しているために、輝度を平滑化すると、暗い部分が極端に増感され背景の雑音が目立ちます。この映像では背景部に暗幕を設置しており輝度は0に近くなる状況です。このため、背景部は無視できるような輝度変換が必要となります。
 
 上図左端は、輝度ヒストグラムを対数(log)で取り扱ってヒストグラムを平滑化したアークの映像です。この場合には何も処理しない映像とさほど大きな違いはなく、低輝度領域が少し強調されます。
 上図中央は、左端の画像に輝度ヒストグラムの平滑化処理の過程で度数に応じて補正処理を行った輝度変換の例を示します。256x100の階調を持つ輝度情報を256階調に縮小変換する際、各輝度の度数が総数(n)の1/256より大きい場合には、度数がn/256となるように置換し、この状態で再度総数を計算し直して同じ処理を繰り返します。この時点でのヒストグラムから平均化処理をして、256階調の輝度情報に変換しています。この輝度最適化により、暗い領域から明るい領域まで、必要な情報が適切に表示できることが理解できると思います。具体的には全体がのっぺり見えるアーク領域が実際には木戸の相違があり中心が明るく周辺が暗い状況を理解できます。また、全体的に暗く見えていた電極表面部の局所的な明るさの相違を判別できるようになっています。
 上図右端に、輝度ヒストグラムの平滑化を違う方法で実施した例を示します。[0,255001]の値域で度数を計算し、画素数の1/512より度数が高い輝度について、その輝度の度数を画素数/512の値とみなして平滑化した例です。アークの映像では、輝度の低い背景領域が大きな度数となっているため、低い輝度領域を明瞭に表示する方式となります。逆に電極直下のアークの部分の差異がほとんど判別できません。アークの表示の場合、アークの領域、電極の領域そして背景部分とでは輝度の差があること、および人の目で判別できる輝度差には限界があるため、輝度変換のみで、すべての領域を明瞭に白黒画像で表現するには無理があります。このように、1枚の画像中に強調すべき輝度区間が複数あり、背景領域では暗部強調が、電極や溶融池のような中間輝度部では中間部強調が、アーク領域のような明るい領域では明部強調が、それぞれ要求されるような場合には、単純な輝度変換では対応できません。
 右図に、各処理における輝度の累積度数を比較した例を示します。ヒストグラムの平滑化は本来この図で原点から右上まで直線的に増加させることを目指していますが、アークと背景の度数分布の特徴から、直線化は困難であり、なおかつ、必要な情報が表示しにくいという問題があります。
 それぞれの特徴を分かりやすく表示するためには、くっきり見せるにためのエッジ強調などの境界線の強調処理あるいは擬似カラー表示が必要となります。

 右図左端に、ここまでに示してきた3枚の白黒映像それぞれに色付けして重ね合わせた画像を示します。赤で示した画像が最もアーク現象を正確かつ広範囲に表示できることが分かります。また、一般的な輝度変換方式としては、最小値が0、最大値が255、中央値もしくは平均値が128になるように線形変換する方式があります。右図右端に、平均値を中間値とした変換を示します。この例のように、アーク溶接現象の表示の場合には、輝度の低い背景部と輝度の極めて高いアーク部とが存在し、中間領域の度数が小さくなる画像の場合には、この変換方式では不自然になるためあまり使用しません。

次ページ   2014.10.10作成 2018.1.1改定

小川技研サイト
統計のお勧め書籍

ビッグデータの掛け声とともに、統計学の書籍が多く出回るようになりました。ベイズに関する書籍が多いのですが、楽しく読める書籍を以下にお勧めします。
・確率と統計のパラドックス / 生と死のサイコロ, スティーヴン・セン, 青土社, ISBN4-7917-6164-2
・異端の統計学ベイズ, シャロン・バーチュ・マグレイン, 草思社, ISBN 978-4-7942-2001-1
・あやしい統計フィールドガイド / ニュースのウソの見抜き方, ジョエル・ベスト, 白揚社, ISBN 978-4-8269-0163-5
・統計科学のフロンティア11 甘利俊一 編, 岩波書店(2003.6), ISBN 4-00-006851-2
・本当はうそつきな統計数字, 門倉貴史, 幻冬舎新書, ISBN 978-4-16-376420-7

加齢と視野狭窄

 年齢重ねると共に周囲を視る能力が衰えることを痛感しています。
 大晦日にのんびりとした気分で、自分が出場した試合(UTUBE)をネットで観戦しました。50年前の高校生の頃、NHKで放映されたのが初めて自分が出場した試合が映像として流れた試合でした。あの頃はビデオ録画がまだ出来ない時代で、自分の目では自分のプレーが観ることのできない時代であったことを思うと、感慨新たです。
 味方のフリーキックをキーパーがハンブルし、それを押し込んだ(決勝点)時には、主観的にはプレーをスローモーションで感じていました。具体的には、キーパーがこぼしたボールとキーパーの動き(体勢)とを冷静に見極めて、ポジションを修正してファールにならないようにキーパーの股間に足を入れてシュートしました。しかし、実際のビデオでは本の一瞬でしかありませんた。主観と客観の時間の流れの違いを実感しました。
 さて、自分では試合中に周囲をよく見て全体を見てプレーしているつもりでしたが、やはり年とともに周囲を認識する力が衰えていることをビデオで実感しました。寒い日本から熱いチェンマイに行き、4日連続の80分ゲームの最終日と言うことで、疲れていたのは事実ですが、それにしてもほとんどダッシュしていない事は恥ずかしい限りです。1点リードしていて無理する必要が無い試合と言うことが走っていない理由ではあります。
 ヨーロッパのサッカーを見慣れている立場からは、自分のプレーなど見るべきではないというところが実感です。しかし何をするにも基礎体力次第、体の動きにつながらない視覚認識処理は無意味と言うことを再確認できたのは有意義でした。