9.GMA溶接現象の解析

9.1 輝度分布

前ページ

 高速度ビデオで撮影したデータを解析する際に最初にチェックするのは輝度分布(ヒストグラム)です。冒頭に掲げた影像のデータの輝度分布を右に示します。カラー映像なので、赤緑青(RGB)の各輝度の図を示しています。
 高速度ビデオでアーク現象を撮影して解析する際に悩ましい点を揚げておきます。1点目はカラー撮影の際に、RGBそれぞれの得られた輝度値と実際の明るさとの対応が実は良く分からない点があります。一般に高速度カメラでは、実際の輝度をカメラのメモリに格納する際A/D変換をします。このとき、ハレーションを起こさないように、一定程度以上明るいところの値は実際の値より低くなるように調整している機種が多く、高輝度値データでは直線性が得られない点があります。右図右端の赤い枠内で輝度分布が上昇しているのはそのためです。温度など定量的評価を行う際に障害となります。
 2点めは輝度0の処理です。定量的な評価においては0点が重要になりますが、低輝度領域では熱雑音などの影響を避けるために、ある値を閾値としてデジタルデータでは0とみなして処理している機種が大半です。このため、右の低輝度領域の拡大図に見られるように輝度0の値が異様に多く記録されます。
 通常の高速度カメラ内部のデータ処理は10−16ビットで処理され、映像として出力する際に、先ほどの0点位置から最高輝度までの値を8ビットに縮小変換しているため、細かくヒストグラムの分布を観察すると、その値がかなりばらついていることが分かります。このばらつきは解析処理に差ほど大きな影響はありませんが、各種変換の都度気づかないところで誤差が累積されることを意識しておくことは必要です。通常映像は全体のデータ量を圧縮するため、この圧縮処理によりこのように輝度分布データがばらつくことも多くあります。ここでは8ビット256諧調でデータを表示していますが、6ビット64階調でばらつきを押さえて表示することが一般的です。
 通常の自然を撮影する際には意識する必要はありませんが、アーク現象のように離散的なスペクトル分布を有する対象を撮影する際には、RGBそれぞれの素子の特性を百パーセント利用することはありません。現在対象にしているGMA溶接ではアーク領域が青みがかった色調で写されており、溶滴やスパッタは白色で撮影されています。このため、高輝度領域では赤と青の度数が高くなっています。一方緑色の度数は200以上の輝度ではほとんどなくなっています。
 右図は異なるシャッタ速度でGTA溶接を撮影した結果の典型的な輝度ヒストグラムの例です。この場合には、溶融金属は撮影されていないので、輝度分布では明るいアーク領域と暗い背景領域の2峰分布となります。黄色と青色で示したシャッタ速度が速く輝度がオーバフロー(飽和)しない場合には、2峰分布であることが明瞭に理解できます。しかし、赤色で示している明るいアークが飽和するような状態となると、データが飽和した高輝度領域でピークが現れピークが3つ出現します。さらにシャッタ速度が長くな黒色のデータではアーク領域ほぼ全てが飽和領域になり、アーク領域と背景領域とを何処で切り分けるべきか分からなくなります。
 また。この図の輝度分布では輝度値約20未満の度数が存在していません。このように、低輝度部分の輝度が0に切り捨てられていなければ、背景領域を推定することが可能になります。いっぽい、最初に示した高速度ビデオデータのように低輝度領域の値が0に切り捨てられた場合には統計的な推定が困難になります。
 現在解析対象としているGMA溶接では背景、アークの他に最も重要な溶融金属領域が存在する3峰分布になります。冒頭の分布図には背景やアーク及び溶融金属が輝度分布の何処に位置しているかを記入しています。溶接ワイヤ先端で形成される溶融金属が成長し、先端から離脱して飛行する課程の解析が対象なので、この溶融金属を以下では溶滴と記述します。
 右図に輝度値200以上の領域の輝度分布を示しているように、緑色はこの図には表れていません。前述したよう高輝度領域では意識的ににハレーション防止処理がされているために、右図に示されているように250以上の値で度数が増加しており、このカメラでは250以上の値は定量的に評価する際の誤差要因となることが分かります。
 もう一つこの図で注意すべき点は輝度値238付近で度数が低くなっているところが存在することです。これはイメージセンサ面に微細なほこりが付着し、下に示す映像に赤丸で示しているようにほこりの付着した面の輝度が小さくなっているために本来の分布からずれている可能性はあります。しかし、今のところ液滴がアーク内に存在しその輝度の領域に存在するため、液滴面積分の個数が低減しているのだろうと考えています。
 右に示している映像は、前頁に示した各瞬間の映像を全撮影区間(1089枚)チェックして各画素ごとに最大、平均、最小値を求めて表示した例です。上述したようにイメージセンサにほこりが付着しているところでは画像が暗くなっています。この映像は溶滴が熱カロリメータに落下するようにして撮影された映像で、溶滴以降が非常に安定している例です。このため、(a)最大値画像の中心線付近に明るく表示されている溶滴の部分は非常に狭い範囲に集中しています。(b)平均値画像では溶滴移行による影響が電極直下領域に若干認められます。(c)最小値画像では当然のことながら、溶滴の影響は全然無くアークが中心軸には対称ではなく偏向していることが分かります。
 右図に(1)全体の輝度分布、(2)最大値画像の輝度分布、(3)平均値画像の輝度分布(4)最小値画像の輝度分布について輝度値220以上を示しています。図中の平均値画像の輝度分布が急落を開始する最大輝度は250程度、最小値画像では237程度となっています。赤色の線で囲まれた範囲が液滴の輝度であろうと考えられる輝度です。青色の線で囲まれた領域の輝度はアークの輝度であろう領域内に存在する液滴により個数が減少したと考えられる領域です。そう考える理由は液滴が存在しない緑色で表示した平均値画像では分布度数の低下がほとんど見られないためです。
 全体領域を対象として輝度分布を作成した場合、状況の異なる局面のデータが混在することになり、正確な情報を把握することが難しくなります。一般的には、アークは電極からの距離に依存した特性を持ちます。この性質を意識して、右図は鉛直方向の輝度のヒストグラムから特徴量を抽出した例です。最大値はアークが存在するほぼ全ての領域で最高値の255であり、図として特には意味が無いので割愛しています。同様に最小値もほぼ0なので割愛しています。図に示している特徴量はRGB各色とも中間値、平均値と分散です。平均値は背景の低輝度領域の影響で中間値より低くなっています。分散は平均値の約半分の値となっており、ばらつきが大きいことを示しています。図中に示した範囲(B1−B6)は、この後現象を詳細に解析する際に、分別して解析処理を行うべきと判断している領域です。何故このように分類したのかについては後述します。
 溶滴が存在する高さ範囲が鉛直方向のヒストグラム図からわかるので、その範囲を水平方向の輝度ヒストグラムを計算して右図に示しています。この図は水平方向に走査した結果でなので液滴が存在する範囲は中央領域に限られており、各色の最大値分布を見ると液滴が存在する領域で分布が突出して高くなっていることが分かります。同時に赤色と青色は液滴の輝度が完全に飽和しており露出過多であり、液滴の輝度とアーク領域の輝度とを分離することが難しいことが分かります。一方、緑色については飽和していないため、定量的な解析に利用できることがわかります。同時に赤色はわずかにオーバーフローしているため定量的な解析に不備が生じる可能性を残しています。青色に関しては液滴領域の輝度は完全にオーバーフローしています。しかし、アーク領域はオーバーフローしていないことが分かります。
 右図はデータが飽和していないために実際の明るさと得られた輝度データの間に直線性が補償されている緑色のデータについての各種特性値をプロットした例です。比較のために液滴領域が完全に飽和している青色の最大値に0.4を掛けた値のデータを表示しています。この図から液滴以外の領域での青色データは緑色データのほぼ2.5倍であることが分かります。このことは、各画素で緑色の値と青色データに0.4倍した値とを比較し、緑色の値の方が大きければその画素は液滴領域、逆に小さければアーク領域と判断できることを意味します。
 青色の最大値と分散とを比較すると液滴が存在する領域での分散値が高く、アークの中の一部分に液滴が存在していることを裏付けています。また、平均値と中間値とがほぼ等しく、液滴が存在している領域についてのみ平均値が若干大きくなっていることからも、これからも液滴の存在が裏付けられます。これらの分布と最小値分布のいづれも左側に偏っており、上に示した平均値画像や最小値画像と一致した結果が得られています。
 本節では、アーク現象を解析するために、最初の段階で実施する輝度分布について紹介しました。画像解析はある意味ステップバイステップで実施する解析法です。解析を行い過程で、事前に考慮していなかった事実が明らかになる場合もあります。また、最初に頭の中で考えていた方法より効率的な方法が出てくる場合もあります。今までの経験から、このように章立てして解析を実施すればよいだろうとの判断で解析を実施しながら、文章とグラフとを作成してこのURLを作成しています。途中で違う方法の方は好ましいと判断し、取り扱う座標系や解析手法を変更した場合も多くあり、前後で整合性がとりにくくなっている部分も存在します。考え方のブレが分かるほうが新しく画像解析に取組む人には好ましいのでは、との判断で後からの修正は最小限にとどめています。

次ページ   2017.6.29作成 2017.7.19改定

小川技研サイト
代表値

代表値とはデータセットを代表する値で、何を持ってその代表と見なすのかについては、以下のようにさまざまなバリエーションが存在する。
・算術平均
 arithmetic mean
・調和平均
 harmonic mean
・幾何平均
 geometric mean
・最頻値
 mode
・中央値
 median
調和平均は三つの平均の中で常に最小、算術平均は最大となる。
正規分布のようにピークが一つで鮎歌いしょうな分布では、算術平均・最頻値・中央値は全て同じ値となる。

データのばらつき

データのばらつきに関する指標としては、標準偏差、四分位値がある。
・標準偏差は分散の平方根であり、分散は個々のデータと平均値の差の二乗和を個数で除した値
・データ分布の要約提示
2数要約=
算術平均値+標準偏差
3数要約=
中央値+四分位値
4数要約=中央値+
四分位値+最大・最小値

データの欠損

イメージセンサ表面に微細なほこりが付着するのはよくあることで、いつも気をつけてエアブラシで吹き飛ばすようにしてはいますが完全に綺麗に除去するのは結構難しいことです。
データ処理する際に気をつけなければいけないことは、最近の高速度ビデオカメラは非常に賢くて、各画素ごとにカメラが勝手にデータを自己修復することです。
丁寧にマニュアルを読み、カメラ内でデータをどのように取り扱っているのかを知らないと、思わぬところで間違いを起こしてしまいます。見た目が綺麗に見えるのですが、いざ定量的解析を始めると至るところで自己矛盾が顕在化してしまいます。まさに、悪魔は細部に潜むの見本です。