画素の補間(Nearest neighbor,Bilinear,Bicubic)の計算方法

投稿日時: 2011年3月24日投稿者: Akira

画像を拡大や回転する場合など、画像の画素と画素の間の輝度値を参照する必要が出てきますが、その参照方法を紹介します。
この画素を画素の間を参照する事を一般に補間や内挿（Interpolation）と言います。

最近傍補間（ニアレストネイバー　Nearest neighbor）

Nearest neighborをそのまま訳すと、最も近いご近所、という事で参照する位置に最も近い位置にある画素の輝度値を参照します。

求める画素間の座標が（x,y）の位置の輝度値を　Dst(x,y) とし、もともとの画像の輝度値をSrc(i,j) とすると

で表されます。（ただし、[ 　] は小数部分の切り捨てを表します。）
つまるとこ、座標を四捨五入し、その画素の輝度値を参照します。

双一次補間（バイリニア補間　Bilinear）

バイリニア補間では求める位置(x,y)の周辺の２×２画素（４画素）を使って、輝度値を直線的に補間して、輝度値を求めます。

直線的に補間する方法は、たとえば下図のようにＸ座標が１８０と１８１の２点間の１８０．８の位置の輝度値を求めるのは、２点の位置の輝度値の比から簡単に求まります。

この処理を手前の２点間、奥の２点間についてＸ軸方向に補間処理を行い、さらに補間した２点の輝度値を用いて、さらにＹ軸方向に補間処理することで、目的の輝度値を求めます。
（Ｙ軸方向から先に処理を行っても結果は同じです。）

ちなみに、このBilinearの接頭語のbi-ですが、『二つの、双方向』というような意味があるそうです。
ということで、双方向からリニア（直線的）に補間したのが、このBilinearで、次に出てくるBicubicは双方向から三次関数で補間したのが、Bicubicです。

この補間処理を式で表すと、

となります。

双三次補間（バイキュビック補間　Bicubic）

バイキュービック補間では求める位置(x,y)の周辺の４×４画素（１６画素）を使って、輝度値を三次式で補間して輝度値を求めます。

この変換を式で書くと

となります。

ただし、Src(i,j)は求める座標（x,y）の周辺の輝度値を表し、下図のような配置とします。

また、Ｘ₁、Ｘ₂、Ｘ₃、Ｘ₄、Ｙ₁、Ｙ₂、Ｙ₃、Ｙ₄ は求める位置から参照する画素までの距離を表し、

と定義します。
関数h(t)はsinc関数(sinc(t) = sin(πt)/πt)　をテイラー展開により三次の項まで近似した関数で

だそうで．．．（詳細は良く分かってません。）
ａの値には－１前後がよく用いられます。

まとめ

各補間方法を使って、画像を拡大表示すると以下のようになります。

【元の画像】

赤い四角の部分を拡大表示します。

【Nearest neighbor】

【Bilinear】

【Bicubic】

これらの画像を見ても分かるようにNearest neighbor⇒Bilinear⇒Bicubicの順でギザギザなのがなめらかに拡大表示されます。

この変換を１次元的に輝度値のグラフで見てみると

となります。
ここで注意しないといけないのが、Bicubic補間がおおむね滑らかに輝度値を補間することが
できますが、最後のグラフを見ても分かるように、輝度値がオーバーシュート（アンダーシュート）ぎみ
になる場合があります。その場合は補間の式の　ａの値を　－０．２　程度のより０に近い値に
すると回避することができます。

←画像処理アルゴリズムへ戻る

円形度

投稿日時: 2011年3月22日投稿者: Akira

輪郭追跡を行うと周囲長を求めることができますが、この周囲長を用いた代表的な特徴量の円形度を紹介します。

円形度とは円らしさを表す値で値が１となる時、もっとも円に近くなります。
定義は面積（画素数）をS、周囲長をLとすると、

円形度　=　４πS/L²

となります。

【円形度の例】

	面積S = 96 周囲長L = 34.627円形度 = 1.006
	面積S = 87 周囲長L = 33.456円形度 = 0.977

なぜそうなるのか？理屈は簡単で、
円の半径をｒとすると、円の面積Sはπｒ^２、周囲長Lは２πｒより、

円形度　= 4πS / L² = 4π(πr²) / (2πr)² = 1

となり、円形度４πS/L²が１に近いときもっとも円らしいということになります。

←画像処理アルゴリズムへ戻る

【OpenCV-Python】円形度

輪郭追跡処理アルゴリズム

投稿日時: 2011年3月22日投稿者: Akira

二値化された画像において、各連結部分の境界部分を求める事を輪郭追跡といいます。
この輪郭追跡を行う事で周囲長や連結領域の幅や高さなどを求めることが出来ます。

以下、この輪郭追跡の処理アルゴリズムを紹介します。

まず、左上からラスタスキャンを行い、白の部分を見つけます。

最初の白の部分（上図の赤丸●の部分）をスタート地点として、反時計回りに輪郭の部分を検出します。
最初の白の部分は左上からラスタスキャンしたため、スタート地点の右上、上、左上、左には白の部分が無い事が確定しているので、最初に左下の部分から反時計回りに白の部分を検索し、白の部分が見つかったら次の輪郭へ検索を続けます。
最後にスタート地点に戻ったら処理は終了です。

この時、輪郭の向きを下図のように定義しておくと、

最初の図の輪郭は

０→０→１→０→２→３→４→３→２→５→５→６→４→０→６→５

の順で変化しています。（この番号はチェインコードといいます。）
ここにちょっとした規則があります。
例えば、０の次に５、１の次に６、・・・などは絶対に来ません。（なぜかは、ちょっと考えると分かります。）
一般的に表現すると、
一つ前の輪郭の向きから時計回りに３つ分の向きには輪郭が存在しない。
という事になります。
この性質を利用して、輪郭を検索するときは、
一つ前の輪郭の向きの値をVold
輪郭の検索を開始する向きの値を　Vnew
とすると、
Vnew = (Vold + 6) % 8; （％は８で割った時の余りの計算）
となるVnew の向きから輪郭を検索すれば効率的に輪郭を検索することが可能となります。

また、輪郭の周囲長を求める時、縦、横方向の輪郭は長さ１、斜め方向の輪郭は√２として
長さを足していくと、周囲長が求まります。

そして、ここからがあまり書かれていない注意点！
スタート地点の白の画素のパターンが以下のパターンとなる場合、スタート地点を２回通る事になるので、ご注意下さい。

※グレーの部分は白でも黒でもよい部分

←画像処理アルゴリズムへ戻る

ラベリング

投稿日時: 2011年3月21日投稿者: Akira

返信

二値化画像処理された画像において、白の部分（または黒の部分）が連続した画素に同じ番号を割り振る処理を
ラベリングと言います。

通常、同じ番号ごとの面積（画素数）や幅、高さなどの特徴量を求めて欠陥検査や分類処理などに用いられます。

ラベリングには、二値化された画像の縦、横方向に連続している部分を同じラベルにする４連結と、
縦、横、斜め方向に連続している部分を同じラベルにする８連結との２種類の処理があります。
（４近傍、８近傍という場合もあります。）

【二値化画像】

【４連結】		【８連結】

以下、８連結の場合において、ラベリング処理アルゴリズムを紹介します。

まず、画像全ての画素のラベル番号を０（ゼロ）で初期化しておき、ラベリングで番号を割り付けるための
ラベリング番号のルックアップテーブルを用意しておきます。（テーブルの使い方の詳細は後ほど）

そして、画像の左上からラスタスキャンを行い、画素の色が白の位置を検索します。

白の画素の左上、上、右上、左の画素のラベル番号を参照し、全て０（ゼロ）の場合は、最後に割り振った番号＋１のラベル番号を割り振ります。
もし、参照した画素のラベル番号が複数存在した場合は、最小の番号を割り振ります。

最初に番号を割り振った様子↓

この処理を左上からラスタスキャンして続けていきます。

新しい番号が割り振られるとき↓

新しい番号が割り振られるとき↓ その２

参照した画素のラベル番号が複数存在した場合、最小の番号を割り振ります。
このとき、用いなかったラベル番号（下図の例では３）のルックアップテーブルの番号を最小の番号に書き換えます。

同様に、処理を続けていきます↓

全ての白の画素に番号が割り振れれた様子↓

ただし、よ～く見ると、ラベル番号の２や３など、連続していない部分が存在している事に気がつきます。
そこで、ルックアップテーブルの出番です。

処理の途中でルックアップテーブルの番号を変更した番号を
２→１、３→１、６→５
に変更すると、連続した領域は同じ番号になります。

このまま番号を変更しても良いのですが、ラベル番号が虫食いになるのも気持ちが悪いので、以下のようにルックアップテーブルの番号を詰め直してから、ルックアップテーブルを参照し、全画素のラベル番号を修正すると、以下のようになります。

基本的なアルゴリズムは上記、紹介したアルゴリズムで良いのですが、ラベリング処理を行う画像のパターンによってはうまくラベル番号が割り振られない場合があります。
そこは、何とかして（ちょっと説明が難しい部分）うまく割り振られるようにチャレンジしてみて下さい。

参考までに、ラベリング処理をすると失敗しやすい特徴的な画像を添付しておきます。↓

◆Level.1

◆Level.2

◆Level.Max!?

ラベリング処理のアルゴリズムには、この手法の他にも輪郭線を追跡し、閉じた領域を１つのラベルとする手法や、ランレングス的に求める方法もあります。

←画像処理アルゴリズムへ戻る

細線化

投稿日時: 2011年3月21日投稿者: Akira

返信

二値化された画像において、線の中心１画素分だけを残すように線を細くする処理を細線化といいます。細線化のアルゴリズムにはHilditch、田村の方法、Zhang Suenなど、いろいろあるのですが、ここでは田村の方法について説明します。
細線化は黒の線を細くする場合と白の線を細くする場合が考えられますが、以下では白の線を細くするのを前提として説明しますので、黒の線を細くする場合は白と黒を読み替えて下さい。

	→
細線化処理前		細線化処理後

ざっくり言うと、収縮処理をすると線幅が細くなりますが、線の長さが短くなったり、細い線は消えてしまったりするので、線の端点や交点、線幅が１となった画素などを除去しないように条件を付けながら収縮処理を行います。

処理をフローチャートを以下に示します。

画像全体にラスタスキャンを行い、注目画素の３×３画素の並びがパターン１に該当する場合は中心の画素を除去（白から黒に変える）します。ただし、除去しないパターンに該当する場合は除去を行いません。

パターン１に該当する画素が１画素も無ければその時点で終了です。

次にパターン１の時と同様に３×３画素の並びがパターン２に該当する場合は中心の画素を除去（白から黒に変える）します。ただし、除去しないパターンに該当する場合は除去を行いません。

パターン２に該当する画素が１画素も無ければその時点で終了です。そうでない場合はパターン１の処理に戻り、除去する画素がなくなるまでパターン１、パターン２の除去処理を繰り返します。

←画像処理アルゴリズムへ戻る

膨張・収縮・オープニング・クロージング

投稿日時: 2011年3月21日投稿者: Akira

膨張・収縮処理では一般的に二値化された白黒の画像に対して処理が行われ、

注目画素の周辺に１画素でも白い画素があれば白に置き換える処理を膨張（Dilation）、
逆に周辺に１画素でも黒い画素があれば黒に置き換える処理を収縮（Erosion）といいます。

【元画像】

【膨張処理】

【収縮処理】

二値化された画像ではなく、グレー画像に対して処理を行う場合は、膨張の場合、注目画素の近傍の最大輝度値を注目画素の輝度値に置き換えます。
収縮の場合は最小輝度値に置き換えることでグレー画像に対して処理を行います。
この処理を二値化画像と区別するために、それぞれ最大値フィルタ、最小値フィルタと呼ぶ場合もあります。

【処理例】

	→		→		→
元画像		膨張		膨張
	→		→		→
膨張		収縮		収縮
	→		→		→
収縮		収縮		収縮
	→		→		→
収縮		膨張		膨張

膨張				連続処理

膨張・収縮処理は単独で処理を行う事はまれで、膨張・収縮を繰り返し処理を行う場合が多くあります。
とくに、同じ回数分だけ膨張して収縮する処理をクロージング（Closing）、

同じ回数分だけ収縮して膨張する処理をオープニング（Opening）とよびます。

	→
元画像		クロージング
	→
元画像		オープニング

この処理例を見てもわかるように、オープニング、クロージング処理では小さいパターン、細いパターンの除去を行います。

さらに、クロージングした画像から元画像を差し引いた処理をブラックハット（Black-Hat）、
元画像からオープニングした画像を差し引いた処理をトップハット（Top-Hat）といいます。

	→
元画像		ブラックハット
	→
元画像		トップハット

これらの処理を見ても分かるように、膨張・収縮処理を用いることで、欠け、断線、ホコリやゴミといった欠陥の検査や、細い線状のパターンの文字や線などの抽出への応用が考えられます。

←画像処理アルゴリズムへ戻る

アンシャープマスキング（鮮鋭化フィルタ）

投稿日時: 2011年3月21日投稿者: Akira

アンシャープマスキング【unsharp masking】とは、画像のボヤけた輪郭を強調するフィルタ処理です。

	→
アンシャープマスキング処理前		アンシャープマスキング処理後

【処理アルゴリズム】

元画像データ

↓

元画像データの平滑化処理を行い、元画像から平滑化データを差し引きます。

↓

差し引いた分を元画像に上乗せします

↓

この処理により、平滑化処理でボヤけてしまう分だけ、逆に輪郭をくっきりさせる事ができます。

この処理をカーネルで表現すると

となります。
ｋは任意レートで、値が大きいほど、輪郭が鮮明になる効果が高くなります。
（後半の元画像から平滑化画像を引いている部分の処理はラプラシアンフィルタと呼ばれます。）

今回は３×３のマスクサイズを例にとって紹介しましたが、マスクサイズを大きくするとマスクサイズよりも小さなパターンを強調する効果を得る事もできます。

←画像処理アルゴリズムへ戻る

エッジ抽出(Sobel,Prewittなど)

投稿日時: 2011年3月21日投稿者: Akira

下図のように画像の輪郭（エッジ）を抽出する方法を紹介します。

	→
エッジ抽出前		エッジ抽出後

上図はソーベルフィルタの例です。

微分フィルタ

画像の輝度値に対して、隣り合う画素の輝度差が大きいほど、画像のエッジだと考えることができ、
画像の輝度値データ画像輝度値データに対して

横方向の差分（偏微分）以下のカーネルで求めることができる。

0	0	0
0	-1	1
0	0	0

縦方向の差分（偏微分）下のは以下のカーネルで求めることができる。

0	1	0
0	-1	0
0	0	0

または

0	0	0
0	-1	0
0	1	0

※画像データの並びがボトムアップかボトムダウンかにより使い分けます。

このとき、エッジの強さは

エッジの傾きは

として求めることができる。

プリューウィットフィルタ(Prewitt filter)

微分フィルタではノイズに弱いため、横方向（または縦方向）のエッジを計算してから
縦方向（または横方向）に平均化処理を行う手法です。カーネルには以下とおりです。

横方向の差分

-1	0	1
-1	0	1
-1	0	1

縦方向の差分

1	1	1
0	0	0
-1	-1	-1

または

-1	-1	-1
0	0	0
1	1	1

ソーベルフィルタ(Sobel filter)

プリューウィットフィルタではノイズを除去するのに平滑化処理を行っていましたが、ガウシアン平滑化処理を行ったのがソーベルフィルタとなります。カーネルには以下とおりです。

横方向の差分

-1	0	1
-2	0	2
-1	0	1

縦方向の差分

1	2	1
0	0	0
-1	-2	-1

または

-1	-2	-1
0	0	0
1	2	1

←画像処理アルゴリズムへ戻る

メディアンフィルタ

投稿日時: 2011年3月20日投稿者: Akira

平滑化フィルタでは注目画素の周辺画素の輝度値を平均し、ノイズを除去していましたが、画像の輪郭もボケてしまう欠点がありました。それに対し、メディアンフィルタでは周辺輝度値の大きさを順に並べ、メディアン（中央値）を注目画素に置き換えることでノイズを除去します。
特に周辺画素の輝度値よりも大きく異なるノイズ（ゴマ塩ノイズとかスパイクノイズという）を除去するのに効果を発揮します。


メディアンフィルタ処理前	→	メディアンフィルタ処理後
輝度値の３D表示		輝度値の３D表示

処理の詳細

注目画素（画像中央の輝度値１６５の部分）周辺の輝度値を取得します。
６１、９６、４１、５７、１６５、３４、２４、３０、３１

この輝度値を順番に並べます。

２４、３０、３１、３４、４１、５７、６１、９６、１６５

並べた輝度値のメディアン（中央値）の４１で輝度値１６５を置き換えます。

この処理を全画素について行うと、ノイズを除去することができます。

ただし、平滑化処理に比べ、処理が重い．．．

もう少し具体例でいうとこんな感じ

【メディアン処理前】

【メディアン処理後】

←画像処理アルゴリズムへ戻る

ガウシアンフィルタの処理アルゴリズムとその効果

投稿日時: 2011年3月20日投稿者: Akira

移動平均フィルタでは注目画素周辺の輝度値を単に平均していましが、一般的な画像では注目画素に近い画素の輝度値は注目画素の輝度値と近い場合が多いですが、注目画素から遠くなればなるほど、注目画素の輝度値とは差が大きくなる場合が多くなります。
この事を考慮し、注目画素に近いほど、平均値を計算するときの重みを大きくし、遠くなるほど重みを小さくなるようにガウス分布の関数

を用いてレートを計算しているのがガウシアンフィルタです。
σの値が小さいほど平滑化の効果は小さくなり、大きいほど効果が大きくなりますが、
よく以下のカーネルが用いられます。

３×３の場合

５×５の場合

ガウシアンフィルタにはローパスフィルタと同様の効果があるそうです。

ということで、フィルタ処理した画像をフーリエ変換し、確かめてみました。

オリジナル（処理前）の画像はこちら↓

オリジナル画像	二次元フーリエ変換画像

上記の画像にノイズ除去系のガウシアンフィルタ、移動平均フィルタ、メディアンフィルタの
処理を行い、二次元フーリエ変換を行い確認してみました。

上記画像に５×５のガウシアンフィルタ処理を行うと

５×５のガウシアンフィルタ処理	二次元フーリエ変換画像

５×５の移動平均処理を行うと

５×５の移動平均処理	二次元フーリエ変換画像

５×５のメディアンフィルタ処理を行うと

５×５のメディアンフィルタ処理	二次元フーリエ変換画像

確かに処理結果を見てみると、ガウシアンフィルタが最も高周波成分を除去できているように
思います。

なぜ、そうなるのか？
本には数式においても、この効果が証明できるような事が書いてありましたが、ちょっと難しいので、
カーネルの値について見てみたいと思います。

そもそも、ある特定の周期の成分を消すためには、どうすれば良いか？というと、
周期の半分の離れた２点のデータを平均していけば、その周波数の成分を消す事が出来ます。

ここで、画像で表すことのできる最も高い周波数は

明暗明暗明暗明暗明暗明暗明暗明暗明暗

となる２画素周期のパターンで、このパターンを消すためには、隣り合う２画素の輝度値を
平均すると、画像データから最も高周波の成分を除去する事が出来ます。
しかし、隣り合う２画素の平均の結果は、画素間の位置の輝度値を示してしまうので、
この平均のさらに平均値を取ります。

連続する５つの輝度値の値をI_-2～I₂とすると、平均した値の平均値は

となり、なんとこの結果が３×３のガウシアンフィルタの横方向（縦方向）の係数と等しくなります。
さらに、平均の平均を取ると、５×５のガウシアンフィルタの係数と同じ。
７×７のガウシアンフィルタまで確認してみましたが、この平均の平均で表すことが出来るようです。

という訳で、ガウシアンフィルタの式

で表される係数なら何でも良いと思いつつも、

の係数が良く使われるのかも？しれませんね。

さらにこの係数、半分の半分で求めるのは、ちょっと面倒。
これがまた都合よく、（a+b）ⁿの式を展開したときの係数に使われる
パスカルの三角形の値

と一次元のガウシアンフィルタの係数と等しくなります。（少なくとも７×７ぐらいまでは）
これを以下のように二次元的に掛け合わせて、係数の合計で割ればガウシアンフィルタの係数となります。
例えば７×７のガウシアンフィルタの係数では下図のようになります。

この値を係数の合計（=4096）で割ればガウシアンフィルタの係数の出来上がり！！！
（このときσの値は約１．３となります。）

←画像処理アルゴリズムへ戻る

平滑化（移動平均）フィルタ

投稿日時: 2011年3月20日投稿者: Akira

平滑化フィルタは読んで字のごとく、画像の輝度値を平らに滑らかにするための手法です。
画像中のノイズを除去するために用いられます。

	→
	→
平滑化処理前		平滑化処理後

移動平均フィルタ（別名：平均化フィルタ、単に平滑化フィルタともいう）では、注目画素のその周辺の輝度値を用いて、

輝度値を平均し、処理後画像の輝度値とする手法です。

例えば、注目画素とその周辺の輝度値に以下のようなレートを掛け合わせて輝度値を求めます。

この３×３のレートの組合せの事をカーネル、オペレータ、マスクなどと言います。

とくに３×３である必要はなく、５×５の場合では

となります。

ただし、全てのレートを足し合わせて１になるように調整して下さい。

←画像処理アルゴリズムへ戻る

フィルタ処理の高速化アルゴリズム（重複した計算を行わない）

判別分析法（大津の二値化）

投稿日時: 2011年3月20日投稿者: Akira

判別分析法【discriminant analysis method】は大津の二値化とも言われ、分離度（separation metrics）

という値が最大となるしきい値を求め、自動的に二値化を行う手法です。

分離度はクラス間分散（between-class variance）とクラス内分散（within-class variance）
との比で求める事ができ、以下の様に求めます。

しきい値　ｔで二値化したとき、しきい値よりも輝度値が小さい側（黒クラス）の画素数をω₁、
平均をm₁、分散をσ₁、輝度値が大きい側（白クラス）の画素数を画素数をω₂、平均をm₂、
分散をσ₂、画像全体の画素数をω_t、平均をm_t、分散をσ_tとしたときクラス内分散σ_w²は

クラス間分散σ_b²は

としてあらわす事ができる。

ここで、全分散（total variance）σ_tは

としてあらわす事ができることから、求めるクラス間分散とクラス内分散との比である分離度は

となり、この分離度が最大となるしきい値 t を求めればよい。
ここで、全分散σ_tはしきい値に関係なく一定なので、クラス間分散σ_b²が最大となるしきい値を
求めればよい事が分かる。
さらにクラス間分散の式の分母もしきい値に関係なく一定なので、クラス間分散の分子

ω₁ ω₂ (m₁ – m₂)²

が最大となるしきい値　t を求めればよい。
結局、分散とか関係なく、黒、白それぞれの領域のヒストグラムから、画素数ωと輝度値の
平均値ｍから上記の値が最大となるしきい値ｔをしらみつぶしに求めればいいので、以外と簡単．．．

【処理例】

	→
	→
	→

上記例のように、判別分析法はおおむね良好な結果を得る事ができます。

←画像処理アルゴリズムへ戻る

Pタイル法

投稿日時: 2011年3月20日投稿者: Akira

Ｐタイル法【Percentile Method】は、画像の二値化したい領域が全画像の領域に占める割合をパーセント（％）で指定し二値化する手法です。

【処理例】

Pタイル法処理前

Pタイル法処理後

（二値化する割合を２３％で指定）

【処理アルゴリズム】

まず最初に画像のヒストグラムを取得します。

このヒストグラムを見ると、輝度値でおおよそ１６０前後で二値化すると、目的の画像が得られそうな事が分かります。

次にヒストグラムの輝度値が高い方から頻度を足していき、その頻度の合計が指定した割合を超える輝度値をしきい値とし、二値化処理を行います。

実際の処理では、例えば画像サイズが６４０×４８０画素だとすると、全画素数は３０７，２００画素なので、二値化する割合が２３％のときは２３％に相当する画素数は

３０７，２００　×　０．２３　＝　７０，６５６画素

なので、ヒストグラムの頻度を輝度値の高い方から（黒側の面積を指定する場合は低い方から）足していった時に７０，６５６画素を初めて超える輝度値を二値化のしきい値とします。Ｐタイル法では、二値化する領域の大きさが一定の場合、画像の明るさが変動しても、二値化された画像は変わらない事がメリットです。

一般にカメラから得られる画像の輝度値はカメラ本体の温度変化により変動し、ＬＥＤなどの照明も長時間使用していると暗くなる傾向があるので、固定しきい値による二値化処理よりも安定的に二値化処理を行うことが可能となります。もっとも、二値化する領域の大きさの変動が大きい場合は不向きです。

←画像処理アルゴリズムへ戻る

二値化

投稿日時: 2011年3月20日投稿者: Akira

二値化【Binarization】では画像の輝度値が指定した値（しきい値【Threshold】）以上の場合は白、値未満の場合は黒にする処理を行います。

	→
二値化処理前		二値化処理後

二値化処理では上図のように、しきい値付近に輝度値の変動がある場合、二値化処理を行うと点々とした画素が残ってしまうため、この場合は二値化処理を行う前に平滑化フィルタやメディアンフィルタなどのノイズ除去を行ってから二値化処理を行う場合が多くあります。また、二値化処理を行うと画像の輝度値は白と黒しかないため、白の輝度値を１、黒の輝度値を０とし、１画素を１ビットであらわす事ができ、画像データサイズを小さくすることができるのですが、１画素を１ビットであらわすと各画素の輝度値の参照がかえって面倒になってしまうので、画像処理のプログラムでは白の輝度値を２５５、黒の輝度値を０として、１画素８ビット（１バイト）で扱う場合の方が一般的です。（フォトレタッチ系のソフトでは１画素１ビットで扱う場合の方が多いと思います。）

【二値化処理の応用例】

欠陥検出
領域分割、抽出
処理領域のマスク（領域指定）

など

【二値化プログラム例】
●効率の悪いプログラム例

for (j = 0; j < Height ; j++){
    for ( i = 0; i < Width; i++){ 
        //入力画像の輝度値の取得
        Bright = pSrc[i + j * Width]; 
        //二値化処理 
        if (Bright >= Threshold)
            pDst[i + j * Width] = 255;
        else
            pDst[i + j * Width] =0;
    }
}

このプログラムでは画像の全画素をｉｆ文で処理しているので、非常に非効率です。この部分はルックアップテーブルを用いて最適化します。また、この例では二重ループを用いて画像の輝度値を二次元的に参照していますが、二値化処理では近傍画素を用いて処理を行わないので、画像データをただの一次元的な配列として捉えても構いません。ということで、最適化したのが以下の例です。

●効率の良いプログラム例

unsigned char LUT[256] = {0};
//二値化ルックアップテーブルの作成
for ( i = Threshold; i < 256; i++)
    LUT[i] = 255;
//二値化処理
for ( i = 0; i < Width * Height; i++)
    pDst[i] =  LUT[ pSrc[i] ];

←画像処理アルゴリズムへ戻る

画像処理フィルタ一覧、比較

投稿日時: 2011年3月15日投稿者: Akira

返信

各種、画像処理を下記に示します。
処理の名前の部分にリンクが張ってあるものは、より詳細な説明がありますので、そちらを参照願います。

処理前	処理後
二値化、Pタイル法、判別分析法（大津の二値化）

移動平均フィルタ（カーネルサイズ７×７）

ガウシアンフィルタ（カーネルサイズ７×７）

メディアンフィルタ（カーネルサイズ７×７）

ソーベルフィルタ

Canny edge detection

細線化

ガンマ補正

アンシャープマスキング

バイラテラルフィルタ

膨張

収縮

オープニング

クロージング

トップハット

ブラックハット（ボトムハット）

ラベリング

色変換（色相抽出）

疑似カラー