バイラテラルフィルタ

ガウシアンフィルタなどのフィルタでは、ノイズをできるだけ除去しようとすると、輪郭もボケてしまうという欠点がありました。
この欠点を解決しようとした処理アルゴリズムがバイラテラルフィルタ（bilateral filter）です。

バイラテラルフィルタは処理前の画像データの配列をf(i, j)、処理後の画像データの配列をg(i, j)とすると

となります。

ただし、ｗがカーネルのサイズ、σ_１がガウシアンフィルタを制御、σ_２が輝度差を制御しています。

と言われても、何だか式が難しくて良く分かりません。

でも、分母分子に出てくる最初のexpの部分はガウシアンフィルタで見たことがあるな～

という事に気が付けば、突破口が開けます。

２つ目のexpの部分が良く分からないので、とりあえず取っちゃってみて、

とすると、分母の部分がガウシアンフィルタと少し違うけど、Σの範囲が-W～Wなので、(2W+1)×(2W+1)のカーネルサイズのガウシアンフィルタになっています。

結局、分母はカーネルの値の合計なので、やっぱりガウシアンフィルタそのものだという事に気が付きます。

ここで、ガウシアンフィルタを使って、どうやれば輪郭をぼやかさず、ノイズだけを除去できるか？を考えると、カーネルの中心の輝度値と差の少ないところだけをガウシアンフィルタで平滑化すればいいのではないか？という発想が浮かびます。

例えば次のような画像において、

四角で囲まれた部分を拡大し注目すると、５ｘ５のガウシアンフィルタの場合、中心の輝度値に近い部分を重み「１」、輝度差が大きい部分は重みが「０」になるようにして、

一般的な５ｘ５のガウシアンフィルタの係数↓、

に重みをかけると、それぞれのカーネルの値は


カーネルの合計の１６９で割る	カーネルの合計の２０９で割る

となります。

このようにして、場所、場所のカーネルの値を画像に合わせて変えて行くと、輪郭を残しつつノイズだけを除去できそうな感じがします。

しかし、輪郭付近の重みは「１」にするべきか？「０」にするべきか？少し悩みます。

そこで、カーネルの中心の輝度値との差に基づいて、重みを「０．３」や「０．８」のようなグレーゾーンを設けるために、輝度差を横軸にした正規分布を用いてみます。

正規分布のグラフはこんな感じ↓

になっていて、中心の０付近ほど値が大きく、外側（＋方向、－方向）へ行くに従って値が小さくなります。

この性質を使ってカーネルの中心の輝度値との差「f(i, j）- f(i + m, j + n) 」を横軸にとった正規分布の式は

となり、これを重みに使うと、「１」「０」だった重みが、輝度差が小さいと重みが大きく、輝度差が大きいと重みが小さくなるように、なだらかに変化します。

この正規分布を重みとしたのが、まさにバイラテラルフィルタなのです。

つまりバイラテラルフィルタは

正規分布の重み付きガウシアンフィルタ

なのです。

ここで、最初に示したバイラテラルフィルタの式を見てみると、

分子は(2W+1)×(2W+1)サイズのカーネルの範囲内の輝度値に、ガウシアンフィルタの係数をかけ、さらにカーネルの中心との輝度差を用いた正規分布の値を掛け合わせた値、

分母はカーネルの合計値で、カーネルの合計値が１になるように調整しています。

Ｗはカーネルの大きさ、σ_１は通常のガウシアンフィルタの係数と同じ。

σ_２の値が、カーネルの中心の輝度値との差をどの程度許容するか？を制御している事が分かります。

そのため、σ_２の値を大きくしていくと、ただのガウシアンフィルタの処理に近づき、輪郭もぼやけてしまいます。逆にσ_２の値を小さくし過ぎると、ノイズ除去効果が弱くなります。

そこで、実際にはエッジを保持しつつノイズをできるだけ除去したい場合は、１回のバイラテラルフィルタでσ₁、σ_２の値を調整しようとするよりも、バイラテラルフィルタを何回か繰り返した方が効果的です。


原画	１回目	２回目

３回目	４回目	５回目

このように、バイラテラルフィルタはガウシアンフィルタのカーネルに輝度差に基づいて重みを付けている訳ですが、この、×××に基づいて重みを付ける処理という考え方は、処理を安定させるポイントになったりします。

例えばロバスト推定法なんかも近い感じ。

←画像処理アルゴリズムへ戻る

OpenCVでバイラテラルフィルタを行う場合はcvSmooth関数の第3引数にCV_BILATERALを指定すればよいのですが、OpenCV.jpのページなどを見ても、なぜか、それらしい処理結果になっているサンプルをあまり見かけません。

cvSmoothの定義は

void cvSmooth(
         const CvArr* src,
         CvArr* dst,
         int smoothtype = CV_GAUSSIAN,
         int param1 = 3,
         int param2 = 0,
         double param3 = 0,
         double param4 = 0
);

で、バイラテラルフィルタの場合、

param1	アパーチャサイズ
param2	アパーチャサイズ
param3	空間領域のシグマ
param4	色領域のシグマ

ただし、

インプレースモード	非対応
チャンネル数	1,3
srcの深度	8
dstの深度	8

となっています。

そこで、param3、param4を変えながら、処理結果の比較をしてみました。

【入力画像】

【処理画像】

cvSmooth(src, dst, CV_BILATERAL, 11, 11, param3, param4);


(param3, param4) = (0, 0)	(50, 0)	(100, 0)

(0, 50)	(50, 50)	(100, 50)

(0, 100)	(50, 100)	(100, 100)

という事で、今回使用した画像では

cvSmooth(src, dst, CV_BILATERAL, 11, 11, 50, 100);

としたときが、いかにもバイラテラルフィルタっぽいでしょうか？

param4を少し大きめにした方が良さそうです。

逆にparam1, param2の値を大きくすると、処理時間がやたらとかかるので、あまり大きくできません。

←OpenCVへ戻る

イメージングソリューション

画像処理の入門～基礎～応用まで理解できるのを目指して！

「バイラテラルフィルタ」タグアーカイブ

【OpenCV】バイラテラルフィルタ(cvSmooth,CV_BILATERAL)