標準偏差のよくある誤解

シェアする

  • このエントリーをはてなブックマークに追加
最近の記事
  • 10/21 【C#】寸法線の描画
  • 10/21 【C#】GraphicsPathの領域取得
  • 10/20 【C#】GraphicsPathの描画
  • 10/18 【C#】GraphicsPath
  • 10/17 【C#】Bitmap画像データの拡大縮小
  • 10/15 【C#】画像の座標系
  • 10/14 【C#】画像の上下左右反転、90,180,270度回転
  • 10/3 【C#】SplitContainerのPanel固定方法
  • 9/7 【Neural Network Console】学習データの出力方法
  • 9/3 Deep Learning向け学習画像撮り込みソフト公開
  • 9/1 【Neural Network Console】新規画像のDataset作成方法
  • 8/28 【Neural Network Console】GUI表示スケールの変更
  • 8/22 【Neural Network Console】CPU/GPU処理の設定切替
  • 8/21 【Neural Network Console】Learning Rate(学習率)の設定
  • 8/20 ソニーの無償AIソフト Neural Network Consoleの入手ダウンロード、インストール
  • 8/20 Deep Learning
  • 8/20
  • 8/19 古いバージョンのVisual Studio Community/Expressの入手ダウンロード
  • 8/19 CUDAの入手、ダウンロード、インストール方法
  • 8/17 【C#.NET】マイクロソフト仕様のアフィン変換
  • 8/5 【C#】ファイルを開くダイアログボックスの表示
  • 8/2 キャノンプリンターのCDトレイはどこ?!
  • 7/6 【参考書籍】画像処理・機械学習プログラミング OpenCV 3対応
  • 6/20 【Python,matplotlib】動くグラフをAnimationGifに保存する方法
  • 6/17 シグモイド関数の微分
  • 6/15 シグモイド関数
  • 6/13 合成関数の微分
  • 6/12 WordPressで数式エディタ風に数式を入力したい
  • 6/11 PythonをVisual Studioでインストールする方法
  • 6/9 【Python】OpenCVをAnacondaでインストール(Windows編)
  • 6/6 【Python】Anacondaで複数バージョンの環境切り替え
  • 6/6 画像センシング展2017に出展します。
  • 6/1 【Office365】Web版Outlookのフォントサイズ変更
  • 6/1 【Anaconda】モジュールのアップデートでエラー発生
  • 6/1 【Anaconda】コマンドリストの表示
  • 5/29 Windows10パソコン購入
  • 5/24 Anacondaのアンインストール
  • 5/24 【Jupyter Notebook】新規プログラムの作成
  • 5/23 【Python】開発環境の構築
  • 5/23 Pythonはじめました
  • 4/6 【Office365】Web版Outlookのスレッド表示を解除する方法
  • 4/5 【Excel】フーリエ解析(FFT)
  • 3/20 Canny edge detection
  • 3/20 【Excel2016】分析ツールの表示
  • 3/5 【Visual Studio】黒い背景色を白に変更する方法
  • 2/8 【Windows10】拡張モニタに表示されたウィンドウを元に戻す
  • 2/7 複素数の計算
  • 1/18 【Excel】棒グラフの横軸の目盛を0始まりにする
  • 1/16 【Excel】フーリエ変換
  • 1/6 【OpenCV】疑似カラー(カラーマップ)

  • 標準偏差の説明としては、

       標準偏差はデータのバラツキを表す

    というのが多いでしょうか?

    その性質からデータの誤差などの指標としても用いられる事が多くあります。

    例えば、下図のように上のグラフに比べて下のグラフの方がノイズが多く、上のグラフでは、標準偏差が0.2、下のグラフでは標準偏差が0.58となり、確かに標準偏差は誤差を良く表しているように思います。(右側のグラフはデータのヒストグラムです)

    標準偏差のよくある誤解

    それでは、下図のように高周波のノイズ(細かいギザギザ)は少ないが、全体的にデータに傾きのある

    データ1

    標準偏差のよくある誤解

                       データ1

    全体的な傾きは無いが、細かいギザギザのあるデータ2

    標準偏差のよくある誤解

                       データ2

    データ1データ2のどちらの方がノイズが大きいでしょうか?

    と聞かれると、データ2の方がノイズが大きい!と答える人が多いのではないでしょうか?

    しかしながら、標準偏差を計算してみると

    データ1がσ=0.87

    データ2がσ=0.51

    となります。

    標準偏差のよくある誤解

    標準偏差のよくある誤解

    なんで???

    ここで、改めて標準偏差の式を見てみると

    標準偏差

    というように、標準偏差は全データの平均値からのズレ量の2乗の平均の平方根を取ったものが標準偏差になっています。

    データ1とデータ2はどちらも平均値が0のデータなのですが、データ1の方が全体的に傾いている分だけ、平均値からのズレ量が大きくなってしまうことから標準偏差の値も大きくなってしまいます。

    と、マジマジ言われると、当たり前のように聞こえると思いますが、

    標準偏差はバラつきを表す ≒ 誤差を表す ≒ ノイズレベルが分かる

    という認識だけでいると、標準偏差を計算すればデータの(高周波な)誤差(だけ)が分かる!

    と思っている人も少なくないはず?

    ある意味、

    標準偏差は低周波な誤差も含めてノイズレベルを表している

    わけですが、データ全体の傾きやユレなど影響も受けるということをお忘れなく。

    使える数学へ戻る