集合 {x1, x2, …, xn} の平均絶対偏差は
1n ∑ i = 1 n | x i – m ( X ) | . {displaystyle {frac {1}{n}} {sum _{i=1}^{n}|x_{i}-m(X)|.} } .
中心傾向の指標である m ( X ) の選択{displaystyle m(X)}.
は、平均偏差の値に著しい影響を与える。 例えば、データセット{2, 2, 3, 4, 14}の場合。
Measure of central tendency m ( X ) {displaystyle m(X)} ←クリックすると拡大します。 | 平均絶対偏差 |
---|---|
Mean = 5 | | 2 – 5 | + | 2 – 5 + | 3 – 5 | + | 4 – 5 | + | 14 – 5 | 5 = 3.5.5である。6 {displaystyle {frac {|2-5|+|2-5|+|3-5|+|4-5|+|14-5|}{5}}=3.6} となる。 |
Median = 3 | |2 – 3| +|2 – 3| +|4 – 3| +|14 – 3| 5 = 2.8 {displaystyle {}frac {|2-3|+|2-3| +|3-3| +|4-3| +|14-3}{5}} =2.8} {displaystyle}=2.8{}となります。 |
Mode = 2 | |2 – 2|+|2 – 2|+|3 – 2|+|4 – 2|+|14 – 2|5 = 3.0 {}displaystyle {}frac {|2-2|+|2-2|+|3-2|+|4-2|+|14-2|}{5}} =3.0} {{3 – 2|+|2|+|14-2|}=3.0 {|4 – 2|+|5}=3.0 {}frac {|2-2|+|2-2|+|3-2|+|14-2|}{5} =3.0 |
中央値からの平均絶対偏差は、平均値からの絶対偏差以下であることがわかります。 実際、中央値からの平均絶対偏差は、他のどの固定数からの平均絶対偏差よりも常に小さいか等しくなる。
平均絶対偏差は標準偏差以下である。これを証明する一つの方法はジェンセンの不等式に依存する。
ジェンセンの不等式は φ ( E ) ≦ E {displaystyle \left(\mathbb {E} \right)leq \mathbb {E}。 \♪♪~}
,ここでφは凸関数であり、これはY = | X – μ | {displaystyle Y=Ⓐ X-Ⓐ }を意味する。
ということです。 E ( | X – μ | ) 2 ≤ E ( | X – μ | 2 ) {displaystyle \mathbb {E}}. \ЪЪЪЪ \left(|X-mu |^{2}}right)}.
E ( | X – μ | ) 2 ≤ Var ( X ) {displaystyle \mathbb {E} } }. \left(|X-mu \right|)^{2}leq \operatorname {Var} (X)}
両辺が正で、平方根は正の領域で単調増加する関数なので:
E ( | X – μ | ) ≤ Var ( X ) {displaystyle \mathbb {E}. \left(|X-mu \right|)\leq {sqrt {operatorname {Var}}. (X)}}}
この文の一般的な場合については、Hölderの不等式を参照。
正規分布について、平均絶対偏差と標準偏差の比は2 / π = 0.79788456 … {displaystyle {\sqrt {2/pi }}=0.79788456ldots } }とする。
. したがって、X が期待値 0 の正規分布の確率変数である場合、 Geary (1935) を参照してください: w = E | X | E ( X 2 ) = 2 π . {w={frac {E|X|}{sqrt {E(X^{2})}}={sqrt {}{2}{pi }}.} } となります。
つまり、正規分布では、平均絶対偏差は標準偏差の約0.8倍です。しかし、サンプル内測定では、与えられたガウス型サンプルnの平均平均偏差/標準偏差の比の値を次の境界で提供します:w n∈{displaystyle w_{n}in }}。
, 小さいnに偏りがある。
平均絶対偏差編集
平均絶対偏差(MAD)は、「平均偏差」または「平均絶対偏差」とも呼ばれ、データの平均値周りの絶対偏差の平均、つまり平均値からの平均(絶対)距離のことである。 「平均絶対偏差」は、この用法と、指定した中心点に対する一般的な形(上記参照)のどちらかを指します。 MADは標準偏差よりもシンプルな変動性の尺度であるため、学校教育にも役立ちます。
この方法の予測精度は、予測の平均二乗誤差(MSE)法と非常に密接な関係があり、ちょうど予測の二乗誤差を平均化したようなものです。 これらの方法は非常に密接に関連していますが、MADの方が計算が簡単で(二乗の必要性を回避できる)、理解しやすいため、より一般的に使用されています。
Mean absolute deviation around the medianEdit
Mean absolute deviation around the median (MAD median) は、確率変数の中央値付近でのスケールを直接測定するものである
D med = E|X – median| {}displaystyle D_{}median=E|X-{}median}|} {{{}median}{{Meady text{median}}}=E|X-{}{Madian}|} {{}displaystyle E{}median{MAD}=X-{}{Madian}|} {{}displaystyle MAD = E|X
これはラプラス分布のスケールパラメータb {displaystyle b}
の最尤推定量である。 正規分布の場合、D mean = σ 2 / π ≈ 0.797884 σ {displaystyle D_{Copyte{mean}}=Sigma {sqrt {2/pi }}approx 0.797884 } } となる。
. 中央値は平均絶対距離を最小化するので、D med ≤ D mean {displaystyle D_{Text{med}}leq D_{Text{mean}}} となります。
and D med = erf – 1 ( 1 / 2 ) σ ≈ 0.67449 σ {displaystyle D_{text/med}= Operatorname {erf ^{-1}(1/2)㎤ 0.67449 シグマ } ㎤ 0.67449 シグマ
.
一般的な分散関数を用いて、Habib (2011) は中央値に関するMADを以下のように定義しています
D med = E | X – median | = 2 Cov ( X , I O ) {displaystyle D_{Chatest{med}=E|X-{Text{median}}|=2}operatorname {Cov} (X,I_{O})} } {Median = E|X-{Text{median}}=2}operatorname } }。