Átlagos abszolút eltérés

A tetszőleges (nem egy központi pont körüli) különbségekhez lásd: átlagos abszolút különbség.
Párosított különbségekhez (más néven átlagos abszolút eltérés) lásd: átlagos abszolút hiba.

A {x1, x2, …, xn} halmaz átlagos abszolút eltérése

1 n ∑ i = 1 n | x i – m ( X ) | . {\displaystyle {\frac {1}{n}}}\sum _{i=1}^{n}|x_{i}-m(X)|.}

A központi tendencia mértékének megválasztása, m ( X ) {\displaystyle m(X)}

, jelentős hatással van az átlagos eltérés értékére. Például a {2, 2, 2, 3, 4, 14} adathalmaz esetében:

A központi tendencia m ( X ) mértéke {\displaystyle m(X)}

Az abszolút szórás átlaga
Az átlag = 5 | 2 – 5 | + | 2 – 5 | + | 3 – 5 | + | 4 – 5 | + | 14 – 5 | 5 = 3.6 {\displaystyle {\frac {|2-5|+|2-5|+|3-5|+|4-5|+|14-5|}{5}}=3.6}

Medián = 3 | 2 – 3 | + | 2 – 3 | + | 2 – 3 | + | 3 – 3 | + | 4 – 3 | + | 14 – 3 | 5 = 2.8 {\displaystyle {\frac {|2-3|+|2-3|+|3-3|+|4-3|+|14-3|}{5}}=2.8}=2.8}

Mode = 2 | 2 – 2 | + | 2 – 2 | + | 3 – 2 | + | 4 – 2 | + | 14 – 2 | 5 = 3.0 {\displaystyle {\frac {|2-2|+|2-2|+|3-2|+|4-2|+|14-2|}{5}}=3.0}}

A mediántól való átlagos abszolút eltérés kisebb vagy egyenlő az átlagtól való átlagos abszolút eltéréssel. Valójában a mediántól való átlagos abszolút eltérés mindig kisebb vagy egyenlő bármely más rögzített számtól való átlagos abszolút eltéréssel.

A középértéktől való átlagos abszolút eltérés kisebb vagy egyenlő a szórással; ennek egyik bizonyítási módja a Jensen-egyenlőtlenségre támaszkodik.

Bizonyítás

A Jensen-egyenlőtlenség a következő: φ ( E ) ≤ E {\displaystyle \varphi \left(\mathbb {E} \right)\leq \mathbb {E} \left}

,ahol φ egy konvex függvény, ez azt jelenti, hogy Y = | X – μ | {\displaystyle Y=\vert X-\mu \vert }

hogy: E ( | X – μ | ) 2 ≤ E ( | X – μ | 2 ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)^{2}\leq \mathbb {E} \left(|X-\mu |^{2}\right)}

E ( | X – μ | ) 2 ≤ Var ( X ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)^{2}\leq \operatorname {Var} (X)}

Mivel mindkét oldal pozitív, és a négyzetgyök a pozitív tartományban monoton növekvő függvény:

E ( | X – μ | ) ≤ Var ( X ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)\leq {\sqrt {\operatornév {Var} (X)}}}

Az állítás általános esetét lásd a Hölder-egyenlőtlenségben.

A normális eloszlás esetében az átlagos abszolút eltérés és a szórás aránya 2 / π = 0,79788456 … {\displaystyle {\sqrt {2/\pi }}=0,79788456\ldots }0,79788456\ldots }

. Ha tehát X egy normális eloszlású véletlen változó, amelynek várható értéke 0, akkor, lásd Geary (1935): w = E | X | E ( X 2 ) = 2 π . {\displaystyle w={\frac {E|X|}{\sqrt {E(X^{2})}}}={\sqrt {\frac {\frac {2}{\pi }}}.

Más szóval, normális eloszlás esetén az átlagos abszolút eltérés körülbelül 0,8-szorosa a szórásnak.A mintán belüli mérések azonban az átlagos átlagos eltérés / szórás arányának értékeit egy adott n Gauss-mintára a következő korlátokkal adják: w n ∈ {\displaystyle w_{n}\in }

, kis n esetén torzítással.

Átlagos abszolút eltérés az átlag körülSzerkesztés

Az átlagos abszolút eltérés (MAD), más néven “átlagos eltérés” vagy néha “átlagos abszolút eltérés”, az adatok abszolút eltéréseinek átlaga az adatok átlaga körül: az átlagtól való átlagos (abszolút) távolság. Az “átlagos abszolút eltérés” utalhat vagy erre a használatra, vagy az általános formára egy meghatározott középponthoz képest (lásd fentebb).

A MAD-et javasolták a standard eltérés helyett használni, mivel jobban megfelel a valós életnek. Mivel a MAD egyszerűbb mérőszáma a változékonyságnak, mint a szórás, hasznos lehet az iskolai oktatásban.

Ez a módszer előrejelzési pontossága nagyon szorosan kapcsolódik az átlagos négyzetes hiba (MSE) módszeréhez, amely csak az előrejelzések átlagos négyzetes hibája. Bár ezek a módszerek nagyon szorosan kapcsolódnak egymáshoz, a MAD-et gyakrabban használják, mert egyrészt könnyebb kiszámítani (elkerülve a négyzetelés szükségességét), másrészt könnyebben érthető.

A medián körüli átlagos abszolút eltérésSzerkesztés

A medián körüli átlagos abszolút eltérés (MAD medián) egy véletlen változó medián körüli skálájának közvetlen mérését kínálja

D med = E | X – medián | {\displaystyle D_{\text{med}}=E|X-{\text{medián}}|}

Ez a Laplace-eloszlás b {\displaystyle b}

skálaparaméterének maximális valószínűségű becslője. A normális eloszlás esetén D mean = σ 2 / π ≈ 0.797884 σ {\displaystyle D_{\text{mean}}=\sigma {\sqrt {2/\pi }}\approx 0.797884\sigma }

. Mivel a medián minimalizálja az átlagos abszolút távolságot, ezért D med ≤ D mean {\displaystyle D_{\text{med}}\leq D_{\text{közép}}}

és D med = erf – 1 ( 1 / 2 ) σ ≈ 0.67449 σ {\displaystyle D_{\text{med}}=\operatorname {erf} ^{-1}(1/2)\sigma \approx 0.67449\sigma }

.

Az általános szórásfüggvény felhasználásával Habib (2011) a MAD-et a medián körül a következőképpen definiálta

D med = E | X – medián | = 2 Cov ( X , I O ) {\displaystyle D_{\text{med}}=E|X-{\text{medián}}|=2\operatorname {Cov} (X,I_{O})}

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.