Střední absolutní odchylka souboru {x1, x2, …, xn} je
1 n ∑ i = 1 n | x i – m ( X ) | . {\displaystyle {\frac {1}{n}}\sum _{i=1}^{n}|x_{i}-m(X)|.}
Volba míry centrální tendence, m ( X ) {\displaystyle m(X)}
, má výrazný vliv na hodnotu střední odchylky. Například pro soubor dat {2, 2, 3, 4, 14}:
Míra centrální tendence m ( X ) {\displaystyle m(X)} | Střední absolutní odchylka |
---|---|
Střední hodnota = 5 | | 2 – 5 | + | 2 – 5 | + | 3 – 5 | + | 4 – 5 | + | 14 – 5 | 5 = 3.6 {\displaystyle {\frac {|2-5|+|2-5|+|3-5|+|4-5|+|14-5|}{5}}=3.6} |
Medián = 3 | | 2 – 3 | + | 2 – 3 | + | 3 – 3 | + | 4 – 3 | + | 14 – 3 | 5 = 2,8 {\displaystyle {\frac {|2-3|+|2-3|+|3-3|+|4-3|+|14-3|}{5}}=2,8} |
Mode = 2 | | 2 – 2 | + | 2 – 2 | + | 3 – 2 | + | 4 – 2 | + | 14 – 2 | 5 = 3.0 {\displaystyle {\frac {|2-2|+|2-2|+|3-2|+|4-2|+|14-2|}{5}}=3.0} |
Střední absolutní odchylka od mediánu je menší nebo rovna střední absolutní odchylce od průměru. Ve skutečnosti je střední absolutní odchylka od mediánu vždy menší nebo rovna střední absolutní odchylce od jakéhokoli jiného pevného čísla.
Střední absolutní odchylka od průměru je menší nebo rovna směrodatné odchylce; jeden způsob, jak to dokázat, se opírá o Jensenovu nerovnost.
Jensenova nerovnost je φ ( E ) ≤ E {\displaystyle \varphi \left(\mathbb {E} \right)\leq \mathbb {E} \left}
, kde φ je konvexní funkce, to znamená pro Y = | X – μ | {\displaystyle Y=\vert X-\mu \vert }
že: E ( | X – μ | ) 2 ≤ E ( | X – μ | 2 ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)^{2}\leq \mathbb {E} \left(|X-\mu |^{2}\right)}
E ( | X – μ | ) 2 ≤ Var ( X ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)^{2}\leq \operatorname {Var} (X)}
Protože obě strany jsou kladné a odmocnina je monotónně rostoucí funkce v kladném oboru:
E ( | X – μ | ) ≤ Var ( X ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)\leq {\sqrt {\operatorname {Var} (X)}}}
Obecný případ tohoto tvrzení viz Hölderova nerovnost.
Pro normální rozdělení je poměr střední absolutní odchylky a směrodatné odchylky 2 / π = 0,79788456 … {\displaystyle {\sqrt {2/\pi }}=0,79788456\ldots }
. Je-li tedy X normálně rozdělená náhodná veličina s očekávanou hodnotou 0, pak, viz Geary (1935): w = E | X | E ( X 2 ) = 2 π . {\displaystyle w={\frac {E|X|}{\sqrt {E(X^{2})}}}={\sqrt {\frac {2}{\pi }}}.}
Jinými slovy, pro normální rozdělení je střední absolutní odchylka přibližně 0,8násobkem směrodatné odchylky. měření ve vzorku však poskytují hodnoty poměru střední průměrné odchylky / směrodatné odchylky pro daný Gaussův vzorek n s následujícími hranicemi: w n ∈ {\displaystyle w_{n}\in }
, se zkreslením pro malé n.
Střední absolutní odchylka kolem průměruEdit
Střední absolutní odchylka (MAD), označovaná také jako „střední odchylka“ nebo někdy „průměrná absolutní odchylka“, je průměr absolutních odchylek dat kolem průměru dat: průměrná (absolutní) vzdálenost od průměru. „Průměrná absolutní odchylka“ se může vztahovat buď k tomuto použití, nebo k obecnému tvaru vzhledem k určenému střednímu bodu (viz výše).
MAD bylo navrženo používat místo směrodatné odchylky, protože lépe odpovídá reálnému životu. Protože MAD je jednodušší mírou variability než směrodatná odchylka, může být užitečná ve školní výuce.
Přesnost předpovědi této metody velmi úzce souvisí s metodou střední kvadratické chyby (MSE), která je právě průměrnou kvadratickou chybou předpovědi. Ačkoli jsou tyto metody velmi úzce příbuzné, MAD se používá častěji, protože je jednak jednodušší na výpočet (odpadá nutnost čtverečkování), jednak je srozumitelnější.
Střední absolutní odchylka kolem mediánuEdit
Střední absolutní odchylka kolem mediánu (MAD medián) nabízí přímou míru rozsahu náhodné veličiny kolem jejího mediánu
D med = E | X – medián | {\displaystyle D_{\text{med}}=E|X-{\text{median}}|}
Jedná se o maximálně věrohodný odhad parametru měřítka b {\displaystyle b}
Laplaceova rozdělení. Pro normální rozdělení máme D mean = σ 2 / π ≈ 0,797884 σ {\displaystyle D_{\text{mean}}=\sigma {\sqrt {2/\pi }}\aprox 0,797884\sigma }
. Protože medián minimalizuje průměrnou absolutní vzdálenost, máme D med ≤ D mean {\displaystyle D_{\text{med}}\leq D_{\text{mean}}.
a D med = erf – 1 ( 1 / 2 ) σ ≈ 0,67449 σ {\displaystyle D_{\text{med}}=\operatorname {erf} ^{-1}(1/2)\sigma \aprox 0,67449\sigma }
.
Pomocí obecné rozptylové funkce definoval Habib (2011) MAD kolem mediánu jako
D med = E | X – medián | = 2 Cov ( X , I O ) {\displaystyle D_{\text{med}}=E|X-{\text{median}}|=2\operatorname {Cov} (X,I_{O})}.