Średnie odchylenie bezwzględne

Dla różnic arbitralnych (nie wokół punktu centralnego), patrz Średnia różnica bezwzględna.
Dla różnic sparowanych (znanych również jako średnie odchylenie bezwzględne), patrz Średni błąd bezwzględny.

Średnie odchylenie bezwzględne zbioru {x1, x2, …, xn} wynosi

1 n ∑ i = 1 n | x i – m ( X )| . {frac {1}{n}}suma _{i=1}^{n}|x_{i}-m(X)|.}

Wybór miary tendencji centralnej, m ( X ) {{displaystyle m(X)}

, ma wyraźny wpływ na wartość odchylenia średniego. Na przykład, dla zbioru danych {2, 2, 3, 4, 14}:

Measure of central tendency m ( X ) {przykład m(X)}

Odchylenie bezwzględne średniej
Średnia = 5 | 2 – 5 | + | 2 – 5 | + | 3 – 5 | + | 4 – 5 | + | 14 – 5 | 5 = 3.6 {{displaystyle {{frac {|2-5|+|2-5|+|3-5|+|4-5|+|14-5|}{5}}=3,6}.

Mediana = 3 | 2 – 3 | + | 2 – 3 | + | 3 – 3 | + | 4 – 3 | + | 14 – 3 | 5 = 2,8 {displaystyle {frac {|2-3|+|2-3|+|3-3|+|4-3|+|14-3|}{5}}=2,8}

Mode = 2 | 2 – 2 | + | 2 – 2 | + | 3 – 2 | + | 4 – 2 | + | 14 – 2 | 5 = 3.0} {displaystyle {frac {|2-2|+|2-2|+|3-2|+|4-2|+|14-2|}{5}}=3.0}

Średnie bezwzględne odchylenie od mediany jest mniejsze lub równe średniemu bezwzględnemu odchyleniu od średniej. W rzeczywistości, średnie bezwzględne odchylenie od mediany jest zawsze mniejsze lub równe średniemu bezwzględnemu odchyleniu od jakiejkolwiek innej stałej liczby.

Średnie bezwzględne odchylenie od średniej jest mniejsze lub równe odchyleniu standardowemu; jeden ze sposobów udowodnienia tego opiera się na nierówności Jensena.

Dowód

Nierówność Jensena to φ ( E ) ≤ E {{displaystyle \\\\\\i \left(\mathbb {\i0} \i0}prawo} \left}

, że: E ( | X – μ | ) 2 ≤ E ( | X – μ | 2 ) {displaystyle {E} \left(|X-mu \right|)^{2} \u200} \u200} \u200} \lewa strona(|X-mu |^{2}}prawa)}

E ( | X – μ | ) 2 ≤ Var ( X ) { {displaystyle \mathbb {E} \left(|X-mu \right|)^{2}leq \u00}operatorname {Var} (X)}

Ponieważ obie strony są dodatnie, a pierwiastek kwadratowy jest funkcją monotonicznie rosnącą w dziedzinie dodatniej:

E ( | X – μ | ) ≤ Var ( X ) {displaystyle \mathbb {E} \left(|X- \right|)\} {\i1}sqrt {\i1}operatorname {\i1}Var} (X)}}}

Ogólny przypadek tego twierdzenia, patrz nierówność Höldera.

Dla rozkładu normalnego stosunek średniego odchylenia bezwzględnego do odchylenia standardowego wynosi 2 / π = 0.79788456 … {{sqrt {2/pi }}=0.79788456}.

. Zatem jeśli X jest normalnie rozłożoną zmienną losową o wartości oczekiwanej 0 to, patrz Geary (1935): w = E | X | E ( X 2 ) = 2 π . {{displaystyle w={sqrt {E|X|}{{sqrt {E(X^{2})}}={sqrt {{sqrt {{frac {2}{}pi}}}}.

Innymi słowy, dla rozkładu normalnego średnie odchylenie bezwzględne jest około 0,8 razy większe od odchylenia standardowego.Jednak pomiary in-sample dostarczają wartości stosunku średniego odchylenia przeciętnego / odchylenia standardowego dla danej gaussowskiej próbki n z następującymi granicami: w n ∈ {displaystyle w_{n}} }

, ze skośnością dla małych n.

Średnie odchylenie bezwzględne wokół średniejEdit

Średnie odchylenie bezwzględne (MAD), określane również jako „odchylenie średnie” lub czasami „średnie odchylenie bezwzględne”, jest średnią bezwzględnych odchyleń danych wokół średniej danych: średnia (bezwzględna) odległość od średniej. „Średnie odchylenie bezwzględne” może odnosić się zarówno do tego zastosowania, jak i do ogólnej formy w odniesieniu do określonego punktu centralnego (patrz wyżej).

MAD został zaproponowany do stosowania w miejsce odchylenia standardowego, ponieważ lepiej odpowiada prawdziwemu życiu. Ponieważ MAD jest prostszą miarą zmienności niż odchylenie standardowe, może być użyteczna w nauczaniu szkolnym.

Dokładność prognozowania tą metodą jest bardzo blisko związana z metodą błędu średniokwadratowego (MSE), która jest po prostu średnim błędem kwadratowym prognoz. Chociaż te metody są bardzo blisko spokrewnione, MAD jest częściej używany, ponieważ jest zarówno łatwiejszy do obliczenia (unikając potrzeby kwadratowania) i łatwiejszy do zrozumienia.

Średnie bezwzględne odchylenie wokół medianyEdit

Średnie bezwzględne odchylenie wokół mediany (MAD mediana) oferuje bezpośrednią miarę skali zmiennej losowej wokół jej mediany

D med = E | X – mediana | {{displaystyle D_{text{med}}=E|X-{text{median}}|}

Jest to estymator największej wiarygodności parametru skali b {{displaystyle b}

rozkładu Laplace’a. Dla rozkładu normalnego mamy D mean = σ 2 / π ≈ 0.797884 σ {displaystyle D_{text{mean}}= 0.797884\sigma }

. Ponieważ mediana minimalizuje średnią odległość bezwzględną, mamy D med ≤ D mean {{displaystyle D_{text{med}}}.

oraz D med = erf – 1 ( 1 / 2 ) σ ≈ 0,67449 σ {displaystyle D_{text{med}} = erf {erf} ^{-1}(1/2)\sigma \approx 0.67449 \sigma }

.

Wykorzystując ogólną funkcję dyspersji, Habib (2011) zdefiniował MAD wokół mediany jako

D med = E | X – mediana | = 2 Cov ( X , I O ) {displaystyle D_{text{med}}=E|X-{text{median}}|=2}operatorname {Cov} (X,I_{O})}

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.