Gennemsnitlig absolut afvigelse

For vilkårlige forskelle (ikke omkring et centralt punkt), se Gennemsnitlig absolut forskel.
For parrede forskelle (også kendt som gennemsnitlig absolut afvigelse), se Gennemsnitlig absolut fejl.

Den gennemsnitlige absolutte afvigelse for et sæt {x1, x2, …, xn} er

1 n ∑ i = 1 n | x i – m ( X ) | . {\displaystyle {\frac {\frac {1}{n}}}\sum _{i=1}^{n}|x_{i}-m(X ) |.}

Valget af mål for den centrale tendens, m ( X ) {\displaystyle m(X)}

, har en markant indflydelse på værdien af den gennemsnitlige afvigelse. For eksempel for datasættet {2, 2, 2, 3, 4, 14}:

Måling af central tendens m ( X ) {\displaystyle m(X)}

Middelværdi af den absolutte afvigelse
Middelværdi = 5 | 2 – 5 | + | 2 – 5 | + | 3 – 5 | + | 4 – 5 | + | 4 – 5 | + | 14 – 5 | 5 = 3.6 {\displaystyle {\frac {|2-5|+|2-5|+|3-5|+|4-5|+|14-5|}{5}}}=3.6}

Median = 3 | 2 – 3 | + | 2 – 3 | + | 2 – 3 | + | 3 – 3 | + | 4 – 3 | + | 4 – 3 | + | 14 – 3 | 5 = 2.8 {\displaystyle {\\frac {\2-3|+|2-3|+|3-3|+|4-3|+|14-3|}{5}}=2.8}

Mode = 2 | 2 – 2 | + | 2 – 2 | + | 3 – 2 | + | 4 – 2 | + | 4 – 2 | + | 14 – 2 | 5 = 3.0 {\displaystyle {\\frac {\frac {|2-2|+|2-2|+|3-2|+|4-2|+|14-2|}{5}}}=3.0}

Den gennemsnitlige absolutte afvigelse fra medianen er mindre end eller lig med den gennemsnitlige absolutte afvigelse fra middelværdien. Faktisk er den gennemsnitlige absolutte afvigelse fra medianen altid mindre end eller lig med den gennemsnitlige absolutte afvigelse fra ethvert andet fast tal.

Den gennemsnitlige absolutte afvigelse fra middelværdien er mindre end eller lig med standardafvigelsen; en måde at bevise dette på er afhængig af Jensens ulighed.

Bevis

Jensens ulighed er φ ( E ) ≤ E {\displaystyle \varphi \left(\mathbb {E} \right)\leq \mathbb {E} \left}

, hvor φ er en konveks funktion, indebærer dette for Y = | X – μ | {\displaystyle Y=\vert X-\mu \vert }

at: E ( | X – μ | ) 2 ≤ E ( | X – μ | 2 ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)^{2}\leq \mathbb {E} \left(|X-\mu |^{2}\right)}

E ( | X – μ | ) 2 ≤ Var ( X ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)^{2}\leq \operatorname {Var} (X)}

Da begge sider er positive, og kvadratroden er en monotont stigende funktion i det positive område:

E ( | X – μ | ) ≤ Var ( X ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)\leq {\sqrt {\operatornavn {Var} (X)}}}

For et generelt tilfælde af dette udsagn, se Hölders ulighed.

For normalfordelingen er forholdet mellem den gennemsnitlige absolutte afvigelse og standardafvigelsen 2 / π = 0,79788456 … {\displaystyle {\sqrt {2/\pi }}=0,79788456\ldots }

. Hvis X således er en normalfordelt tilfældig variabel med forventet værdi 0, så gælder følgende, jf. Geary (1935): w = E | X | E ( X 2 ) = 2 π . {\displaystyle w={\frac {E|X|}{\sqrt {E(X^{{2})}}}}={\sqrt {\frac {\frac {2}{\pi }}}.}

Med andre ord er den gennemsnitlige absolutte afvigelse for en normalfordeling ca. 0,8 gange standardafvigelsen.Målinger i stikprøven giver imidlertid værdier af forholdet mellem gennemsnitlig gennemsnitlig afvigelse/standardafvigelse for en given gaussisk stikprøve n med følgende grænser: w n ∈ {\displaystyle w_{n}\in }

, med en bias for små n.

Gennemsnitlig absolut afvigelse omkring middelværdienRediger

Den gennemsnitlige absolutte afvigelse (MAD), også kaldet “middelafvigelse” eller undertiden “gennemsnitlig absolut afvigelse”, er gennemsnittet af dataenes absolutte afvigelser omkring dataenes middelværdi: den gennemsnitlige (absolutte) afstand fra middelværdien. “Gennemsnitlig absolut afvigelse” kan enten henvise til denne anvendelse eller til den generelle form med hensyn til et angivet centralt punkt (se ovenfor).

MAD er blevet foreslået anvendt i stedet for standardafvigelse, da det svarer bedre til virkeligheden. Da MAD er et enklere mål for variabilitet end standardafvigelsen, kan den være nyttig i skoleundervisningen.

Denne metodes prognosegenøjagtighed er meget nært beslægtet med den gennemsnitlige kvadrerede fejl (MSE-metode), som blot er den gennemsnitlige kvadrerede fejl af prognoserne. Selv om disse metoder er meget nært beslægtede, er MAD mere almindeligt anvendt, fordi den både er lettere at beregne (idet den undgår behovet for kvadrering) og lettere at forstå.

Mean absolute deviation around the medianEdit

Mean absolute deviation around the median (MAD median) giver et direkte mål for omfanget af en tilfældig variabel omkring dens median

D med = E | X – median | {\displaystyle D_{{text{med}}=E|X-{{\text{median}}|}

Dette er maximum likelihood-estimatoren for skala-parameteren b {\displaystyle b}

af Laplace-fordelingen. For normalfordelingen har vi D mean = σ 2 / π ≈ 0,797884 σ {\displaystyle D_{\text{mean}}}=\sigma {\sqrt {2/\pi }}\approx 0,797884\sigma }

. Da medianen minimerer den gennemsnitlige absolutte afstand, har vi D med ≤ D mean {\displaystyle D_{{\text{med}}}\leq D_{{\text{mean}}}}

og D med = erf – 1 ( 1 / 2 ) σ ≈ 0,67449 σ {\displaystyle D_{{\text{med}}}=\operatornavn {erf} ^{-1}(1/2)\sigma \approx 0.67449\sigma }

.

Ved hjælp af den generelle spredningsfunktion definerede Habib (2011) MAD omkring medianen som

D med = E | X – median | = 2 Cov ( X , I O ) {\displaystyle D_{{\text{med}}}=E|X-{\text{median}}}|=2\operatorname {Cov} (X,I_{O}})}

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.