De gemiddelde absolute afwijking van een verzameling {x1, x2, …, xn} is
1 n ∑ i = 1 n | x i – m ( X ) | . {\displaystyle {\frac {1}{n}}\sum _{i=1}^{n}|x_{i}-m(X)|.}
De keuze van de maat voor de centrale tendens, m ( X ) {\displaystyle m(X)}
, heeft een duidelijk effect op de waarde van de gemiddelde afwijking. Bijvoorbeeld, voor de gegevensverzameling {2, 2, 3, 4, 14}:
Maat van centrale tendens m ( X ) {Displaystyle m(X)} | Gemiddelde absolute afwijking |
---|---|
Gemiddelde = 5 | | 2 – 5 | + | 2 – 5 | + | 3 – 5 | + | 4 – 5 | + | 14 – 5 | 5 = 3.6 {\displaystyle {\frac {|2-5|+|2-5|+|3-5|+|4-5|+|14-5|}{5}}=3.6} |
Mediaan = 3 | | 2 – 3 | + | 2 – 3 | + | 3 – 3 | + | 4 – 3 | + | 14 – 3 | 5 = 2,8 {{\displaystyle {\frac {|2-3|+|2-3|+|3-3|+|4-3|+|14-3|}{5}}=2,8} |
Mode = 2 | | 2 – 2 | + | 2 – 2 | + | 3 – 2 | + | 4 – 2 | + | 14 – 2 | 5 = 3.0 {{\displaystyle {\frac {|2-2|+|2-2|+|3-2|+|4-2|+|14-2|}{5}}=3.0} |
De gemiddelde absolute afwijking van de mediaan is kleiner dan of gelijk aan de gemiddelde absolute afwijking van het gemiddelde. In feite is de gemiddelde absolute afwijking van de mediaan altijd kleiner dan of gelijk aan de gemiddelde absolute afwijking van enig ander vast getal.
De gemiddelde absolute afwijking van het gemiddelde is kleiner dan of gelijk aan de standaardafwijking; een manier om dit te bewijzen berust op de ongelijkheid van Jensen.
De ongelijkheid van Jensen is φ ( E ) ≤ E {\displaystyle \varphi \left(\mathbb {E} \right)\leq \mathbb {E} \links}
, waarbij φ een convexe functie is, impliceert dit voor Y = | X – μ | {\displaystyle Y=X-mu \vert }
dat: E ( | X – μ | ) 2 ≤ E ( | X – μ | 2 ) {\displaystyle \mathbb {E} \^{2} ^left(|X-mu ^right|)^{2} \leq \mathbb {E} \^{2}[links(|X-[mu]^{2}[rechts]}
E ( | X – μ | ) 2 ≤ Var ( X ) {\displaystyle \mathbb {E} \^{2} \leq \operatornaam {Var} (X)}
Omdat beide zijden positief zijn, en de vierkantswortel een monotoon toenemende functie is in het positieve domein:
E ( | X – μ | ) ≤ Var ( X ) {\displaystyle \mathbb {E} \links(|X-rechts})\leq {\sqrt {\operatornaam {Var} (X)}}}
Voor een algemeen geval van deze stelling, zie de ongelijkheid van Hölder.
Voor de normale verdeling is de verhouding van gemiddelde absolute afwijking tot standaardafwijking 2 / π = 0,79788456 … {\displaystyle {\sqrt {2/\pi }}=0,79788456\ldots }
. Dus als X een normaal verdeelde willekeurige variabele is met verwachtingswaarde 0 dan, zie Geary (1935): w = E | X | E ( X 2 ) = 2 π . {\displaystyle w={\frac {E|X|}{\sqrt {E(X^{2})}}={\sqrt {\frac {2}{\pi }}.}
Met andere woorden, voor een normale verdeling is de gemiddelde absolute afwijking ongeveer 0,8 maal de standaardafwijking.Metingen in de steekproef leveren echter waarden op van de verhouding van gemiddelde gemiddelde afwijking / standaardafwijking voor een gegeven Gaussische steekproef n met de volgende grenzen: w n ∈ {Displaystyle w_{n}}in }
, met een vertekening voor kleine n.
Gemiddelde absolute afwijking rond het gemiddeldeEdit
De gemiddelde absolute afwijking (MAD), ook wel “gemiddelde afwijking” of soms “gemiddelde absolute afwijking” genoemd, is het gemiddelde van de absolute afwijkingen van de gegevens rond het gemiddelde van de gegevens: de gemiddelde (absolute) afstand tot het gemiddelde. “Gemiddelde absolute afwijking” kan zowel naar dit gebruik verwijzen als naar de algemene vorm ten opzichte van een gespecificeerd centraal punt (zie hierboven).
MAD is voorgesteld om in plaats van standaardafwijking te worden gebruikt, omdat het beter met de werkelijkheid overeenkomt. Omdat de MAD een eenvoudiger maatstaf voor de variabiliteit is dan de standaardafwijking, kan hij nuttig zijn in het onderwijs op school.
De prognosenauwkeurigheid van deze methode is zeer nauw verwant met de methode van de gemiddelde kwadratische fout (MSE), die gewoon de gemiddelde kwadratische fout van de prognoses is. Hoewel deze methoden zeer nauw verwant zijn, wordt de MAD-methode meer gebruikt omdat zij zowel gemakkelijker te berekenen (zonder de noodzaak van kwadrateren) als gemakkelijker te begrijpen is.
Gemiddelde absolute afwijking rond de mediaanEdit
De gemiddelde absolute afwijking rond de mediaan (MAD-mediaan) biedt een directe maatstaf voor de schaal van een willekeurige variabele rond zijn mediaan
D med = E | X – mediaan | {Displaystyle D_{text{med}}=E|X-{text{mediaan}}|}
Dit is de maximale waarschijnlijkheidsschatter van de schaalparameter b {{\displaystyle b}
van de Laplace-verdeling. Voor de normale verdeling hebben we D mean = σ 2 / π ≈ 0.797884 σ {\displaystyle D_{text{mean}}==\sigma {\sqrt {2/\pi }}\approx 0.797884\sigma }
. Aangezien de mediaan de gemiddelde absolute afstand minimaliseert, geldt D med ≤ D mean {{text{med}}leq D_{text{mean}}}
en D med = erf – 1 ( 1 / 2 ) σ ≈ 0,67449 σ {{\displaystyle D_{\text{med}}=\operatornaam {erf} ^{-1}(1/2)igma \\benaderd 0,67449}
.
Met behulp van de algemene dispersiefunctie heeft Habib (2011) de MAD over de mediaan gedefinieerd als
D med = E | X – median | = 2 Cov ( X , I O ) {\displaystyle D_{\text{median}}=E|X-{text{median}}|=2 {Cov} (X,I_{O})}