Medelabsolut avvikelse

För godtyckliga skillnader (inte runt en central punkt), se Medelabsolut skillnad.
För parvisa skillnader (även känd som medelabsolut avvikelse), se Medelabsolut fel.

Medelabsolut avvikelse för en uppsättning {x1, x2, …, xn} är

1 n ∑ i = 1 n | x i – m ( X ) | . {\displaystyle {\frac {1}{n}}}\sum _{i=1}^{n}|x_{i}-m(X)|.}

Valet av mått på central tendens, m ( X ) {\displaystyle m(X)}

, har en tydlig effekt på värdet av medelavvikelsen. Till exempel för datamängden {2, 2, 3, 4, 14}:

Mått på central tendens m ( X ) {\displaystyle m(X)}

Medel absolut avvikelse
Medel = 5 | 2 – 5 | + | 2 – 5 | + | 3 – 5 | + | 4 – 5 | + | 14 – 5 | 5 = 3.6 {\displaystyle {\frac {|2-5|+|2-5|+|3-5|+|4-5|+|14-5|}{5}}=3.6}

Median = 3 | 2 – 3 | + | 2 – 3 | + | 3 – 3 | + | 4 – 3 | + | 4 – 3 | + | 14 – 3 | 5 = 2.8 {\displaystyle {\\frac {\2-3|+|2-3|+|3-3|+|4-3|+|14-3|}{5}}=2.8}

Mode = 2 | 2 – 2 | + | 2 – 2 | + | 3 – 2 | + | 4 – 2 | + | 4 – 2 | + | 14 – 2 | 5 = 3.0 {\displaystyle {\\frac {\2-2|+|2-2|+|3-2|+|4-2|+|14-2|}{5}}=3.0}

Den genomsnittliga absoluta avvikelsen från medianen är mindre än eller lika med den genomsnittliga absoluta avvikelsen från medelvärdet. I själva verket är den genomsnittliga absoluta avvikelsen från medianen alltid mindre än eller lika med den genomsnittliga absoluta avvikelsen från något annat fast tal.

Den genomsnittliga absoluta avvikelsen från medelvärdet är mindre än eller lika med standardavvikelsen; ett sätt att bevisa detta bygger på Jensens ojämlikhet.

Bevis

Jensens ojämlikhet är φ ( E ) ≤ E {\displaystyle \varphi \left(\mathbb {E} \right)\leq \mathbb {E} \left}

, där φ är en konvex funktion, innebär detta för Y = | X – μ | {\displaystyle Y=\vert X-\mu \vert }

att: E ( | X – μ | ) 2 ≤ E ( | X – μ | 2 ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)^{2}\leq \mathbb {E} \left(|X-\mu |^{2}\right)}

E ( | X – μ | ) 2 ≤ Var ( X ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)^{2}\leq \operatorname {Var} (X)}

Då båda sidorna är positiva och kvadratroten är en monotont ökande funktion i det positiva området:

E ( | X – μ | ) ≤ Var ( X ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)\leq {\sqrt {\operatorname {Var} (X)}}}

För ett allmänt fall av detta påstående, se Hölders ojämlikhet.

För normalfördelningen är förhållandet mellan absolut medelavvikelse och standardavvikelse 2 / π = 0,79788456 … {\displaystyle {\sqrt {2/\pi }}=0,79788456\ldots }

. Om X är en normalfördelad slumpmässig variabel med förväntat värde 0 så gäller följande, se Geary (1935): w = E | X | E ( X 2 ) = 2 π . {\displaystyle w={\frac {E|X|}{\sqrt {E(X^{{2})}}}={\sqrt {\frac {2}{\pi }}}.}

Med andra ord, för en normalfördelning är den genomsnittliga absoluta avvikelsen ungefär 0,8 gånger standardavvikelsen.Mätningar i provet ger dock värden på förhållandet mellan genomsnittlig medelavvikelse och standardavvikelse för ett givet gaussiskt prov n med följande gränser: w n ∈ {\displaystyle w_{n}\in }

, med en bias för små n.

Medelabsolut avvikelse kring medelvärdetRedigera

Medelabsolut avvikelse (MAD), även kallad ”medelavvikelse” eller ibland ”genomsnittlig absolut avvikelse”, är medelvärdet av dataens absoluta avvikelser kring dataens medelvärde: det genomsnittliga (absoluta) avståndet från medelvärdet. ”Genomsnittlig absolut avvikelse” kan avse antingen denna användning eller den allmänna formen med avseende på en angiven centralpunkt (se ovan).

MAD har föreslagits att användas i stället för standardavvikelse eftersom det bättre motsvarar verkligheten. Eftersom MAD är ett enklare mått på variabilitet än standardavvikelsen kan den vara användbar i skolundervisningen.

Den här metodens prognosnoggrannhet är mycket nära besläktad med metoden för medelkvadratfel (MSE) som bara är det genomsnittliga kvadrerade felet för prognoserna. Även om dessa metoder är mycket nära besläktade används MAD oftare eftersom den både är lättare att beräkna (man slipper kvadreringen) och lättare att förstå.

Mean absolute deviation around the medianEdit

Mean absolute deviation around the median (MAD median) erbjuder ett direkt mått på skalan av en slumpmässig variabel runt dess median

D med = E | X – median | {\disdisplaystyle D_{text{med}}=E|X-{\text{median}}|}

Detta är den maximala sannolikhetsskattningen av skalparametern b {\displaystyle b}

för Laplace-fördelningen. För normalfördelningen har vi D mean = σ 2 / π ≈ 0,797884 σ σ {\displaystyle D_{\text{mean}}}=\sigma {\sqrt {2/\pi }}\approx 0,797884\sigma }

. Eftersom medianen minimerar det genomsnittliga absoluta avståndet har vi D med ≤ D mean {\displaystyle D_{\text{med}}\leq D_{\text{mean}}}}

och D med = erf – 1 ( 1 / 2 ) σ ≈ 0.67449 σ {\displaystyle D_{\text{med}}=\operatorname {erf} ^{-1}(1/2)\sigma \approx 0.67449\sigma }

.

Med hjälp av den allmänna spridningsfunktionen definierade Habib (2011) MAD om medianen som

D med = E | X – median | = 2 Cov ( X , I O ) {\displaystyle D_{\text{med}}=E|X-{\text{median}}|=2\operatorname {Cov} (X,I_{O})}

Lämna ett svar

Din e-postadress kommer inte publiceras.