Mittlere absolute Abweichung

Für beliebige Differenzen (nicht um einen zentralen Punkt), siehe Mittlere absolute Differenz.
Für gepaarte Differenzen (auch als mittlere absolute Abweichung bezeichnet), siehe Mittlerer absoluter Fehler.

Die mittlere absolute Abweichung einer Menge {x1, x2, …, xn} ist

1 n ∑ i = 1 n | x i – m ( X ) | . {\displaystyle {\frac {1}{n}}\sum _{i=1}^{n}|x_{i}-m(X)|.}

Die Wahl des Maßes der zentralen Tendenz, m ( X ) {\displaystyle m(X)}

, hat einen deutlichen Einfluss auf den Wert der mittleren Abweichung. Zum Beispiel für den Datensatz {2, 2, 3, 4, 14}:

Maß der zentralen Tendenz m ( X ) {\displaystyle m(X)}

Mittlere absolute Abweichung
Mittelwert = 5 | 2 – 5 | + | 2 – 5 | + | 3 – 5 | + | 4 – 5 | + | 14 – 5 | 5 = 3.6 {\displaystyle {\frac {|2-5|+|2-5|+|3-5|+|4-5|+|14-5|}{5}}=3.6}

Median = 3 | 2 – 3 | + | 2 – 3 | + | 3 – 3 | + | 4 – 3 | + | 14 – 3 | 5 = 2.8 {\displaystyle {\frac {|2-3|+|2-3|+|3-3|+|4-3|+|14-3|}{5}}=2.8}

Mode = 2 | 2 – 2 | + | 2 – 2 | + | 3 – 2 | + | 4 – 2 | + | 14 – 2 | 5 = 3.0 {\displaystyle {\frac {|2-2|+|2-2|+|3-2|+|4-2|+|14-2|}{5}}=3.0}

Die mittlere absolute Abweichung vom Median ist kleiner als oder gleich der mittleren absoluten Abweichung vom Mittelwert. In der Tat ist die mittlere absolute Abweichung vom Median immer kleiner oder gleich der mittleren absoluten Abweichung von jeder anderen festen Zahl.

Die mittlere absolute Abweichung vom Mittelwert ist kleiner oder gleich der Standardabweichung; eine Möglichkeit, dies zu beweisen, beruht auf der Jensen’schen Ungleichung.

Beweis

Die Jensen’sche Ungleichung ist φ ( E ) ≤ E {\displaystyle \varphi \leq \mathbb {E} \right(\mathbb {E} \left}

,wobei φ eine konvexe Funktion ist, impliziert dies für Y = | X – μ | {\displaystyle Y=\vert X-\mu \vert }

, dass: E ( | X – μ | ) 2 ≤ E ( | X – μ | 2 ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)^{2}\leq \mathbb {E} \left(|X-\mu |^{2}\right)}

E ( | X – μ | ) 2 ≤ Var ( X ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)^{2}\leq \operatorname {Var} (X)}

Da beide Seiten positiv sind, und die Quadratwurzel eine monoton steigende Funktion im positiven Bereich ist:

E ( | X – μ | ) ≤ Var ( X ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)\leq {\sqrt {\operatorname {Var} (X)}}}

Für einen allgemeinen Fall dieser Aussage siehe Höldersche Ungleichung.

Für die Normalverteilung ist das Verhältnis der mittleren absoluten Abweichung zur Standardabweichung 2 / π = 0,79788456 … {\displaystyle {\sqrt {2/\pi }}=0,79788456\ldots }

. Wenn also X eine normalverteilte Zufallsvariable mit Erwartungswert 0 ist, dann gilt, siehe Geary (1935): w = E | X | E ( X 2 ) = 2 π . {w={\frac {E|X|}{\sqrt {E(X^{2})}}={\sqrt {\frac {2}{\pi }}.}

Mit anderen Worten, für eine Normalverteilung ist die mittlere absolute Abweichung etwa das 0,8-fache der Standardabweichung.w n ∈ {\displaystyle w_{n}\in } liefert jedoch Werte des Verhältnisses von mittlerer Abweichung/Standardabweichung für eine gegebene Gaußsche Stichprobe n mit den folgenden Grenzen

, mit einer Verzerrung für kleine n.

Mittlere absolute Abweichung um den MittelwertBearbeiten

Die mittlere absolute Abweichung (MAD), die auch als „mittlere Abweichung“ oder manchmal als „durchschnittliche absolute Abweichung“ bezeichnet wird, ist der Mittelwert der absoluten Abweichungen der Daten um den Mittelwert der Daten: der durchschnittliche (absolute) Abstand vom Mittelwert. „Mittlere absolute Abweichung“ kann sich entweder auf diese Verwendung oder auf die allgemeine Form in Bezug auf einen bestimmten zentralen Punkt beziehen (siehe oben).

Die MAD wurde vorgeschlagen, anstelle der Standardabweichung verwendet zu werden, da sie der Realität besser entspricht. Da die MAD ein einfacheres Maß für die Variabilität ist als die Standardabweichung, kann sie im Schulunterricht nützlich sein.

Die Vorhersagegenauigkeit dieser Methode ist sehr eng mit der Methode des mittleren quadratischen Fehlers (MSE) verwandt, die nur den durchschnittlichen quadratischen Fehler der Vorhersagen darstellt. Obwohl diese beiden Methoden sehr eng miteinander verwandt sind, wird die MAD-Methode häufiger verwendet, da sie sowohl einfacher zu berechnen (da keine Quadrierung erforderlich ist) als auch leichter zu verstehen ist.

Mittlere absolute Abweichung um den MedianBearbeiten

Die mittlere absolute Abweichung um den Median (MAD-Median) bietet ein direktes Maß für die Größe einer Zufallsvariablen um ihren Median

D med = E | X – Median | {\displaystyle D_{\text{med}}=E|X-{\text{median}}|}

Dies ist der Maximum-Likelihood-Schätzer für den Skalenparameter b {\displaystyle b}

der Laplace-Verteilung. Für die Normalverteilung gilt D Mittelwert = σ 2 / π ≈ 0,797884 σ {\displaystyle D_{\text{mean}}=\sigma {\sqrt {2/\pi }}\approx 0,797884\sigma }

. Da der Median den durchschnittlichen absoluten Abstand minimiert, haben wir D med ≤ D mean {\displaystyle D_{\text{med}}\leq D_{\text{mean}}}

und D med = erf – 1 ( 1 / 2 ) σ ≈ 0.67449 σ {\displaystyle D_{\text{med}}=\operatorname {erf} ^{-1}(1/2)\sigma \approx 0.67449\sigma }

.

Unter Verwendung der allgemeinen Dispersionsfunktion definiert Habib (2011) MAD um den Median als

D med = E | X – median | = 2 Cov ( X , I O ) {\displaystyle D_{\text{med}}=E|X-{\text{median}}|=2\operatorname {Cov} (X,I_{O})}

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.