L’écart absolu moyen d’un ensemble {x1, x2, …, xn} est
1 n ∑ i = 1 n | x i – m ( X ) | . {\displaystyle {\frac {1}{n}}\sum _{i=1}^{n}|x_{i}-m(X)|.}
Le choix de la mesure de la tendance centrale, m ( X ) {\displaystyle m(X)}.
, a un effet marqué sur la valeur de l’écart moyen. Par exemple, pour l’ensemble de données {2, 2, 3, 4, 14} :
Mesure de la tendance centrale m ( X ) {\displaystyle m(X)} | Ecart absolu moyen |
---|---|
Moyenne = 5 | | 2 – 5 | + | 2 – 5 | + | 3 – 5 | + | 4 – 5 | + | 14 – 5 | 5 = 3.6 {\displaystyle {\frac {|2-5|+|2-5|+|3-5|+|4-5|+|14-5|}{5}}=3.6} |
Médiane = 3 | | 2 – 3 | + | 2 – 3 | + | 3 – 3 | + | 4 – 3 | + | 14 – 3 | 5 = 2.8 {\displaystyle {\frac {|2-3|+|2-3|+|3-3|+|4-3|+|14-3|}{5}}=2.8} |
Mode = 2 | | 2 – 2 | + | 2 – 2 | + | 3 – 2 | + | 4 – 2 | + | 14 – 2 | 5 = 3.0 {\displaystyle {\frac {|2-2|+|2-2|+|3-2|+|4-2|+|14-2|}{5}}=3.0} |
L’écart absolu moyen de la médiane est inférieur ou égal à l’écart absolu moyen de la moyenne. En fait, l’écart absolu moyen par rapport à la médiane est toujours inférieur ou égal à l’écart absolu moyen par rapport à tout autre nombre fixe.
L’écart absolu moyen par rapport à la moyenne est inférieur ou égal à l’écart-type ; une façon de le prouver repose sur l’inégalité de Jensen.
L’inégalité de Jensen est φ ( E ) ≤ E {\displaystyle \varphi \left(\mathbb {E} \right)\leq \mathbb {E} \left}
,où φ est une fonction convexe, cela implique pour Y = | X – μ | {\displaystyle Y=\vert X-\mu \vert }
que : E ( | X – μ | ) 2 ≤ E ( | X – μ | 2 ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)^{2}\leq \mathbb {E} \left(|X-\mu |^{2}\right)}
E ( | X – μ | ) 2 ≤ Var ( X ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)^{2}\leq \operatorname {Var} (X)}
Puisque les deux côtés sont positifs, et que la racine carrée est une fonction monotone croissante dans le domaine positif:
E ( | X – μ | ) ≤ Var ( X ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)\leq {\sqrt {\operatorname {Var}}. (X)}}}
Pour un cas général de cette affirmation, voir l’inégalité de Hölder.
Pour la distribution normale, le rapport entre l’écart absolu moyen et l’écart-type est 2 / π = 0,79788456 … {\displaystyle {\sqrt {2/\pi }}=0,79788456\ldots }.
. Ainsi, si X est une variable aléatoire normalement distribuée dont la valeur attendue est 0 alors, voir Geary (1935) : w = E | X | E ( X 2 ) = 2 π . {\displaystyle w={\frac {E|X|}{\sqrt {E(X^{2})}}={\sqrt {\frac {2}{\pi }}.}
En d’autres termes, pour une distribution normale, l’écart moyen absolu est d’environ 0,8 fois l’écart-type.Cependant, les mesures en échantillon délivrent des valeurs du rapport écart moyen / écart-type pour un échantillon gaussien n donné avec les bornes suivantes : w n ∈ {\displaystyle w_{n}\in }.
, avec un biais pour les petits n.
Écart absolu moyen autour de la moyenneEdit
L’écart absolu moyen (EAM), également appelé « écart moyen » ou parfois « écart absolu moyen », est la moyenne des écarts absolus des données autour de la moyenne des données : la distance moyenne (absolue) à la moyenne. « L’écart absolu moyen » peut se référer soit à cet usage, soit à la forme générale par rapport à un point central spécifié (voir ci-dessus).
On a proposé d’utiliser le MAD à la place de l’écart type car il correspond mieux à la vie réelle. Parce que le MAD est une mesure plus simple de la variabilité que l’écart-type, il peut être utile dans l’enseignement scolaire.
La précision des prévisions de cette méthode est très étroitement liée à la méthode de l’erreur quadratique moyenne (EQM) qui est juste l’erreur quadratique moyenne des prévisions. Bien que ces méthodes soient très proches, la méthode MAD est plus couramment utilisée parce qu’elle est à la fois plus facile à calculer (évitant la nécessité d’élever au carré) et plus facile à comprendre.
Écart absolu moyen autour de la médianeEdit
L’écart absolu moyen autour de la médiane (MAD médiane) offre une mesure directe de l’échelle d’une variable aléatoire autour de sa médiane
D med = E | X – médiane | {\displaystyle D_{\text{med}}=E|X-{\text{median}|}.
C’est l’estimateur du maximum de vraisemblance du paramètre d’échelle b {\displaystyle b}
de la distribution de Laplace. Pour la distribution normale, nous avons D moyenne = σ 2 / π ≈ 0,797884 σ {\displaystyle D_{\text{mean}}=\sigma {\sqrt {2/\pi }}\approx 0,797884\sigma }.
. Puisque la médiane minimise la distance absolue moyenne, on a D med ≤ D mean {\displaystyle D_{\text{med}}\leq D_{\text{mean}}.
et D med = erf – 1 ( 1 / 2 ) σ ≈ 0,67449 σ {\displaystyle D_{\text{med}}=\operatorname {erf} ^{-1}(1/2)\sigma \approx 0.67449\sigma }
.
En utilisant la fonction de dispersion générale, Habib (2011) a défini MAD autour de la médiane comme
D med = E | X – median | = 2 Cov ( X , I O ) {\displaystyle D_{\text{med}}=E|X-{\text{median}}|=2\operatorname {Cov} (X,I_{O})}.