La deviazione assoluta media di un insieme {x1, x2, …, xn} è
1 n ∑ i = 1 n | x i – m ( X ) | . {\displaystyle {\frac {1}{n}}}somma _{i=1}^{n}|x_{i}-m(X)|.
La scelta della misura della tendenza centrale, m ( X ) {\displaystyle m(X)}
, ha un effetto marcato sul valore della deviazione media. Per esempio, per l’insieme di dati {2, 2, 3, 4, 14}:
Misura della tendenza centrale m ( X ) {\displaystyle m(X)} | Deviazione assoluta media |
---|---|
Media = 5 | | 2 – 5 | + | 2 – 5 | + | 3 – 5 | + | 4 – 5 | + | 14 – 5 | 5 = 3.6 {\displaystyle {\frac {|2-5|+|2-5|+|3-5|+|4-5|+|14-5|}{5}=3.6} |
Mediano = 3 | | 2 – 3 | + | 2 – 3 | + | 3 – 3 | + | 4 – 3 | + | 14 – 3 | 5 = 2.8 {\displaystyle {\frac {|2-3|+|2-3|+|3-3|+|4-3|+|14-3|}{5}=2.8} |
Mode = 2 | | 2 – 2 | + | 2 – 2 | + | 3 – 2 | + | 4 – 2 | + | 14 – 2 | 5 = 3.0 {\displaystyle {\frac {|2-2|+|2-2|+|3-2|+|4-2|+|14-2|}{5}=3.0} |
La deviazione assoluta media dalla mediana è inferiore o uguale alla deviazione assoluta media dalla media. Infatti, la deviazione assoluta media dalla mediana è sempre minore o uguale alla deviazione assoluta media da qualsiasi altro numero fisso.
La deviazione assoluta media dalla media è minore o uguale alla deviazione standard; un modo per dimostrarlo si basa sulla disuguaglianza di Jensen.
La disuguaglianza di Jensen è φ ( E ) ≤ E {\displaystyle \varphi \left(\mathbb {E} \right)\leq \mathbb {E} \sinistra}
,dove φ è una funzione convessa, questo implica per Y = | X – μ | {\displaystyle Y=\vert X-\mu \vert }
che: E ( | X – μ | ) 2 ≤ E ( | X – μ | 2 ) {\displaystyle \mathbb {E} \sinistra(|X- \mu \destra|)^{2} \mathbb {E} \sinistra(|X-\mu ^{2}destra)}
E ( | X – μ | ) 2 ≤ Var ( X ) {\displaystyle \mathbb {E} \sinistra(|X- \mu \destra|)^{2} \operatorname {Var} (X)}
Siccome entrambi i lati sono positivi, e la radice quadrata è una funzione monotonamente crescente nel dominio positivo:
E ( | X – μ | ) ≤ Var ( X ) {\displaystyle \mathbb {E} \(X – μ) è una funzione crescente nel dominio positivo: E ( X – μ) è una funzione crescente nel dominio positivo: E ( X – μ) è una funzione crescente nel dominio positivo: E ( X – μ) è una funzione crescente nel dominio positivo: E ( X – μ) è una funzione crescente nel dominio positivo. (X)}}}
Per un caso generale di questa affermazione, vedi la disuguaglianza di Hölder.
Per la distribuzione normale, il rapporto tra deviazione assoluta media e deviazione standard è 2 / π = 0,79788456 … {\displaystyle {\sqrt {2/\pi }=0,79788456\ldots }
. Quindi se X è una variabile casuale normalmente distribuita con valore atteso 0 allora, vedi Geary (1935): w = E | X | E ( X 2 ) = 2 π . w={{frac {E|X|}{sqrt {E(X^{2})}}={sqrt {frac {2}{\sqrt {\i}.
In altre parole, per una distribuzione normale, la deviazione media assoluta è circa 0,8 volte la deviazione standard.Tuttavia, le misurazioni in-sample forniscono valori del rapporto deviazione media / deviazione standard per un dato campione gaussiano n con i seguenti limiti: w n ∈ {\displaystyle w_{n}\in }
, con una deviazione per piccoli n.
Deviazione assoluta media intorno alla mediaModifica
La deviazione assoluta media (MAD), detta anche “deviazione media” o talvolta “deviazione assoluta media”, è la media delle deviazioni assolute dei dati intorno alla media: la distanza media (assoluta) dalla media. “Deviazione assoluta media” può riferirsi sia a questo uso, sia alla forma generale rispetto a un punto centrale specificato (vedi sopra).
La MAD è stata proposta per essere usata al posto della deviazione standard perché corrisponde meglio alla vita reale. Poiché la MAD è una misura di variabilità più semplice della deviazione standard, può essere utile nell’insegnamento scolastico.
L’accuratezza della previsione di questo metodo è molto vicina al metodo dell’errore quadratico medio (MSE) che è solo l’errore quadratico medio delle previsioni. Anche se questi metodi sono strettamente correlati, MAD è più comunemente usato perché è più facile da calcolare (evitando la necessità di squadrare) e più facile da capire.
Deviazione assoluta media intorno alla medianaModifica
La deviazione assoluta media intorno alla mediana (MAD mediana) offre una misura diretta della scala di una variabile casuale intorno alla sua mediana
D med = E | X – mediana | {\displaystyle D_{{{\med}}}=E|X-{\text{median}}|}
Questo è lo stimatore di massima verosimiglianza del parametro di scala b {displaystyle b}
della distribuzione di Laplace. Per la distribuzione normale abbiamo D mean = σ 2 / π ≈ 0.797884 σ {displaystyle D_{{text{mean}}=sigma {sqrt {2/\pi }}approx 0.797884\sigma }
. Poiché la mediana minimizza la distanza media assoluta, abbiamo D med ≤ D mean {displaystyle D_{{\testo{med}}}leq D_{\testo{mean}}
e D med = erf – 1 ( 1 / 2 ) σ ≈ 0.67449 σ {\displaystyle D_{{\text{med}}=\operatorname {erf} ^{-1}(1/2)\sigma \approx 0.67449\sigma }
.
Utilizzando la funzione di dispersione generale, Habib (2011) ha definito la MAD sulla mediana come
D med = E | X – mediana | = 2 Cov ( X , I O ) {displaystyle D_{{text{med}}=E|X-{{{text{median}}|=2\operatorname {Cov} (X,I_{O})}