Desviación media absoluta

Para diferencias arbitrarias (no en torno a un punto central), véase Diferencia media absoluta.
Para diferencias emparejadas (también conocidas como desviación media absoluta), véase Error medio absoluto.

La desviación media absoluta de un conjunto {x1, x2, …, xn} es

1 n ∑ i = 1 n | x i – m ( X ) | . {\displaystyle {\frac {1}{n}}suma _{i=1}^{n}|x_{i}-m(X)|.}

La elección de la medida de tendencia central, m ( X ) {\displaystyle m(X)}

, tiene un marcado efecto en el valor de la desviación media. Por ejemplo, para el conjunto de datos {2, 2, 3, 4, 14}:

Medida de tendencia central m ( X ) {\displaystyle m(X)}

Desviación absoluta media
Media = 5 | 2 – 5 | + | 2 – 5 | + | 3 – 5 | + | 4 – 5 | + | 14 – 5 | 5 = 3.6 {\displaystyle {\frac {|2-5|+|2-5|+|3-5|+|4-5|+|14-5|}{5}=3,6}

Mediana = 3 | 2 – 3 | + | 2 – 3 | + | 3 – 3 | + | 4 – 3 | + | 14 – 3 | 5 = 2,8 {\displaystyle {\frac {|2-3+|2-3|+|3-3|+|4-3||14-3|}{5}

Modo = 2 | 2 – 2 | + | 2 – 2 | + | 3 – 2 | + | 4 – 2 | + | 14 – 2 | 5 = 3.0 {\displaystyle {\frac {|2-2|+|2-2|+|3-2|+|4-2|+|14-2|}{5}=3.0}

La desviación media absoluta de la mediana es menor o igual que la desviación media absoluta de la media. De hecho, la desviación media absoluta de la mediana es siempre menor o igual que la desviación media absoluta de cualquier otro número fijo.

La desviación media absoluta de la media es menor o igual que la desviación estándar; una forma de demostrar esto se basa en la desigualdad de Jensen.

Prueba

La desigualdad de Jensen es φ ( E ) ≤ E {\displaystyle \varphi \left(\mathbb {E} \right)\leq \mathbb {E} \N – Izquierda}

,donde φ es una función convexa, esto implica para Y = | X – μ | {\displaystyle Y=\vert X-\mu \vert }

que: E ( | X – μ | ) 2 ≤ E ( | X – μ | 2 ) {\displaystyle \mathbb {E} ^{2}\\a la izquierda(|X-\mu \a la derecha|)^2}\a la izquierda(|X-\mu \a la derecha|)^2}\a la izquierda(|X-\mu \a la derecha|) \(X-\mu) ^{2}\mujeres)}

E ( | X – μ | ) 2 ≤ Var ( X ) {\displaystyle \mathbb {E} \^{2} {left(|X-\mu \right|)^2} {operatorname {Var} (X)}

Como ambos lados son positivos, y la raíz cuadrada es una función monotónicamente creciente en el dominio positivo:

E ( | X – μ | ) ≤ Var ( X ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)\leq {\sqrt {\operatorname {Var} (X)}}}

Para un caso general de esta afirmación, véase la desigualdad de Hölder.

Para la distribución normal, el cociente entre la desviación media absoluta y la desviación estándar es 2 / π = 0,79788456 … {\displaystyle {\sqrt {2/\pi }}=0,79788456\ldots }

. Así, si X es una variable aleatoria normalmente distribuida con valor esperado 0 entonces, véase Geary (1935): w = E | X | E ( X 2 ) = 2 π . {\displaystyle w={\frac {E|X|}{\sqrt {E(X^{2})}}={\sqrt {\frac {2}{\pi }}.}

En otras palabras, para una distribución normal, la desviación media absoluta es aproximadamente 0,8 veces la desviación estándar.Sin embargo, las mediciones en la muestra proporcionan valores de la relación desviación media / desviación estándar para una muestra gaussiana dada n con los siguientes límites: w n ∈ {\displaystyle w_{n}\in }

, con un sesgo para n pequeños.

Desviación media absoluta en torno a la mediaEditar

La desviación media absoluta (DAM), también llamada «desviación media» o a veces «desviación media absoluta», es la media de las desviaciones absolutas de los datos en torno a la media de los datos: la distancia media (absoluta) de la media. «Desviación media absoluta» puede referirse a este uso o a la forma general con respecto a un punto central especificado (véase más arriba).

Se ha propuesto utilizar la DAM en lugar de la desviación estándar, ya que se corresponde mejor con la vida real. Dado que la MAD es una medida de variabilidad más sencilla que la desviación estándar, puede ser útil en la enseñanza escolar.

La precisión de las previsiones de este método está muy relacionada con el método del error cuadrático medio (MSE), que no es más que el error cuadrático medio de las previsiones. Aunque estos métodos están muy relacionados, el MAD es más comúnmente utilizado porque es más fácil de calcular (evitando la necesidad de elevar al cuadrado) y más fácil de entender.

Desviación media absoluta en torno a la medianaEditar

La desviación media absoluta en torno a la mediana (MAD mediana) ofrece una medida directa de la escala de una variable aleatoria en torno a su mediana

D med = E | X – mediana | {\displaystyle D_{text{med}}=E|X-{text{median}}|}

Este es el estimador de máxima verosimilitud del parámetro de escala b {\displaystyle b}

de la distribución de Laplace. Para la distribución normal tenemos D media = σ 2 / π ≈ 0,797884 σ {\displaystyle D_{text{mean}}=\sigma {\sqrt {2/\pi }}aprox 0,797884\sigma }

. Como la mediana minimiza la distancia absoluta media, tenemos D med ≤ D mean {\displaystyle D_{text{med}}leq D_{text{mean}}

y D med = erf – 1 ( 1 / 2 ) σ ≈ 0,67449 σ {displaystyle D_{text{med}}=\operatorname {erf} ^{-1}(1/2)\Nsigma \Naprox 0,67449\Nsigma }

.

Utilizando la función de dispersión general, Habib (2011) definió la MAD sobre la mediana como

D med = E | X – mediana | = 2 Cov ( X , I O ) {\displaystyle D_{text{med}}=E|X-{text{median}}|=2operatorname {Cov} (X,I_{O})}

Deja una respuesta

Tu dirección de correo electrónico no será publicada.