Abaterea medie absolută

Pentru diferențe arbitrare (nu în jurul unui punct central), vezi Diferență medie absolută.
Pentru diferențe perechi (cunoscute și sub numele de abatere medie absolută), vezi Eroare medie absolută.

Eradia medie absolută a unui ansamblu {x1, x2, …, xn} este

1 n ∑ i = 1 n | x i – m ( X ) | . {\displaystyle {\frac {1}{n}}\sum _{i=1}^{n}|x_{i}-m(X)|.}

Alegerea măsurii tendinței centrale, m ( X ) {\displaystyle m(X)}

, are un efect pronunțat asupra valorii abaterii medii. De exemplu, pentru setul de date {2, 2, 2, 3, 4, 14}:

Măsura tendinței centrale m ( X ) {\displaystyle m(X)}

Deviația absolută medie
Mediana = 5 | 2 – 5 | + | 2 – 5 | + | 2 – 5 | + | 3 – 5 | + | 3 – 5 | + | 4 – 5 | + | 14 – 5 | 5 = 3.6 {\displaystyle {\frac {|2-5|+|2-5|+|3-5|+|4-5|+|14-5|}{5}}}=3.6}

Mediana = 3 | 2 – 3 | + | 2 – 3 | + | 3 – 3 | + | 4 – 3 | + | 4 – 3 | + | 14 – 3 | 5 = 2.8 {\displaystyle {\frac {|2-3|+|2-3|+|3-3|+|4-3|+|14-3|}}{5}}=2.8}}.

Mode = 2 | 2 – 2 | + | 2 – 2 | + | 3 – 2 | + | 4 – 2 | + | 4 – 2 | + | 14 – 2 | 5 = 3.0 {\displaystyle {\frac {|2-2|+|2-2|-2|+|3-2|+|4-2|+|14-2|}}{5}}=3.0}}.

Deviația absolută medie față de mediană este mai mică sau egală cu deviația absolută medie față de medie. De fapt, abaterea medie absolută de la mediană este întotdeauna mai mică sau egală cu abaterea medie absolută de la orice alt număr fix.

Deviația absolută medie de la medie este mai mică sau egală cu abaterea standard; o modalitate de a demonstra acest lucru se bazează pe inegalitatea lui Jensen.

Probă

Inegalitatea lui Jensen este φ ( E ) ≤ E {\displaystyle \varphi \left(\mathbb {E} \right)\leq \mathbb {E} \left}

,unde φ este o funcție convexă, acest lucru implică pentru Y = | X – μ | {\displaystyle Y=\vert X-\mu \vert }

că: E ( | X – μ | ) 2 ≤ E ( | X – μ | 2 ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)^{2}\leq \mathbb {E} \left(|X-\mu |^{2}\right)}

E ( | X – μ | ) 2 ≤ Var ( X ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)^{2}\leq \operatorname {Var} (X)}

Din moment ce ambele părți sunt pozitive, iar rădăcina pătrată este o funcție cu creștere monotonică în domeniul pozitiv:

E ( | X – μ | ) ≤ Var ( X ) {\displaystyle \mathbb {E} \left(|X-\mu \right|)\leq {\sqrt {\operatorname {Var} (X)}}}

Pentru un caz general al acestei afirmații, vezi inegalitatea lui Hölder.

Pentru distribuția normală, raportul dintre abaterea absolută medie și abaterea standard este 2 / π = 0,79788456 … {\displaystyle {\sqrt {2/\pi }}=0,79788456\ldots }

. Astfel, dacă X este o variabilă aleatoare distribuită normal cu valoarea așteptată 0, atunci, vezi Geary (1935): w = E | X | E ( X 2 ) = 2 π . {\displaystyle w={\frac {E|X|}{\sqrt {E(X^{2})}}}={\sqrt {\frac {2}{\pi}}.}}.

Cu alte cuvinte, pentru o distribuție normală, abaterea medie absolută este de aproximativ 0,8 ori abaterea standard.Cu toate acestea, măsurătorile în eșantion furnizează valori ale raportului dintre abaterea medie medie / abaterea standard pentru un anumit eșantion gaussian n cu următoarele limite: w n ∈ {\displaystyle w_{n}\in }

, cu o distorsiune pentru n mic.

Deviația medie absolută în jurul medieiEdit

Deviația medie absolută (MAD), denumită și „abatere medie” sau uneori „abatere medie absolută”, este media abaterilor absolute ale datelor în jurul mediei datelor: distanța medie (absolută) față de medie. „Abaterea medie absolută” se poate referi fie la această utilizare, fie la forma generală în raport cu un punct central specificat (a se vedea mai sus).

MAD a fost propusă pentru a fi utilizată în locul abaterii standard, deoarece corespunde mai bine vieții reale. Deoarece MAD este o măsură mai simplă a variabilității decât abaterea standard, poate fi utilă în învățământul școlar.

Precizia de prognoză a acestei metode este foarte strâns legată de metoda erorii medii pătratice (MSE), care este doar eroarea medie pătratică a prognozelor. Deși aceste metode sunt foarte strâns legate între ele, MAD este mai frecvent utilizată deoarece este atât mai ușor de calculat (evitând necesitatea ridicării la pătrat), cât și mai ușor de înțeles.

Abaterea medie absolută în jurul medianeiEdit

Deviația medie absolută în jurul medianei (MAD mediană) oferă o măsură directă a scalei unei variabile aleatoare în jurul medianei sale

D med = E | X – mediană | {\displaystyle D_{\text{med}}=E|X-{\text{mediană}}|}.

Acesta este estimatorul de maximă verosimilitate al parametrului de scară b {\displaystyle b}

al distribuției Laplace. Pentru distribuția normală avem D mean = σ 2 / π ≈ 0,797884 σ {\displaystyle D_{\text{mean}}=\sigma {\sqrt {2/\pi }}\aprox 0,797884\sigma }

. Deoarece mediana minimizează distanța absolută medie, avem D med ≤ D mean {\displaystyle D_{\text{med}}\leq D_{\text{mean}}

și D med = erf – 1 ( 1 / 2 ) σ ≈ 0,67449 σ {\displaystyle D_{\text{med}}=\operatorname {erf} ^{-1}(1/2)\sigma \aprox 0.67449\sigma }

.

Prin utilizarea funcției generale de dispersie, Habib (2011) a definit MAD despre mediană ca

D med = E | X – mediană | = 2 Cov ( X , I O ) {\displaystyle D_{\text{med}}=E|X-{\text{mediană}}|=2\operatorname {Cov} (X,I_{O})}

Lasă un răspuns

Adresa ta de email nu va fi publicată.