Analyse af varianser (ANOVA)
Anova refererer til analyse af forholdet mellem to grupper; uafhængig variabel og afhængig variabel. Det er grundlæggende et statistisk værktøj, der bruges til at teste hypoteser på grundlag af eksperimentelle data. Vi kan bruge anova til at bestemme forholdet mellem to variabler; mad-habit den uafhængige variabel og den afhængige variabel sundhedstilstand.
Forskellen mellem envejs anova og tovejs anova kan tilskrives det formål, som de anvendes til, og deres begreber. Formålet med envejsanova er at se, om de data, der er indsamlet for en afhængig variabel, ligger tæt på det fælles gennemsnit. På den anden side fastslår tovejs anova, om de data, der er indsamlet for to afhængige variabler, konvergerer mod et fælles gennemsnit, der er afledt af to kategorier.
Envejs anova
Envejs anova anvendes, når der kun er én uafhængig variabel med flere grupper eller niveauer eller kategorier, og de normalt fordelte respons- eller afhængige variabler måles, og midlerne for hver gruppe af respons- eller udfaldsvariabler sammenlignes.
Eksempel på envejsanova: Overvej to grupper af variabler, hvor stikprøvepersonernes madvaner er den uafhængige variabel med flere niveauer som vegetarisk, ikke-vegetarisk og blanding, og den afhængige variabel er antallet af gange, en person blev syg i løbet af et år. Middelværdien af svarvariablerne for hver gruppe bestående af N antal personer måles og sammenlignes.
Tovejs anova
Når der er to uafhængige variabler med flere niveauer og én afhængig variabel, bliver anovaen tovejs. Den tovejs anova viser virkningen af hver uafhængig variabel på de enkelte respons- eller udfaldsvariabler og fastslår, om der er nogen interaktionseffekt mellem de uafhængige variabler. Tovejs-anova er blevet populariseret af Ronald Fisher, 1925, og Frank Yates, 1934. Mange år senere, i 2005, foreslog Andrew Gelman en anden tilgang til anova i en flerniveaumodel.
Eksempel på tovejsanova: Hvis vi i ovenstående eksempel på envejsanova tilføjer en anden uafhængig variabel, “rygerstatus”, til den eksisterende uafhængige variabel “madvaner”, og flere niveauer af rygerstatus såsom ikke-ryger, rygere med en pakke om dagen og rygere med mere end en pakke om dagen, konstruerer vi en tovejsanova.
Superioritet af tovejs anova
Tovejs anova har visse fordele i forhold til envejs anova. Disse er;
i. To-vejs anova er mere effektiv end envejs anova. I tovejsanova er der to kilder til variabler eller uafhængige variabler, nemlig mad-vaner og ryge-status i vores eksempel. Tilstedeværelsen af to kilder reducerer fejlvariationen, hvilket gør analysen mere meningsfuld.
ii. To-vejs anova hjælper os med at vurdere virkningerne af to variabler på samme tid. Dette er ikke muligt i envejsanova.
iii. Faktorernes uafhængighed kan testes, forudsat at der er mere end én observation for hver faktorkombination eller celle, og at antallet af observationer i hver celle er det samme. I vores eksempel har faktoren mad-vaner 3 niveauer og faktoren rygning-status 3 niveauer. Der er således 3 x 3 = 9 faktorkombinationer eller celler.
Summary
1. Anova er en statistisk analyse, der bruges til at teste hypoteser på grundlag af eksperimentelle data. Her analyseres sammenhænge mellem to grupper.
2. Envejs anova anvendes, når der kun er én uafhængig variabel med flere niveauer. To-vejs anova anvendes, når der er to uafhængige variabler med flere niveauer.
3. To-vejs anova er overlegen i forhold til envejs anova, da metoden har visse fordele i forhold til envejs anova.