Testování hypotéz > Waldův test
Co je Waldův test?
Waldův test vám může říci, které proměnné modelu přispívají něčím významným.
Waldův test (nazývaný také Waldův test chí-kvadrát) je způsob, jak zjistit, zda jsou vysvětlující proměnné v modelu významné. „Významné“ znamená, že do modelu něco přidávají; proměnné, které nic nepřidávají, mohou být odstraněny, aniž by model nějak významně ovlivnily. Test lze použít pro množství různých modelů včetně modelů s binárními proměnnými nebo spojitými proměnnými.
Nulová hypotéza pro test zní: nějaký parametr = nějaká hodnota. Například můžete zkoumat, zda má na hmotnost vliv konzumace nezdravého jídla dvakrát týdně. „Hmotnost“ by byl váš parametr. Hodnota by mohla být nula (což by znamenalo, že si myslíte, že na hmotnost nemá vliv konzumace nezdravého jídla). Pokud je nulová hypotéza zamítnuta, naznačuje to, že dané proměnné lze odstranit bez větší újmy na vhodnosti modelu.
- Pokud Waldův test ukáže, že parametry určitých vysvětlujících proměnných jsou nulové, můžete tyto proměnné z modelu odstranit.
- Pokud test ukáže, že parametry nejsou nulové, měli byste tyto proměnné do modelu zahrnout.
O Waldově testu se obvykle hovoří ve smyslu chí-kvadrátu, protože je obvykle známo výběrové rozdělení (jak se n blíží nekonečnu). Tato varianta testu se někdy nazývá Waldův chí-kvadrát test, aby se odlišila od Waldova logaritmického chí-kvadrát testu, což je neparametrická varianta založená na logaritmických poměrech šancí.
Srovnání s jinými testy
Waldův test je hrubou aproximací testu poměru pravděpodobnosti. Můžete jej však provádět s jediným modelem (LR test vyžaduje alespoň dva). Je také šířeji použitelný než LRT: často můžete Waldův test provést v situacích, kdy nelze provést žádný jiný test.
Při velkých hodnotách n je Waldův test zhruba ekvivalentní t-testu; oba testy při velkých velikostech vzorků zamítnou stejné hodnoty. Waldův, LRT a Lagrangeův multiplikační test jsou ekvivalentní, jakmile se velikost vzorku blíží nekonečnu (tzv. „asymptoticky ekvivalentní“). Vzorky konečné velikosti, zejména menší vzorky, však pravděpodobně poskytnou velmi odlišné výsledky.
Agresti (1990) navrhuje, že byste měli použít LRT místo Waldova testu pro malé velikosti vzorků nebo pokud jsou parametry velké. „Malá“ velikost vzorku je přibližně do 30.
Provedení testu
Potřebujete pomoci s domácím úkolem? Podívejte se na naši stránku s doučováním!
Statistický vzorec Waldova testu je:
Kde:
- = odhad maximální pravděpodobnosti (MLE),
- = očekávaná Fisherova informace (vyhodnocená při MLE).
Zásadně test hledá rozdíly: Θ0 – Θ. Obecné kroky jsou:
- Najít MLE.
- Najít očekávanou Fisherovu informaci.
- Vyhodnotit Fisherovu informaci při MLE.
S kombinací MLE a Fisherovy informace je práce s Waldovým testem velmi složitá a obvykle se nepočítá ručně. Mnoho softwarových aplikací umí tento test provést.
- Stata: použijte příkaz test.
- R: viz návod na WALD test pro R (ke stažení PDF) z University of Toronto.
- SAS: použijte příkaz TEST. WALD je výchozí, pokud není zadán žádný test.
Reference:
Agresti A. (1990) Analýza kategoriálních dat. John Wiley and Sons, New York.
Stephanie Glen. „Waldův test: Z anglického originálu StatisticsHowTo.com: „Definition, Examples, Running the Test“: Elementary Statistics for the rest of us! https://www.statisticshowto.com/wald-test/
——————————————————————————
Potřebujete pomoci s domácím úkolem nebo testovou otázkou? S Chegg Study můžete získat řešení svých otázek krok za krokem od odborníka v oboru. Prvních 30 minut s lektorem Chegg je zdarma!