Mikä on Bayesin informaatiokriteeri (BIC)?

Bayesin informaatiokriteeri (Bayesin informaatiokriteeri, BIC) on kriteeri, jonka avulla valitaan malli rajallisesta mallijoukosta. Se perustuu osittain todennäköisyysfunktioon, ja se on läheistä sukua Akaiken informaatiokriteerille (AIC).

Malleja sovitettaessa on mahdollista kasvattaa todennäköisyyttä lisäämällä parametreja, mutta tämä voi johtaa ylisovittamiseen. BIC ratkaisee tämän ongelman ottamalla käyttöön rangaistustermin mallin parametrien lukumäärälle. BIC:ssä rangaistustermi on suurempi kuin AIC:ssä.

BIC:tä on käytetty laajasti mallien tunnistamiseen aikasarjoissa ja lineaarisessa regressiossa. Sitä voidaan kuitenkin soveltaa melko laajasti mihin tahansa maksimilikelihoodiin perustuvaan mallijoukkoon.

Matemaattisesti BIC voidaan määritellä seuraavasti-

Bayesin informaatiokriteerin kaava

Sovellus & Tulkinta:

Malleja voidaan testata vastaavien BIC-arvojen avulla. Alhaisempi BIC-arvo kertoo alhaisemmista rangaistusehdoista ja siten paremmasta mallista.

Lue myös AIC-tilastot.

Vaikka nämä kaksi mittaria on johdettu eri näkökulmasta, ne liittyvät läheisesti toisiinsa. Ilmeisesti ainoa ero on se, että BIC ottaa huomioon havaintojen määrän kaavassa, mitä AIC ei tee.

Vaikka BIC on aina korkeampi kuin AIC, alhaisempi arvo näillä kahdella mittarilla, parempi malli.

Harjoitustietokanta:

Käy datatieteen ja analytiikan alustallamme Analyttica TreasureHuntissa harjoittelemassa oikeilla tietokannoilla.

Lue myös seuraavat:

Concordance Check.

Kernel Filter.

k-Means Clustering.

Vastaa

Sähköpostiosoitettasi ei julkaista.