Haku

Monte Carlo -menetelmien hyödyntäminen aineiston tutkimisessa

QR-koodi

Monte Carlo -menetelmien hyödyntäminen aineiston tutkimisessa

Monte Carlo methods utilization in data analysis

Tässä työssä tutkitaan Monte Carlo -menetelmien ominaisuuksia ja hyödyntämismahdollisuuksia. Hyvin usein aineistojen tutkiminen vaatii, että aineisto noudattaa jotain todennäköisyysjakaumaa. Monte Carlo -menetelmiä käytettäessä aineiston ei kuitenkaan tarvitse noudattaa tunnettuja todennäköisyysjakaumia, vaan aineistoja pystytään tutkimaan muodostamalla niistä yksinkertaisia mallinnusohjelmia, jotka toimivat toistokokeen omaisesti. Työssä tutustutaan pintapuolisesti muutamaan menetelmään, ja sen lisäksi Monte Carlo -permutaatiotestiä tutkitaan tarkemmin. Permutaatiotestistä luodaan tilastollinen testausohjelma, jolla voidaan tutkia erityyppisiä aineistoja.

Permutaatiotestin perusidea on vertailla itse valittua vertailuryhmää koko muun populaation. Testissä arvotaan aina vertailuryhmän alkioiden lukumäärän verran alkioita koko otospopulaatiosta ja verrataan näistä laskettua keskiarvoa vertailuryhmän keskiarvoon. Lopuksi testin antaman P-arvon perusteella voidaan päätellä, onko vertailuryhmän keskiarvo satunnaisuus huomioiden todella suurempi kuin koko otospopulaation keskiarvo.

Permutaatiotestin mallinnusohjelma osoittautuu toimivaksi tavaksi tutkia aineistoja. Testi antaa vain vähän toisistaan poikkeavia P-arvoja, kun toistomäärä yksittäisessä testissä pidetään riittävän suurena. Permutaatiotesti on lisäksi tietokoneelle hyvin kevyt suorittaa, joten testi voidaan helposti toistaa monta kertaa. Siten käyttäjä pystyy itse tutkimaan P-arvon käyttäytymistä ja tekemään siitä laajempia johtopäätöksiä. Permutaatiotesti osoittautuu siis hyödylliseksi välineeksi erilaisten aineistojen tutkimisessa riippumatta siitä, että noudattaako aineisto mitään tunnettua todennäköisyysjakaumaa vai ei.

Tallennettuna: