Haku

Predicting U.S. business cycles with recurrent neural networks : An extensive multivariate time-series analysis for comparing LSTM and GRU networks

QR-koodi

Predicting U.S. business cycles with recurrent neural networks : An extensive multivariate time-series analysis for comparing LSTM and GRU networks

Tässä tutkielmassa vertaillaan 22 eri LSTM- ja GRU-neuroverkon soveltuvuutta Yhdysvaltojen taloussyklien ennustamiseen. Valittujen neuroverkkojen tehtävä on luoda 91 päivän ennusteita valitulle selitettävälle muuttujalle käyttämällä 400:n aikaisemman päivän havaintoarvoja 26:sta indikaattorista. Valittujen mallien optimoimiseen käytetään havaintoja ajanjaksolta 1980-2005 ja niiden arviointiin ajanjaksoa 2005-2015. Suorituskyvyn arvioimisessa sovelletaan keskineliövirhettä ja keskiabsoluuttistavirhettä. Tämän lisäksi aikaiset signaalit syklin kääntymisestä nähdään suotuisina.

Neuroverkkojen parametrien optimoimiseen käytetty algoritmi sisältää tyypillisiä syväoppimisen menetelmiä. Kustannus määritetään käyttämällä keskineliövirhettä ja L1-termiä. NAG-algoritmia käytetään parametriarvojen päivittämiseen, jolle harjoitus instanssit syötetään 32 kappaleen erissä. Optimoiminen keskeytetään ennen takarajaa, mikäli saadaan merkittäviä viitteitä optimoitavan mallin ylisovittumisesta. Jokainen valittu neuroverkkoarkkitehtuuri treenataan kolme kertaa ja näiden kolmen neuroverkon tuottamien ennusteiden keskiarvoja käytetään pohjana eri arkkitehtuurien vertailussa.

Suorituskykyä tarkasteltaessa, muutama LSTM-neuroverkko pystyy saavuttamaan muita vaihtoehtoja paremman tarkkuuden. Vaikka suorituskyvystä kertovat tulokset suosivat valittuja LSTM-arkkitehtuureita, erot LSTM- ja GRU-neuroverkkojen suorituskyvyssä ovat keskimäärin pieniä. Toisaalta, GRU-menetelmät pystyvät tarjoamaan vähemmän vaihtelua arkkitehtuurien keskinäisten neuroverkkojen suorituskyvyssä, mutta tämä ei kuitenkaan johda vakaampiin ennusteisiin. Sen sijaan, parhaat suorituskyvyt antavat LSTM-neuroverkot erottautuvat muista tarjoamalla muita vakaampia ennusteita, jotka myös eroavat todellisista arvoista muita vähemmän. Suurin osa tutkituista malleista tuottaa huomattavan määrän signaaleita syklin vaihtumisesta ennen vuonna 2007 alkanutta lamaa. Sekä pienet että suuret neuroverkot selviävät syklin ennustamisesta pääpiirteissään hyvin, minkä takia LSTM- ja GRU-neuroverkkoja voidaan pitää varteenotettavina vaihtoehtoina taloussyklien ennustamisessa. Tämän lisäksi, tulokset kannustavat soveltamaan epälineaarisia koneoppimismenetelmiä yhdessä usean muuttujan aikasarja-aineistojen kanssa sellaisiin makrotalouden ennusteongelmiin, joihin ei aikaisemmin ole löydetty tarpeellista tarkkuutta saavuttavaa ratkaisua.

Tallennettuna: