Menu
Blogi: Tarik Hossain

Luottoriskien ennustaminen datan täyttämässä maailmassa

Luottoalalla yksi keskeisimpiä kysymyksiä on, kenelle myöntää luottoa? Yksinkertainen ja suoraviivainen kysymys, jolla katetaan sekä yksityishenkilöt että yritykset.

Perehdyn tässä tekstissä erilaisiin luottoriskien ennustemalleihin. Pyrkimykseni on kuvata maanläheisesti erilaisia tapoja ennustaa luottoriskejä sekä antaa neuvoja erilaisten mallien arvioimiseen sekä mallin valintaan.

Aiemmin luotonanto oli paikallista, kun nykyisin luotonantajien on toimittava globaalissa ympäristössä, jossa verkon yli tapahtuva liikenne ei tunne rajoja. Lisäksi globaalit ilmiöt vaikuttavat voimakkaasti ja välittömästi meihin. Esimerkiksi EU:n Venäjän vastaiset pakotteet sekä Venäjän vastapakotteet tekivät suurta hallaa vientiyrityksille. Jos yritys ei saa hetkeen vientituloja, niin se luonnollisesti heijastuu sen lainanmaksukykyyn.

Nykyisen talousjärjestelmän perustuessa hyvin pitkälle vieraalla pääomalla toimimiseen on likviditeettihäiriöillä tapana levitä nopeasti hyvin laajoille alueille. Nykyinen tapamme rahoittaa toimintaamme sekä yksityishenkilöinä että kuluttajina on lisännyt voimakkaasti keskinäisiä riippuvuussuhteita ja muodostanut nykyisestä talousjärjestelmästä osin erittäin epästabiilin sekä vaikeasti ennustettavan. Huomautettakoon, että kun taloudessakin on lopulta kysymys ihmisistä, niin ennustettavuuden vaikeuden ymmärtää.

Kaikessa yksinkertaisuudessaan erilaiset ennustemallit perustuvat kolmeen asiaan: dataan, menetelmään ja tekijään.

Data on raaka-ainetta ja menetelmä laatikko, jonka läpi data työnnetään ja lopputuloksena saadaan vastaus siihen ketä kannattaa luotottaa. Esimerkki oluen panemisesta: Panimon datana eli raaka-aineena ovat erilaiset viljat, humalat ja hiivat. Panimolla on omat menetelmänsä oluen panemiseen: erilaisten mäskien käymislämpötilat, väliviilennykset, suodatukset, käymisastiat ja lämpötilat. Lopputuloksena syntyvät oluet, joiden ominaisuudet riippuvat raaka-aineista, menetelmistä sekä tekijöistä.

Nykyiset työjuhdat eli regressiomallit

Pankkien ja rahoituslaitoksien työjuhtana ovat jo pitkään olleet erilaiset regressiomenetelmät, jotka perustuvat riippuvuuksien löytämiseen eri asioiden välillä. Ne perustuvat klassiseen tilastotieteeseen ja aikaan jolloin tiedon saanti oli rajoitettua ja otoksen perusteella piti pystyä ennustamaan koko asiakaskunnalle riskit. Regressiomallit toimivat kiittettävsti, jos niitä osataan käyttää oikein ja niiden heikkoudet sekä vahvuudet tunnetaan. Erityisen tarkkana tulee olla riippuvuuksien ja kausaalisuuksien kanssa. Regressiomallit paljastavat riippuvuudet, mutta eivät ota kantaa kausaalisuuteen. Sateenvarjojen myynti ja sadepäivät ovat vahvasti riippuvaisia, mutta sateenvarjojen myynti ei aiheuta sadetta.

Asiantuntijamallit eli päättelypuut

Asiantuntijamallit eli niin sanotut päättelypuut ovat suoraviivaisia pisteytysmalleja. Siinä eri ominaisuuksille annetaan subjektiiviset painoarvot, jotka perustuvat henkilön eli asiantuntijan omaan kokemukseen asiakkaista. Esimerkiksi yrityspuolella yrityksen nuori ikä tai toimiala voivat olla perusteena negatiivisille pisteille, jotka näkyvät lopullisessa pistemäärässä. Asiantuntijamallit toimivat hyvin, jos pisteytys saadaan kohdilleen. Niiden heikkous on siinä, että ne ovat voimakkaasti riippuvaisia pisteyttäjästä eli henkilöstä ja tämän kokemuksesta alalta. Lisäksi ne ovat työläämpiä rakentaa kuin regressiomallit.

Koneoppiminen

Uutena menetelmänä on koneoppiminen, jonka voi hahmottaa johdonmukaisuuksien tai kaavojen tunnistamisena. Koneoppimisen pohjana on ohjelma, jolle ryhdytään syöttämään erilaisia datasettejä, joiden pohjalta kone tekee päätöksiä. Esimerkiksi sähköpostien roskapostifilttereissä voidaan soveltaa koneoppimisen metodeja. Tyypillisesti kone tekee ensin paljon virheitä, mutta rupeaa muuttamaan päätöksiään useamman datasetin myötä. Koneoppimisen heikkouksiin kuuluu muun muassa se, että siihen tarvitaan suuret määrät dataa. Koneoppimista on sovellettu enemmän kasvojen tai äänen tunnistuksessa, mutta luottoalalla ne ovat vielä kokeiluasteella.

Data

Toinen vaihtoehto parantaa malleja on löytää uusia datalähteitä. Kuluttajapuolella datasetti koostuu usein taustatiedoista kuten tulotaso, asuinmuoto ja työpaikkatieto, ikä, sukupuoli, asuinpaikkakunta jne. Faktatietojen lisäksi voidaan käyttää tietoja hakijan nettikäyttäytymisestä: Miten hakija on liikkunut sivustolla, mikä on hänen selaimensa versio, onko käyttöjärjestelmä päivitetty viimeisimpään versioon, mikä on hakijan sivuhistoria. Mielikuvitus on lopulta rajana uusien datalähteiden löytämisessä ja niitä kannattaa etsiä, sillä ne voivat tehdä ratkaisevan eron kahden erilaisen mallin välillä.

Nykyisessä tiedon täyttämässä (data driven) maailmassa on vallan siirtyminen tilaajalta toimittajalle ellei asiakkaalla ole edes auttavaa tilastollisten mallien ymmärrystä. Jos organisaatiossasi ei ole dataosaajaa ja tuleva projekti on arvokas, niin konsultin palkkaaminen edes päiväksi voi olla kannattava investointi.

Hyvät muistisäännöt, kun organisaationne on ostamassa luottopäätösjärjestelmää

Vaadi aina menetelmien avaamista ja niiden hyvien ja huonojen puolien avaamista.
Vaadi toimittajaa avaamaan data, johon kuhunkin malli perustuu.
Lisäksi ota huomioon mallien vanhentuminen eli kuinka usein malli tulee päivittää ja siitä aiheutuvat kustannukset. Tuleeko uusi päivitys neljännesvuosittain, puolivuosittain vai vuosittain?
Lopuksi viimeinen palikka luottopäätösjärjestelmän luomisessa on tekijä eli ihminen; tässä sinun täytyy vain luottaa ihmistuntemukseesi.

Tarikin kirjoitus on julkaistu myös Luottomiehet ry:n Luottolinkki-lehdessä 3/2016


Tarik Hossain

Tarik Hossain on Bisnoden analyytikko ja ekonomisti, joka on aina valmis keskusteluun.
Lue lisää Tarikista täältä »

Tulosta

Läs mer om våra tjänster på www.bisnode.com Bisnode