Kausaalipäättely havaintoaineistoon perustuvassa tutkimuksessa

Lukuaika noin 18 min

Karoliina Suonpää (viittausohje)

Monet yhteiskuntatieteilijöitä kiinnostavat kysymykset koskevat ilmiöiden syy-seuraussuhteita. Miten perhetausta vaikuttaa lapsen koulumenestykseen? Lisäävätkö ankarat tuomiot rikollisuutta? Aiheuttaako köyhyys terveysongelmia? Tämänkaltaisiin kysymyksiin vastaaminen edellyttää kausaalista päättelyä (causal inference). Mutta mistä tietää, että ilmiöiden välillä on todellakin kausaalisuhde eikä kyse ole pelkästä korrelaatiosta?

Kausaalisuutta on pohdittu pitkään niin tieteenfilosofien kuin käyttäytymistieteilijöidenkin parissa ja niin kutsutun uskottavuusvallankumouksen (credibility revolution) seurauksena kausaalisuhteiden empiiriseen todentamiseen on alettu kiinnittää entistä enemmän huomiota. Voidaan puhua jopa kausaalisesta käänteestä (causal turn). Tässä artikkelissa käydään läpi Pearlin kausaalimalli, mahdollisten lopputulemien malli, kontrafaktuaalinen kausaalisuus sekä eri tapoja huomioida valikoitumista havaintoaineistoon nojaavassa yhteiskuntatieteellisessä tutkimuksessa.

Kausaalisuus ja korrelaatio Ankkurilinkki ikoni

Korrelaatio viittaa muuttujien väliseen yhteisvaihteluun. Tunnetuin tapa kuvata ilmiöiden välistä lineaarista korrelaatiota on Pearsonin korrelaatiokerroin. Kausaalisuus sen sijaan viittaa syy-seuraussuhteeseen muuttujien välillä: X vaikuttaa Y:hyn. Yhteiskuntatieteissä havaittu kausaalisuus on yleensä luonteeltaan probabilistista eikä determinististä. Tämä tarkoittaa sitä, että X:n kausaalivaikutus Y:hyn merkitsee Y:n todennäköisyyden muuttumista X:n muuttuessa, mutta X ei ole Y:n välttämätön eikä riittävä ehto. Mikäli köyhyydellä on kausaalinen yhteys terveyteen, ihmisen kokema köyhyys lisää terveysongelmien todennäköisyyttä, mutta kaikki köyhät eivät ole sairaita eivätkä kaikki sairaat köyhiä. Fysiikassa tutkitaan ilmiöitä, joiden välillä havaitaan myös deterministisiä kausaalisuhteita: esimerkiksi painovoima vaikuttaa putoavaan kappaleeseen deterministisesti. Tässä kirjoituksessa käsitellään probabilistista kausaalisuutta.

Korrelaatio ei merkitse kausaalisuutta. Tunnettu esimerkki kausaalisuuden ja korrelaation välisistä eroista käsittelee jäätelön syömisen ja hukkumiskuolemien välistä yhteyttä: kuukausina, joina syödään paljon jäätelöä, on myös keskimääräistä enemmän hukkumiskuolemia eli jäätelön syömisen ja hukkumiskuolemien välillä on korrelaatio. Harva kuitenkaan pitää kyseistä havaintoa merkkinä syy-seuraussuhteesta ja ehdottaa jäätelönmyynnin rajoittamista hukkumiskuolemien vähentämiseksi. Tyypillisempi tulkinta on, että yhteys selittyy niin sanotuilla kolmansilla tekijöillä eli lämpimällä säällä: lämpiminä kesäkuukausina ihmiset sekä ostavat useammin jäätelöä, että viettävät useammin aikaa uiden ja veneillen.

Käytännön tutkimuksessa kausaalisuuden ja korrelaation välisen suhteen erottaminen on huomattavasti hankalampaa. Tämä saattaa johtua ihmisten luontaisesta taipumuksesta tulkita ilmiöiden välille syy-seuraussuhteita silloinkin, kun kyse on satunnaisesta vaihtelusta tai kolmansien muuttujien aiheuttamasta yhteydestä. Kausaalisuuden edellytyksistä ei myöskään ole täyttä yksimielisyyttä.

Tekoälyä tutkinut Judea Pearl (2019) on havainnollistanut syy-seuraussuhteiden päättelyä esimerkillään kausaalisuuden tikapuista (ladder of causation), joiden ensimmäinen askelma koostuu ilmiöiden välisen yhteyden havaitsemisesta – esimerkiksi edellä mainittujen jäätelön syömisen ja hukkumiskuolemien tai köyhyyden ja sairauden. Tikapuiden toinen askelma, tapahtumiin puuttuminen eli interventio kuvaa tilannetta, jossa tapahtumiin pyritään vaikuttamaan tietoisella toiminnalla. Arkielämämme on täynnä tämänkaltaisia tilanteita – ihminen, joka ottaa kipulääkkeen saadakseen päänsärkynsä loppumaan, toimii huomaamattaan kausaalisuuden tikapuiden toisella askelmalla. Toinen askelma ei kuitenkaan vielä välttämättä edellytä tieteellistä tietoa ilmiöiden syistä – kipulääkkeen ottanut ei voi tietää, johtuiko hänen olonsa paraneminen juuri lääkkeestä vai olisiko särky helpottanut joka tapauksessa.

Yhteiskuntatieteilijä, joka tahtoo antaa politiikkasuosituksia tai muotoilla teorioita ilmiöiden välisistä yhteyksistä, tavoittelee kolmatta askelmaa, jolla X:n ja Y:n välisen yhteyden ymmärtämiseen pyritään usein retrospektiivisen eli taaksepäin suuntautuvan tarkastelun avulla. Toteutuneille lopputulemille etsitään kontrafaktuaaleja (counterfactuals), eräänlaisia faktojen vastakohtia, kuvitteellisia ei-lopputulemia: Mitä päänsärylleni olisi tapahtunut, jos en olisi ottanut kipulääkettä – vaikka todellisuudessa otinkin? Kuinka monta hukkumiskuolemaa olisi tapahtunut, jos jäätelön syömistä olisi rajoitettu? Mikä yksilön taloudellinen tilanne olisi, jos hän ei olisi sairas? Tämänkaltaiseen päättelyyn vaaditaan tilastollisia menetelmiä.

Kausaalisuuden tikapuut
Kuvio 1: Kausaalisuuden tikapuut.

Judea Pearlin (2000) kehittämä graafinen DAG-malli (Directed Acyclic Graphs) on formaali tapa kuvata muuttujien välisiä yhteyksiä. Yhteiskuntatieteellisessä tutkimuksessa pienituloisten on huomattu olevan keskimäärin sairaampia kuin hyvätuloisten, mutta mistä yhteys voisi johtua? Kuviossa 2 on ensimmäisenä kuvattu kausaalinen yhteys, jossa X lisää Y:n todennäköisyyttä: köyhyys aiheuttaa terveysongelmia. Toisaalta kyseessä voi olla myös käänteinen kausaalisuus (reverse causation): terveysongelmat aiheuttavat köyhyyttä. Tulkinta kausaalisuhteesta vaikuttaa suoraan siihen, minkälaista toimenpidettä tutkija suosittelee, ja siksi tutkija tarvitsee aineistoa, jossa on tietoa useammasta kuin yhdestä aikapisteestä.

Kausaalisuhde DAG-mallin avulla esitettynä
Kuvio 2: Kausaalisuhde DAG-mallin avulla.

Kuvion 2 kolmas vaihtoehto kuvaa tilannetta, jossa jokin kolmas tekijä eli sekoittava tekijä (confounder) Z aiheuttaa sekä X:n että Y:n. Tällöin kyseessä ei ole kausaalisuhde köyhyyden ja terveyden välillä vaan valikoituminen (selection). Tämä on keskeinen huomio niin politiikkasuositusten kuin myös teorian kehittämisen kannalta: mikäli X ei ole Y:n syy, Y:hyn ei voida vaikuttaa muuttamalla X:ää vaan tarvitaan muita keinoja. Mikäli kolmas tekijä Z tunnetaan, se voidaan ottaa analyysissa huomioon.

Monissa käytännön tilanteissa kolmatta tekijää (tai kolmansia tekijöitä) ei kuitenkaan ole voitu mitata. Köyhien ja rikkaiden välillä on monia muitakin keskimääräisiä eroja kuin taloudellinen tilanne eikä näitä kaikkia tekijöitä löydy aineistosta: eroja voi löytyä esimerkiksi perimästä, elintavoista ja työolosuhteista ja ne voivat kaikki osaltaan vaikuttaa ihmisen terveyteen. Kuvion Z-muuttujasta X- ja Y-muuttujiin kulkevat katkoviivat havainnollistavat sitä, että Z-muuttujaa ei ole voitu mitata vaan kyseessä on havaitsemattoman muuttujan tuottama harha (unmeasured confounding bias).

Myös muut kuin kuviossa kuvatut yhteydet ovat mahdollisia. X:n ja Y:n välillä voi olla esimerkiksi kahdensuuntainen kausaalisuhde, yhteys voi olla epäsuora tai riippua muuttujan Z arvoista (interaktio). Jatkossa tässä kirjoituksessa keskitytään sekoittavista tekijöistä (Z) johtuvan valikoitumisen ja kausaalisuuden erottelemiseen.

Mahdolliset lopputulemat ja kontrafaktuaalinen kausaalisuus Ankkurilinkki ikoni

Tilastotieteilijä Donald Rubinin (1974, 2005) nimiin liitetty Rubinin kausaalimalli (Rubin causal model, myös Neyman-Rubin causal model) lähestyy kausaalisuutta mahdollisten lopputulemien (potential outcomes framework) kautta. Vaikka monet lopputulemat ovat elämässä mahdollisia, yksilön kohdalla vain yksi lopputulema kerrallaan voi toteutua: koettu päänsärky voi joko parantua tai olla parantumatta, opiskelupaikan yhteiskuntatieteelliseen voi joko saada tai olla saamatta. Yksilön elämässä emme siis voi havainta samanaikaisesti kuin intervention tai ei interventiota (X=0 tai X=1 eli särkylääkkeen ottaminen tai ottamatta jättäminen, yliopiston pääsykokeisiin osallistuminen tai osallistumatta jättäminen) ja vain yhden tuohon polkuun liittyvistä monista lopputulemista (päänsärky parani tai ei parantunut, opiskelupaikka saatiin tai ei saatu) – ja tätä puuttuvan tiedon ongelmaa kutsutaan usein kausaalipäättelyn perustavanlaatuiseksi ongelmaksi (fundamental problem of causal inference). Ajatus on hyvin lähellä aiemmin esiteltyä kontrafaktuaalin käsitettä: toteutumatta jääneet lopputulemat ovat siis toteutuneiden lopputulemien ei-toteutumia, kontrakfaktuaaleja. Kontrafaktuaalinen kausaalisuus on kattotermi lähestymistavoille, jotka selittävät syy-seuraussuhteita kontrafaktuaalin käsitteen avulla.

Kausaalipäättelyn perustavanlaatuisen ongelman vuoksi päättelyn tulee tapahtua ryhmätasolla: vaikka yksilö ei koskaan pääse kokemaan oman elämänsä kaikkia mahdollisia tapahtumia, voidaan löytää ryhmiä, jotka altistuvat X-muuttujalle eri tavoin ja tutkia eroavatko he myös myös Y-muuttujan osalta. Lähestymistavan hyöty tulee konkreettisimmin ilmi erilaisten poliittisten toimien tai interventioiden vaikutusten tutkimuksessa. Kuvitellaan, että tutkija haluaa tietää, voiko verenpaineeseen (Y) vaikuttaa terveysinterventiolla (X), jossa ihmisiä opastetaan esimerkiksi liikunnan lisäämiseen tai suolansaannin vähentämiseen. Koska sama yksilö ei voi samanaikaisesti sekä osallistua että olla osallistumatta terveysinterventioon, tutkija voi verrata terveysinterventioon osallistuneita (X=1) ihmisiä niihin, jotka eivät osallistuneet interventioon (X=0) ja siten analysoida intervention keskimääräistä vaikutusta osallistujien verenpaineeseen (Y). Intervention (X) kausaalivaikutus verenpaineeseen (Y) saadaan siis vähennyslaskusta:

verenpaine, jos osallistuu toimenpiteeseen –
verenpaine, jos ei osallistu toimenpiteeseen =
kausaalivaikutus

Ryhmien vertailemisen kannalta keskeiseksi kysymykseksi muodostuu se, millä perusteella yksilöt jakautuvat interventioon osallistujiin ja niihin jotka eivät osallistuneet – tai minkä tahansa kiinnostuksen kohteena olevalle X-muuttujalle altistuviin ja ei-altistuviin. Ihmiset eivät päädy erilaisiin tilanteisiin – kuten esimerkiksi osallistumaan interventioon – pelkästään sattuman seurauksena vaan myös tietoisina toimijoina, jotka tekevät valintoja omien ennakkokäsitystensä ja taipumustensa ohjaamina. Usein nämä taipumukset ja ennakkokäsitykset voivat vaikuttaa myös Y-muuttujaan. Tutkijan on siis kysyttävä, onko X-muuttujalle altistumisessa havaittava vaihtelu aidosti Y-muuttujan potentiaalisista lopputulemista riippumatonta eli eksogeenistä (exogenous variation) vai ovatko intervention osallistujat Y-muuttujan suhteen valikoituneita, jolloin vaihtelu on endogeenistä (endogenous variation). Toisin sanoen: jos osallistujien verenpaine laski intervention jälkeen, johtuiko tämä muutos interventioon osallistumisesta vai muista tekijöistä?

Mahdollisten lopputulemien malli lähtee liikkeelle ajatuksesta, jonka mukaan kausaalisuuden empiirinen todentaminen vaatii X-muuttujan muokkaamista (manipulation tai intervention). Kausaalisuhdetta X:n ja Y:n välillä ei siis voida todentaa tilanteessa, jossa X-muuttujaan ei voida vaikuttaa. Taloustieteilijä Guido Imbens (2020) havainnollistaa asiaa esimerkillä: Pysyviin ominaisuuksiin – kuten sukupuoleen tai etniseen taustaan – kohdistuvaa syrjintää on vaikea todentaa empiirisesti, koska niitä ei voi muokata. Tutkimusasetelma voidaan kuitenkin rakentaa niin, että vaihtelua tuotetaan yksilön ominaisuuksien sijaan niistä annettavaan informaatioon. Esimerkiksi sosiologi Akhlaq Ahmad (2019) hyödynsi tämänkaltaista asetelmaa tutkiessaan etnisen taustan ja sukupuolen vaikutusta työpaikan saamiseen. Kokeellisessa tutkimuksessaan Ahmad lähetti työpaikkoihin hakemuksia, jotka erosivat toisistaan merkittävällä tavalla ainoastaan hakijoiden äidinkielen ja sukupuolen osalta, ja osoitti siten erityisesti maahanmuuttajataustaisten miesten kokevan syrjintää suomalaisilla työmarkkinoilla.

Vaatimus X-muuttujan muokattavuudesta on pohjana yhteiskuntatieteilijöiden yleisesti jakamalle ajatukselle, jonka mukaan paras tapa tutkia X:n kausaalivaikutusta Y:hyn on satunnaistettu vertailukoe (randomized controlled trial), jossa ihmiset satunnaistetaan koeryhmään (X=1) ja vertailuryhmään (X=0). Tämänkaltainen tutkimus on yleistä lääketieteen piirissä. Ajatus on tuttu myös edellä esitellystä Pearlin kausaalisuuden tikapuista, joiden toisella askelmalla arkielämän tulkinnat kausaalisuhteista perustuivat erilaisiin interventioihin – tosin arkielämässä interventioita ei toteuteta eikä analysoida systemaattisesti.

Yhteiskuntatieteissä kokeellinen tutkimus on kuitenkin verrattain vähäistä eikä se sovellu kaikkiin tutkimuskysymyksiin. Satunnaistamista ei ole aina mahdollista toteuttaa tai se ei ole eettisesti kestävää. Vaikka työnantajille lähetettäviä hakemuksia voidaan satunnaistaa, on ilmeistä, ettei esimerkiksi vankeuden vaikutuksia voida tutkia arpomalla ihmisiä vankilaan eikä koeryhmään arvottuja ihmisiä voida pakottaa noudattamaan terveysintervention suosituksia. Terveydenhuollon ja sosiaalitoimen ammattilaisten tarvetta suunnata toimenpiteet ihmisille, jotka sekä tarvitsevat että todennäköisesti hyötyisivät niistä eniten, ei ole helppo sovittaa yhteen kausaalisen tutkimuksen edellytysten kanssa.

Vaikka kokeilukulttuuriin liittyen onkin tehty lupaavia avauksia (esim. perustulokokeilu ks. Hämäläinen ym. 2020, kokeiluihin liittyvästä lainsäädännöstä ks. Opas kokeilulakien valmistelun tueksi (Avautuu uuteen välilehteen) ), yhteiskuntatieteellinen kausaalipäättely ei voi nojata pelkästään kokeellisiin aineistoihin (experimental data). Useimpien kysymysten osalta yhteiskuntatieteilijä joutuu havainnoimaan ryhmiä, jotka ovat jo ennen tutkimusta eri tavoin päätyneet X-muuttujan piiriin. Tämänkaltaista tutkimusta kutsutaan havaintoaineistoon (observational data) perustuvaksi tutkimukseksi. Seuraavaksi käsitellään, miten havaintoaineistoa voidaan hyödyntää kausaalisessa päättelyssä.

Havaitun harhan huomioiminen Ankkurilinkki ikoni

Kuten DAG-mallien yhteydessä todettiin, X:n ja Y:n välistä yhteyttä sekoittavat tekijät Z voivat olla aineistossa havaittuja tai havaitsemattomia. Perinteinen tapa vähentää havaittua harhaa (overt bias) on regressioanalyysi. Otetaan esimerkiksi aiemmin kuvattu tilanne, jossa tutkija tahtoo selvittää, laskiko terveysinterventioon osallistuneiden (X=1) verenpaine (Y) enemmän verrattuna niihin, jotka eivät osallistuneet interventioon (X=0). Regressioanalyysin avulla tutkija voi tarkentaa intervention (X) yhteyttä verenpaineeseen (Y) vakioimalla näitä sekoittavia tekijöitä, esimerkiksi osallistujien sukupuolen (Z1), terveyshistorian (Z2) ja tulotason (Z3). Näin tutkija voi tarkastella, selittyykö intervention ja verenpaineen välinen yhteys edellä mainituilla mitatuilla taustatekijöillä.

Kuten kuvion 2 DAG-mallissa todettiin, sekoittavat tekijät X:n ja Y:n välillä voivat aiheutua myös sellaisista muuttujista, joita ei ole voitu mitata. Muuttujien vakioimisella voidaan kontrolloida vain havaittua harhaa, mutta havaitsemattoman harhan (hidden bias) ongelmaa ei voida ratkaista. Toisin sanoen, tutkija ei kolmansien muuttujien vakioimisenkaan jälkeen voi tietää, johtuiko interventioon osallistuneiden verenpaineen lasku itse interventiosta vai muista tekijöistä – esimerkiksi osallistujien elinolosuhteista tai taipumuksista. Tutkija ei siis saa selville intervention kausaalista vaikutusta.

Toisen suositun tavan huomioida havaittua harhaa muodostavat erilaiset kaltaistamiseen (matching) perustuvat menetelmät, jotka pyrkivät jäljittelemään koeasetelmaa etsimällä X-muuttujalle altistuneille (X=1) mahdollisimman samankaltaisista ihmisistä koostuvan verrokkiryhmän (X=0). Toisin sanoen, kaltaistamisen avulla tutkija pyrkii tasapainottamaan eroja ryhmien välisissä sekoittavissa tekijöissä (Z), joilla saattaa olla vaikutusta lopputulemaan (Y). Edellistä esimerkkiä mukaillen tutkija kysyy, mikä interventioon osallistumisen (X) vaikutus verenpaineeseen (Y) olisi, jos interventioon osallistuneet olisivat keskimäärin samankaltaisia kuin ne, jotka eivät osallistuneet interventioon? Aivan kuten kolmansien muuttujien vakioiminen regressioanalyysin avulla, myös kaltaistaminen on käypä tapa rajata ja tarkentaa X:n ja Y:n välistä yhteyttä, mutta sekään ei pysty ratkaisemaan havaitsemattoman harhan ongelmaa.

Kvasikokeelliset menetelmät Ankkurilinkki ikoni

Taloustieteen piirissä levinneen uskottavuusvallankumouksen seurauksena kausaalivaikutuksen tarkka identifioiminen on tullut entistä keskeisemmäksi. Perinteinen, regressiomalliin nojaava selitystapa pyrkii huomioimaan sekoittavat tekijät mahdollisimman tarkan mittaamisen ja tilastollisen mallintamisen avulla (model-based approach), mutta kuten edellä osoitettiin, tällä tavoin voidaan kontrolloida vain havaittua harhaa. Kausaalivaikutusten tarkkaa identifikaatiota korostavassa lähestymistavassa huomio kiinnittyy sekoittavien tekijöiden mittaamisen sijaan itse tutkimusasetelmaan (design-based approach): tutkija pyrkii hyödyntämään asetelmia, joissa X-muuttujan vaihtelu on eksogeenistä eikä kyseessä siis ole valikoituminen.

Tyypillisiä esimerkkejä tämänkaltaisista asetelmista ovat luonnollisia koeasetelmia (natural experiment) hyödyntävät eli kvasikokeelliset tutkimukset. Niillä viitataan tutkimusasetelmiin, joissa jokin eksogeeninen tekijä saa aikaan satunnaista vaihtelua Y-muuttujaan potentiaalisesti vaikuttavassa tekijässä X. Keskeisin ero satunnaistettuun vertailukokeeseen on siinä, että tutkija ei kontrolloi koetilannetta vaan tutkijan tehtäväksi jää sopivien tutkimusasetelmien löytäminen. Seuraavassa käydään läpi kaksi luonnollista koeasetelmaa: instrumenttimuuttuja- ja regressioepäjatkuvuusmenetelmä. Niitä ennen esitellään kuitenkin kiinteiden vaikutusten malli, jonka avulla voidaan huomioida osa havaitsemattomista sekoittavista tekijöistä.

Kiinteiden vaikutusten mallia (fixed effects model, FE) käyttävä tutkija ei etsi eri tavoin X-muuttujalle altistuneita ryhmiä vaan malli hyödyntää saman yksilön kokemuksia eri aikoina. Toisin sanoen, malli analysoi yksilönsisäistä (within-individual) eikä yksilöiden välistä (between-individual) vaihtelua X-muuttujalle altistumisessa. Keskeisenä etuna perinteiseen regressiomalliin ja kaltaistamiseen nähden on se, että mallin avulla voidaan huomioida myös osa havaitsemattomasta harhasta. Kiinteiden vaikutusten mallissa X:n ja Y:n välistä yhteyttä sekoittavat havaitsemattomat tekijät Z jaetaan pysyviin (time-stable confounders) ja ajassa vaihteleviin (time-varying confounders) tekijöihin. Kiinteiden vaikutusten malli huomioi vain pysyvät havaitsemattomat tekijät, joihin kuuluvat esimerkiksi yksilön kokemat lapsuuden perheolot, persoonallisuuspiirteet sekä perimä. Sen sijaan malli ei pysty huomioimaan ajassa vaihtelevia havaitsemattomia tekijöitä, joita ovat esimerkiksi muuttuva terveydentila tai päihdeongelma.

Kiinteiden vaikutusten malli edellyttää vähintään kaksi mittauspistettä samalle henkilölle. Vain ne havaintoyksiköt, joilla on vaihtelua X-muuttujassa, voidaan ottaa mukaan analyysiin. Tämä on myös mallin rajoite: tutkimusaineiston rajaaminen pelkästään niihin havaintoyksiköihin, joilla on riittävästi vaihtelua, voi heikentää mallin yleistettävyyttä koko perusjoukkoon. Kuviossa 3 on havainnollistettu mallin vaatiman pitkittäis- eli paneeliaineiston rakennetta. Kuvion molemmilta tutkimushenkilöiltä (H1 ja H2) on neljä mittauspisteitä ja vaihtelua siinä, ovatko he olleet X-muuttujalle altistuneita (X=0 tai X=1). Yksinkertaisuuden vuoksi kuviossa on vain yksi X-muuttuja ja sekä X- että Y-muuttujaa on mitattu dikotomisen asteikon (0 ja 1) avulla, mutta kiinteiden vaikutusten malli soveltuu myös jatkuvien muuttujien ja useamman kuin yhden selittävän tekijän vaikutuksen estimoimiseen.

Esimerkki kiinteiden vaikutusten mallin aineistosta
Kuvio 3: Kiinteiden vaikutusten mallin vaatima aineisto.

Kriminologi Mikko Aaltonen ja kumppanit (2013, 2016) hyödynsivät kiinteiden vaikutusten mallia tutkiessaan työttömyyden ja velkaongelmien yhteyttä rikollisuuteen. Aiemman tutkimuksen perusteella tiedettiin, että työttömät ja velkaongelmaiset ihmiset tekevät keskimäärin enemmän rikoksia verrattuna ihmisiin, jotka eivät ole työttömiä tai velkaongelmaisia, mutta ryhmien välillä on todennäköisesti paljon muitakin eroja. Aaltosen ja kumppanien tutkimuksissa osoitettiin, että samat ihmiset tekivät enemmän rikoksia ollessaan työttöminä tai ulosoton piirissä verrattuna niihin ajankohtiin, joina he eivät olleet työttöminä tai ulosoton piirissä. Työttömyyden ja velkaongelmien yhteys rikollisuuteen oli kuitenkin huomattavasti heikompaa yksilönsisäisessä kuin yksilöiden välisessä vertailussa.

Kiinteiden vaikutusten malli ei voi osoittaa kausaalista yhteyttä X-muuttujan ja Y-muuttujan välille, koska malli voi poistaa vain osan valikoitumisen aiheuttamasta harhasta: on mahdollista, että esimerkiksi ulosoton ja rikollisuuden ajallisen yhteisvaihtelun taustalla oli jokin muu elämäntilanteen muutos, esimerkiksi lisääntynyt päihteiden käyttö. Malli kuitenkin tarkentaa X:n ja Y:n suhdetta merkittävästi: jos X:n ja Y:n yhteys säilyy kiinteiden vaikutusten mallissa, voidaan päätellä, että yhteys ei selity pelkästään pysyvien tekijöiden aiheuttamalla valikoitumisella.

Kiinteiden vaikutusten mallia voidaan käyttää myös sisarusasetelmissa (sibling fixed-effects model), joissa eri tavoin X:lle altistuneita sisaruksia verrataan toisiinsa. Tällä tavoin voidaan huomioida sisarusten jakamia sekoittavia tekijöitä eli geenejä ja jaettuja ympäristötekijöitä. Hyöty on ilmeinen, koska nämä perhevaikutukset aiheuttavat usein havaitsematonta harhaa. Myös taloustieteen piirissä paljon käytettyä difference-in-differences -menetelmää voidaan ajatella eräänlaisena kiinteiden vaikutusten mallin erityistapauksena.

Merkittävä kvasikokeellinen menetelmä on instrumenttimuuttujamenetelmä (instrument variable, IV), jonka avulla voidaan ideaalitilanteessa poistaa valikoitumisesta johtuvat ongelmat samaan tapaan kuin satunnaistetussa vertailukokeessa. Kuten aiemmin todettiin, kausaalipäättelyn mahdollistamassa tilanteessa X-muuttujalle altistumiseen kohdistuu eksogeenistä eli Y-muuttujasta riippumatonta vaihtelua. Instrumenttimuuttujaa käyttämällä X-muuttujan eksogeeninen vaihtelu voidaan erottaa endogeenisestä vaihtelusta ja sitä kautta saavuttaa puhdistettu estimaatti X:n vaikutuksesta Y:hyn.

Kuviossa 4 on havainnollistettu menetelmäkirjallisuudessa (esim. Angrist & Pischke 2009) esitettyjä instrumentin vaatimuksia. Ensiksi, instrumenttimuuttujan tulee aiheuttaa X:ään vaihtelua, joka ei riipu muuttujista Z. Toiseksi, instrumenttimuuttuja saa vaikuttaa Y-muuttujaan ainoastaan X-muuttujan kautta. Hyvän instrumenttimuuttujan löytäminen ei ole helppoa. Menetelmän käyttö vaatii vahvaa tutkittavan aiheen ymmärrystä, jotta tutkija voi arvioida, kulkeeko instrumentin vaikutus Y-muuttujaan varmasti vain X-muuttujan kautta. Lisäksi instrumentin ja X-muuttujan välisen yhteyden tulee olla riittävän vahva; puhutaankin heikoista ja vahvoista instrumenteista.

Instrumenttimuuttujan vaatimukset
Kuvio 4: Instrumenttimuuttujan vaatimukset.

Instrumenttimuuttujina on käytetty esimerkiksi luonnonkatastrofeja ja sään vaihtelua, talouden taantumia, lakimuutoksia tai erilaisten arvontojen kohteeksi joutumista. Viime aikoina instrumenttimuuttujia on hyödynnetty enenevässä määrin tuomioiden vaikutuksen tutkimuksessa. Amerikkalainen kriminologi Charles Loeffler (2013) hyödynsi instrumenttimuuttujaa tutkiessaan tuomioiden ankaruuden (X) vaikutusta uusintarikollisuuteen (Y). Cookin piirikunnassa rikostapaukset jaetaan tuomareille arpomalla, jolloin rikoksentekijän omat ominaisuudet eivät vaikuta siihen, minkälaisen tuomarin pakeille hän päätyy. Koska tuomarit eroavat toisistaan siinä, kuinka ankaria tuomioita heillä on taipumus määrätä, tuomaria voidaan käyttää instrumenttimuuttujana. Mikäli tuomion ankaruudella – esimerkiksi vankeuden pituus – on tämänkaltaisessa asetelmassa yhteys yksilön uusintarikollisuuteen, yhteys ei selity tuomiota edeltäneillä piirteillä tai olosuhteilla vaan tuomion kausaalisella vaikutuksella. Loefflerin tutkimuksessa tuomion ankaruudella ei ollut vaikutusta rikoksentekijän myöhempään uusintarikollisuuteen.

Instrumenttimuuttujan käytön keskeisin rajoite liittyy siihen, että hyviä eli riittävän vahvoja ja aidosti eksogeenistä vaihtelua aiheuttavia instrumentteja on usein vaikea löytää. Monessa tilanteessa instrumentti, joka vaikuttaa X-muuttujalle altistumiseen – esimerkiksi yhteiskunnallinen mullistus – saattaa vaikuttaa myös Y-muuttujaan ja siten rikkoa hyvän instrumentin vaatimuksia.

Toinen mahdollinen kvasikokeellinen menetelmä on regressioepäjatkuvuusasetelman (regression discontinuity, RD) käyttö. Epäjatkuvuus viittaa siihen, että menetelmä hyödyntää jonkin jatkuvan muuttujan katkoskohtaa – eräänlaista hyppyä – vaikutusten estimoimisessa. Tunnettuja arkielämään liittyviä esimerkkejä epäjatkuvuudesta liittyy tilanteisiin, joissa yhteiskuntajärjestelmä soveltaa ihmiseen erilaisia sääntöjä riippuen siitä, minä päivänä hän on syntynyt. Suomalaisessa koulujärjestelmässä vuoden viimeisenä päivänä syntynyt lapsi päätyy useimmissa tapauksissa aloittamaan koulunsa lähes vuotta aikaisemmin kuin vasta seuraavana päivänä syntynyt ikätoverinsa, ja iältään 17 vuotta ja 364 päivää oleva nuori ei saa ostaa kaupasta olutta kuten päivää vanhempi luokkatoverinsa. Ihmisen kypsyys ei kuitenkaan muutu yhdessä yössä yhteiskunnan säätämässä katkoskohdassa vaan lähellä katkoskohtaa olevat ihmiset muistuttavat toisiaan monin tavoin.

Regressioepäjatkuvuusasetelman keskeisenä vaatimuksena on jokin jatkuva muuttuja, joka ennustaa X-muuttujan arvoa 0 tai 1 sekä katkoskohta, jossa X-muuttujan todennäköisyys muuttuu selvästi. Mikäli myös vastemuuttujassa Y havaitaan selvä muutos katkoskohdassa, X:lle altistumisella on todennäköisesti kausaalinen vaikutus Y-muuttujaan. Taloustieteilijä Kristiina Huttunen ja kumppanit (2018) hyödynsivät toisen asteen koulutukseen pääsemiseen liittyvää epäjatkuvuutta: koska juuri ja juuri hyväksytyn rajan alle jäävät nuoret ovat keskimäärin samankaltaisia kuin juuri ja juuri hyväksytyn rajan ylittävät nuoret, asetelman avulla voitiin tutkia toisen asteen koulutukseen pääsyn (X) kausaalista vaikutusta rikollisuuteen (Y). Tutkijat havaitsivat, että koulutukseen pääseminen vähensi poikien rikoksia koulutuksen alkua seuraavina vuosina.

Kuviossa 5 on havainnollistettu regressioepäjatkuvuusmenetelmän oletuksia: vaikka jakauman ääripäiden välillä olisi suuri ero, lähellä katkoskohtaa (punainen viiva) olevat ihmiset ovat todennäköisesti keskimäärin samanlaisia sekä havaittujen että havaitsemattomien muuttujien osalta ja mahdolliset erot Y-muuttujassa johtuvat siis todennäköisesti erilaisesta altistumisesta X-muuttujalle. Asetelman oletusten täyttymistä ja tuloksia tarkastellaan usein graafisesti. Tavoite on, että katkoskohdassa vain X-muuttujan todennäköisyys muuttuu, mutta katkosta ei havaita muissa potentiaalisesti Y-muuttujaan vaikuttavissa muuttujissa. Käytännössä tarkastelua voidaan tehdä vain havaittujen muuttujien osalta – havaitsemattomien muuttujien osalta mallin oletusten täyttymistä ei voida tarkastella. Regressioepäjatkuvuusmenetelmän tuottamien tulosten yleistämiseen liittyy rajoitteita. Mallin havaitsema vaikutus on paikallinen – ei ole selvää, olisiko keskimääräinen vaikutus sama toisessa katkoskohdassa.

Esimerkki epäjatkuvuudesta X-muuttujalle altistumisessa
Kuvio 5: Epäjatkuvuus X-muuttujalle altistumisessa.

Yhteenveto Ankkurilinkki ikoni

Visuaaliset DAG-mallit, mahdolliset lopputulemat sekä kontrafaktuaalinen kausaalisuus antavat yhteiskuntatieteilijälle käsitteellisiä välineitä syy-seuraussuhteiden analysoimiseen (DAG-mallien ja mahdollisten lopputulemien eroista ja yhtäläisyyksistä, ks. Imbens 2020 ja Gelman 2011). Kausaalimallin graafinen hahmottaminen voi olla hyödyllinen lähtöpiste monen tutkimuskysymyksen kohdalla.

Perinteinen tapa vakioida kolmansia muuttujia regressioanalyysin avulla tai kaltaistamismenetelmien käyttö ei ratkaise valikoitumisen ongelmaa, koska valikoituminen rajoittuu harvoin pelkästään havaittuihin muuttujiin. Tässä kirjoituksessa esitellyt kiinteiden vaikutusten malli ja erityisesti instrumenttimuuttuja- ja regressioepäjatkuvuusmenetelmä ovat keskeisiä menetelmiä, kun pyrimme huomioimaan valikoitumista ja vastaamaan kausaalisuhteita koskeviin kysymyksiin: miten X on yhteydessä Y-muuttujaan? Voisiko Y-muuttujaan vaikuttaa muokkaamalla X-muuttujaa? Suomalaiset rekisteriaineistot tarjoavat korkeatasoista, moniin kvasikokeellisiin asetelmiin soveltuvaa pitkittäisaineistoa. Vaikka yhteiskunnan katkoskohtia ei aina löydy yhteiskuntatieteilijöitä kiinnostavien kysymysten analysoimiseksi, esimerkiksi kiinteiden vaikutusten mallia voisi hyödyntää huomattavasti nykyistä useammin.

Yhteiskuntatieteilijöille hyödyllisiä menetelmäoppikirjoja ovat esimerkiksi Mostly harmless econometrics (Agrist & Pischke 2009), jonka luvut 4 ja 5 olivat myös tämän kirjoituksen keskeisiä lähteitä, sekä Counterfactuals and Causal Inference (Morgan & Winship 2007). Myös rikosteemoihin keskittyvä oppikirja Analysis Techniques for non-Experimental Data: An Introduction (Bijleveld, van de Weijer, Ruiter & van der Geest 2018) sopii johdatukseksi aiheeseen ja sisältää useimmista muista oppikirjoista poiketen ohjeita myös SPSS-ohjelman käytölle. Kvasikokeellisista menetelmistä kiinnostuneen kannattaa kuitenkin opiskella myös R:n tai Statan käyttöä, koska niille löytyy huomattavasti enemmän ohjeita oppikirjoista ja verkosta.