Sosiaalitutkimuksen sosiodemografiset taustamuuttujat

Lukuaika noin 7 min

Tämä luku jakautuu neljään osaan. Pääset alla olevasta listasta siirtymään suoraan muihin luvun osiin.

Johdanto Ankkurilinkki ikoni

Sosiaalitutkimuksen sosiodemografisilla taustamuuttujilla kuvataan tutkimuksen havaintoyksikköjen, henkilöiden tai kotitalouksien, ominaisuuksia. Tyypillisiä tekijöitä ovat muun muassa henkilöiden sukupuoli, ikä, koulutustaso ja ammatti tai kotitaloudessa asuvien lukumäärä ja kotitalouden yhteenlasketut tulot. Tällaisia ihmisten perusominaisuuksia ja taustatekijöitä ei yleensä käsitellä kovinkaan laajasti sosiaalitutkimuksen menetelmäoppikirjoissa tai tietovarannoissa. Ne kyllä pulpahtavat esiin analyysimenetelmien esimerkeissä, mutta usein opiskelijoiden ja tutkijoiden ilmeisesti ajatellaan tuntevan tarpeeksi hyvin jo ennalta niiden keskeiset piirteet, mittaustavat, käyttömahdollisuudet ja keskinäiset yhteydet.

Näin asia tuskin on. Sosiodemografisissa taustatiedoissa on kyse sinänsä melko selväpiirteisistä faktatiedoista, mutta ne voivat päätyä tutkimusaineiston ja julkaisujen muuttujatiedoiksi erilaisista tietolähteistä ja hyvinkin eri tavoin mitattuina. Taustamuuttujiin liittyvien tilastoluokitusten tuntemus voi myös olla pinnallista. Usein taustamuuttujat vain kopioidaan kyselyihin rutiiniluonteisesti aiempien tutkimusten lomakkeista. Asiaa on käsitelty kiinnostavasti sotienjälkeistä suomalaista sosiologista lomaketutkimusta analysoineessa väitöskirjassa (Alastalo 2005).

Tämä osio pyrkii tukemaan taustamuuttujakysymysten laatimista tieteellisiin kyselyihin. Oppaan kirjoittamisen ajatuksellisena lähtökohtana on ollut tyypillinen aineistonkeruutilanne, jossa tutkija tai opiskelija on keräämässä kyselyä, jonka vastaajat täyttävät omatoimisesti. Teksti valottaa asiaa sellaisen kyselytutkimuksen näkökulmasta, jossa kaikki taustamuuttujat kysytään tutkimusaineistossa, eikä niitä koskevia tietoja liitetä aineistoon esimerkiksi viranomaisrekistereistä. Rekisteritietojakin voidaan liittää kyselyaineistoihin silloin, kun vastaajat ovat ilmoittaneet kyselytutkimuksessa henkilötunnuksensa ja antaneet myös suostumuksensa yksilöityjen rekisteritietojen liittämiseen.

Tutkittavilta ei kuitenkaan ole tarpeen eikä paikallaan tiedustella taustatietoja liian yksityiskohtaisesti. Kyselyjen vastaajia ei tule saattaa ajattelemaan, että tutkimuksessa ollaan kiinnostuneita hänen tunnistamisestaan. Siksi taustatietoja kysyttäessä vastaajille onkin syytä erikseen huomauttaa, että tietoja kerätään tutkimusaineiston tilastollista käsittelyä varten, ja että tutkimuksen tulokset tullaan julkaisemaan siten, etteivät yksittäisten vastaajien tiedot ja vastaukset tule niissä esiin.

Taustatietojen keräämistä suunnitellessa on hyvä pitää mielessä tunnistetietojen minimointi, eli keskittyä keräämään vain tutkimuksen kannalta tarpeellisia taustatietoja vastaajista ja tiedustella niitä riittävän yleisellä tasolla, jotta tunnistamisriski ei kasva liian suureksi. Lisää tietoa tunnisteista, niiden minimoimisesta ja aineiston anonymiteetistä on Aineistonhallinnan käsikirjassa.

Ennen analyysia 1: otoksen edustavuus ja painokertoimet Ankkurilinkki ikoni

Tutkittavien henkilöiden sukupuolesta, iästä ja asuinpaikasta ja muista rakennetekijöistä kirjoitettaessa on silti syytä tarkastella myös asiaan liittyviä rekisteritietoja ja taustamuuttujiin liittyviä tilastoluokituksia. Rekisteritiedot ovat voineet olla keskeisiä tutkimuksen otoksen muodostamisessa ja niitä tarvitaan arvioitaessa muun muassa väestöotoksen sosiodemografista edustavuutta suhteessa perusjoukkoon. Muiden kuin satunnaisesti valittujen väestöotosten kohdalla perusjoukon sosiodemografinen rakenne ei kuitenkaan ole aina tiedossa. Esimerkiksi yhdistyksellä ei välttämättä ole jäsenrekisteritietoja jäsenistönsä sukupuoli- ja ikäjakaumista.

Kun henkilöotoksen perusjoukon sosiodemografista rakennetta ei tunneta ennalta, on tutkimuksen yhtenä tehtävänä usein juuri selvittää kyseistä asiaa. Muissakin tapauksissa yhteiskuntatutkimuksessa on varsin tyypillistä analysoida erilaisten ryhmien sosiodemografista rakennetta, koska asia liittyy usein tasa-arvon ja oikeudenmukaisuuden toteutumiseen eri yhteyksissä. Tällöin saadaan esimerkiksi vastauksia kysymyksiin, kuinka tasapuolisesti naiset ja miehet tai eri-ikäiset henkilöt ovat edustettuina tutkittavissa joukoissa.

Tällaisten rakennetarkastelujen ohella tavanomaisia yhteiskuntatutkimuksen taustamuuttujia hyödynnetään tutkimusaineistojen laadun arvioinnissa ja sen kohentamisessa. Jos tutkimuksen perusjoukon keskeiset rakennetiedot ovat saatavilla esimerkiksi jostakin rekisteristä, on vastaavien otosjakaumien vinoutumia mahdollista korjata laatimalla haitallisimmiksi katsotut yli- ja aliedustukset poistavat painokertoimet. Näin painokerrointen käyttö yleensä tekee luotettavammiksi päätelmät siitä, kuinka varmasti otoksista saadut tulokset ovat yleistettävissä tutkimuksen perusjoukkoon.

Toisaalta painokerrointen käytössä on kuitenkin noudatettava myös maalaisjärkeä. Jos kyselyn kato ja vinoutumat ovat verraten suuria, ei painokerrointen käyttö voi korjata ongelmia kuin lumeeksi.

Ennen analyysia 2: taustamuuttujien muokkaus Ankkurilinkki ikoni

Sosiodemografisia taustamuuttujia käytetään tutkimuksessa pääasiassa kuvailevina ja selittävinä muuttujina. Joskus taustamuuttujaa on mahdollista käyttää analyysissa "sellaisenaan", eli juuri siinä muodossa missä se on kyselyssä kysytty ja tutkimusaineistoon koodattu. Perinteisesti tyypillisin tällainen muuttuja on ollut vastaajan sukupuoli. Sukupuolta tiedustellaan kuitenkin nykyisin vain harvoin dikotomisena muuttujana, joten sitäkin käsitellään usein analyysejä varten.

Hyvin usein aineiston alkuperäinen taustamuuttuja koodataan uudelleen tai yhdistetään johonkin toiseen taustamuuttujaan tarpeeksi tiiviin tai muulla tavoin tarkoituksenmukaisen analyysin toteuttamiseksi. Myöhemmässä muuttujakohtaisessa esityksessä on tarjolla useita esimerkkejä tällaisista ratkaisuista.

Varsin usein taustaominaisuutta saatetaan tiedustella usealla eri kysymyksellä. Samassa kyselyssä voidaan kysyä strukturoidusti eli valmiiksi laadituin vaihtoehdoin vastaajan peruskoulutusta, ammatillista koulutusta ja yhteenlaskettua koulu- ja opiskeluaikaa. Myös perhesuhteiden tai vastaajan työn ja ammatin tiedustelemisessa käytetään usein erillisiä kysymyksiä, joista tutkija voi yhdistellä haluamiaan tietoja koodaamalla niistä tutkimusaineistoonsa uusia muuttujia.

Taustamuuttujien käyttötapoja ja -rajoituksia Ankkurilinkki ikoni

Taustamuuttujia hyödyntävistä kuvailevista analyysimenetelmistä yleisin on ristiintaulukointi. Keskeisiä tutkittavia ilmiöitä ristiintaulukoidaan vastaajien iän, sukupuolen, koulutuksen ja muiden taustatekijöiden mukaan, ja havaitusta vaihtelusta tehdään johtopäätöksiä. Pahimmillaan taustamuuttujien ja selitettävien ilmiöiden yhteyksien kuvaus voi olla hyvin kaavamaista, yhden selittävän ja yhden selitettävän muuttujan välisten riippuvuuksien raportointia. Parhaimmillaan se voi taas olla huolellista, moniulotteista elaborointia (ks. Alkula ym. 1994), joka pohjautuu perusteltuihin ennakkokäsityksiin muuttujien välisistä vaikutussuhteista, ja useiden taustatekijöiden samanaikaiseen analyysiin ilmiöitä selittävinä tekijöinä.

Edellä mainitut esimerkit ovat tyypillisiä ristiintaulukoinnissa, joka ei juurikaan aseta rajoituksia tarkasteltavien muuttujien mittaustasolle. Rajoitukset liittyvät yleensä enemmän aineiston kokoon ja raportointimahdollisuuksiin. Taustamuuttujakohtaiset tarkastelut tulisi muodostaa sellaisiksi, että raportoitavat tunnusluvut perustuvat tarpeeksi suuriin vastaajamääriin. Tämä edellyttää taustamuuttujien, kuten iän, luokittelua siten, että tarkasteltavan ryhmän toivottu minimikoko saavutetaan. Esitettävien tulosten ei myöskään pidä perustua niin hienojakoisiin ryhmittelyihin, että raportoitavat tulokset eivät mahdu esimerkiksi yhdelle sivulle, jolloin keskeisten tulosten hahmottaminen on lähes mahdotonta kymmenien sarakkeiden ja rivien tulosmassoista.

Useiden muuttujien vaikutussuhteiden samanaikaisessa analyysissa informaatiota on yleensä niin paljon, ettei se ole hahmotettavissa riittävän helposti moniulotteisista ristiintaulukoista. Niin sanotuissa korrelatiivisissa menetelmissä muuttujien yhteyksiä ja vaikutussuhteita kuvataankin huomattavasti tiiviimmin. Selittävinä muuttujina voi olla yksi tai useampia taustamuuttujia ja muita muuttujia, mutta keskeiset tulokset päätellään jopa vain yhdestä riippuvuusluvusta. Tällaisiin tarkasteluihin sisältyy yleensä myös tiukempia vaatimuksia muuttujien mittaustasosta, ja asia koskee erityisesti myös sosiodemografisten taustamuuttujien käyttömahdollisuuksia. Näitä vaatimuksia ei kuitenkaan eritellä yksityiskohtaisesti tässä yhteydessä. Asiaan on viitattu joissakin menetelmäopetuksen tietovarannon muissa osuuksissa (ks. kovarianssi ja korrelaatio ja monimuuttujamenetelmät mm. regressioanalyysi), ja asiaa käsitellään tarkemmin menetelmäoppikirjoissa.