Numerolukutaito
Marja Alastalo ja Sami Borg (viittausohje)
Tämä luku käsittelee teemoja, joihin viitataan tilastolukutaitona (statistical literacy), numerolukutaitona (numeracy) tai kvantitatiivisen tutkimuksen ja numerotiedon lukutaitona (quantitative literacy). Luku jakautuu neljään osaan. Pääset liikkumaan osien välillä alla olevasta listasta.
Termit 'numeracy' ja 'quantitative literacy' nousevat varmimmin esiin silloin, kun matemaatikot ja tilastotieteilijät ovat huolissaan opiskelijoiden ja kansalaisten huonoista valmiuksista ymmärtää numeerista informaatiota. Sanalla 'statistical literacy' viitataan puolestaan erityisesti tilastojen lukutaitoon eli tilastoihin liittyvän sanaston ja menettelytapojen tuntemukseen.
Käsitteet ovat käytännössä hyvin lähellä toisiaan, eikä niitä ole seuraavassa tarpeen tarkasti erottaa toisistaan. Puhumme yleisesti numerolukutaidosta tarkoittaen taitoa ymmärtää, tulkita ja arvioida numeerisen tiedon luotettavuutta ja käyttökelpoisuutta. Taidolla tarkoitamme opittavissa olevaa kykyä (skill).
Nyky-yhteiskunnassa numerolukutaidon pitäisi olla kansalaistaito siinä missä lukutaidonkin. Termi 'numeracy' on peräisin Britanniasta jo 1950-luvun lopulta (UK Committee on Education, sir Geoffrey Crowther 1959). Koska numerotiedon määrä on viime vuosikymmeninä räjähdysmäisesti kasvanut, esimerkiksi Yhdysvalloissa ja Kanadassa on alettu järjestää erikseen koulutusta numeeristen esitysten ja analyysien ymmärtämiseen ja tuottamiseen. Suomessa numerolukutaito ei ole toistaiseksi vielä noussut laajan keskustelun kohteeksi, mutta yliopistoissa asiaa ovat pitäneet esillä erityisesti tilastotieteen ja yhteiskuntatieteiden edustajat. Yhteiskuntatieteistä mainittakoon Pertti Suhosen monet julkaisut ja arviot mielipidemittausten laadusta ja tulkinnoista (esim. Suhonen 2006).
Numerotiedon lukutaitoa tarvitaan yhteiskunnassa monenlaisia tekstejä luettaessa ja arvioitaessa. Tällaisia numerotiedon paikkoja ovat muun kvantitatiiviset tutkimukset ja selvitykset, mediasisällöt sekä monenlaiset hallinnolliset asiakirjat ja raportit, kuten esimerkiksi talousarviot, tilinpäätökset ja selvitykset.
Yhteiskuntaa koskeva numerotieto voi muodostua monin tavoin. Kvantitatiivisessa yhteiskuntatutkimuksessa käytetään yleensä aineistoja, joita tutkijat ovat 1) keränneet tutkittavilta ihmisiltä itseltään erilaisilla lomaketiedonkeruun menetelmillä, 2) hankkineet hallinnollisista tai tilastorekistereistä, 3) koonneet tilastojulkaisuista tai 4) tuottaneet koodaamalla numeeriseen muotoon tekstiaineistoja, kuten media-aineistoja, haastatteluja ja kyselyjen avovastauksia.
Seuraavassa keskitymme erityisesti strukturoitua lomaketiedonkeruuta hyödyntävään kyselytutkimukseen, jota tarkastelemme pääasiassa tiedon käyttäjän näkökulmasta. Monet esittämämme näkökohdat pätevät myös muunlaisia kvantitatiivisia aineistoja ja analyysimenetelmiä hyödyntävään tutkimukseen.
Numerolukutaito edellyttää numerotiedon tuotantoprosessin hyvää tuntemusta. Numerotietojen esittäjien tulee tuottaa ja raportoida tiedot oikein, ja tietojen käyttäjien pitää kyetä arvioimaan tietojen oikeellisuutta ja luotettavuutta riittävästi. On itsestään selvää, että numerotietojen tuottajilta ja välittäjiltä tulee edellyttää syvällisempää perehtymistä asiaan kuin tietojen käyttäjältä, mutta kaikkien ryhmien on oltava riittävän hyvin perillä numerotietojen tuottamisprosessin eri vaiheista.
Siksi tarkastelumme etenee tutkimusprosessin vaiheittain. Käsittelemme jokaisesta vaiheesta joitakin keskeisiä aiheita, tulkintoja ja valintoja. Havainnollistamme esitystämme esimerkeillä ja jokaisen osion lopusta löytyy luettelo avainkysymyksistä.
Tiedonkeruuvaihe
Kyselylomakkeisiin perustuvan tutkimuksen tiedonkeruuprosessi jakautuu kolmeen osaan: lomakkeen eli mittarin rakentamiseen, tutkittavien yksiköiden valintaan ja tiedonkeruumenetelmän valintaan. Käytännössä vaiheet lomittuvat sekä ajallisesti että sisällöllisesti. Lomaketta suunniteltaessa on jo oltava näkemys siitä, keneltä aineistoa kerätään. Samoin tutkittavien valikointi edellyttää tietoa siitä, mitä ollaan tutkimassa.
Tutkittavan asian operationalisointi ja mittaaminen
Useimmat yhteiskuntatieteiden mittarit ovat sopimuksenvaraisia ja samaa ilmiötä on mahdollista mitata eri tavoin. Tutkimuksen kohteena on yleensä jokin abstrakti ilmiö, kuten esimerkiksi sosiaalinen pääoma. Tällaisen ilmiön mittareista saatavan tiedon laatuun vaikuttavat mitä suurimmassa määrin myös inhimillinen kieli ja siihen sidotut käsitteet. Kyselytiedon kannalta on ratkaisevaa, minkälaista kysymysjohdantoa, kysymystekstiä ja vastausasteikkoa mittaamisessa käytetään. Myös kysymyksen paikka lomakkeessa kehystää vastaamista.
Lomaketutkimusten tulosten herkkyys kysymysmuotoiluille on tunnistettu jo pitkän aikaa. Tästä huolimatta kotimaista metodologista tutkimusta mittareiden eroista on niukasti. Yksi valaiseva esimerkki löytyy Olli Kankaan ja Veli-Matti Ritakallion tutkimuksesta, jossa he vertailevat viittä eri köyhyysmittaria. He tutkivat sitä tuottavatko eri mittarit köyhyyden samansuuruisena ja määrittelevätkö mittarit samat henkilöt köyhiksi. Lisäksi Kangas ja Ritakallio ovat tarkastelleet pitkittäisasetelmalla sitä, minkälaisen kuvan köyhyyden muutoksista eri mittarit tuottavat.
Kankaan ja Ritakallion (2003) tutkimus perustuu vuosina 1995 ja 2000 kerättyihin lomakeaineistoihin, joissa kerättiin tietoa viidellä vakiintuneella köyhyysmittarilla: suhteellinen tulomittari, kasautuva puute, koettu puute, ylivelkaantuneisuus ja toimeentulotukiasiakkuus. Mittarit luokittelivat köyhiksi pääasiassa eri väestöryhmät. Vuonna 1995 vastanneista 28 prosenttia voitiin määritellä köyhäksi vähintään yhdellä mittarilla, kun kukin yksittäinen mittari osoitti köyhien väestöosuudeksi noin 10 prosenttia. Mittarit loivat myös toisistaan poikkeavan kuvan köyhyysasteesta sekä köyhyyden muutoksista. Neljällä mittarilla köyhyys oli viiden vuoden aikana vähentynyt, mutta suhteellisen tulomittarin mukaan köyhyys oli lisääntynyt.
Myös vastausasteikolla voi olla ratkaiseva merkitys tutkimuksen tulosten kannalta, ja siksi asteikkovalintoja on syytä tarkastella kriittisesti. Vastausskaalojen laadinnassa perusperiaatteita ovat vaihtoehtojen tarkoituksenmukainen kattavuus ja symmetrisyys. Vaihtoehtojen toisensa poissulkevuus ja vaihtoehtojen täydellisyys ovat tärkeitä silloin, kun vastaaja saa valita vain yhden annetuista vaihtoehdoista.
Vastausasteikon symmetrisyys tarkoittaa sitä, että myönteisiä ja kielteisiä vaihtoehtoja annetaan yhtä monta. Epäsymmetrisen asteikon käyttö saattaa vaikuttaa tuloksiin esimerkiksi siten, että se tuottaa joko myönteisemmän tai kielteisemmän kuvan tutkitusta ilmiöstä. Vastausasteikon kattavuus puolestaan tarkoittaa sitä, että niin numero- kuin sanallinen asteikko vastaavat ihmisten kykyä arvioida tutkittavaa asiaa. Liiallinen vaihtoehtojen määrä eli liiallinen kattavuus johtaa tulosten näennäistarkkuuteen.
Vastausvaihtoehtojen toisensa poissulkevuutta, symmetrisyyttä ja kattavuutta käsitellään tarkemmin Menetelmäopetuksen tietovarannon Kyselylomakkeen laatiminen -artikkelissa. Humoristisen esimerkin epäsymmetrisyydestä ja liiallisesta kattavuudesta tarjoaa kiertokoulutodistuksen arvosteluasteikko.
Uutisia ja tutkimuksia lukiessa törmää turhan usein vinoihin asteikkoihin ja johdatteleviin kysymisiin. Esimerkiksi sosiaali- ja terveysministeriön tutkimuksessa 1990-luvun lasten perushoivasta, hyvinvoinnista ja lastensuojelupalvelujen käytöstä käytettiin lasten psyykkisen hyvinvoinnin mittarina suomalaista versiota kansainvälisestä masennusoireiden seulomiseen kehitetystä Children's Depression Inventory (CDI) -mittarista. Mittarin suomalainen versio on kehitetty lastenpsykiatrian klinikalla Tampereella. Näin tutkimuksessa siirrettiin mittari kliinisestä käytöstä tutkimuskäyttöön.
Tutkimuksessa käytetty mittari havainnoi yhteensä 33 eri asiaa. Näistä kymmenen ensimmäistä olivat surullisuus, pessimismi, epäonnistuminen, ilon puute elämässä, huonous ihmisenä, tulevaisuuden pelko, itseviha, itsesyytös, itkuisuus ja huolestuneisuus. Lomakkeessa näitä asioita pyydettiin arvioimaan kolmiportaisella asteikolla, joka oli epäsymmetrinen siten, että vaihtoehdoista kaksi on negatiivisia ja yksi positiivinen (esimerkiksi 1. Teen useimmat asiat ihan oikein, 2. Teen monet asiat väärin, 3. Teen kaiken väärin ja 1. Vihaan itseäni, 2. En pidä itsestäni, 3. Pidän itsestäni.). Tämäntyyppiset epäsymmetriset vastausasteikot tuottavat herkästi vinoja vastausjakaumia, eivätkä niiden kokonaisjakaumat siten kuvaa luotettavasti mitattavan ominaisuuden luokkien suuruutta. Eri asia on, mikäli tutkijat pitäytyvät käyttämään asteikkoa vain tietyn ääriominaisuuden esiintyvyyden määrittelyyn osana laajempaa oirekokonaisuutta.
Myöskään kertoja tai muita määriä koskevia vastausasteikkoja ei ole aina helppoa laatia tarkoituksenmukaisiksi. Tiedon kerääjällä tulisi olla tarpeeksi esitietoa soveltuvan skaalan laatimiseksi, koska vastausvaihtoehtojen kokonaisuus vaikuttaa aina tuloksiin. Tämä tulee esille vertailtaessa kahden erilaisen asteikon tuottamaa tulosta tutkittaessa television katselun määrää. Käytettäessä matalaa asteikkoa päivittäisen television katselun määrä näytti merkittävästi pienemmältä kuin käytettäessä korkeampaa skaalaa.
Matala skaala | Korkea skaala | |||
% | % | |||
½ tuntia tai vähemmän | 7,4 | 2,5 tuntia tai vähemmän | 62,5 | |
½ tuntia – 1 tuntia | 17,7 | 2,5 tuntia – 3 tuntia | 23,4 | |
1 tuntia – 1,5 tuntia | 26,5 | 3 tuntia – 3,5 tuntia | 7,8 | |
1,5 tuntia – 2 tuntia | 14,7 | 3,5 tuntia – 4 tuntia | 4,7 | |
2 tuntia – 2,5 tuntia | 17,7 | 4 tuntia – 4,5 tuntia | 1,6 | |
Enemmän kuin 2,5 tuntia | 16,2 | Enemmän kuin 4,5 tuntia | 0,0 | |
(Lähde: Ahola ym. 2002, 72.) |
Myös kysymyksen ns. viiteaika on tulosten kannalta hyvin merkityksellinen. Esimerkin kysymyksessä viiteaika on yksi vuorokausi. Tällainen aikarajaus helpottaa vastaajaa sikäli, että hänen ei tarvitse muistella ja laskea yhteen television katsomista pitkältä ajalta. Toisaalta lyhyt viiteaika voi vaikeuttaa sellaisten henkilöiden vastaamista, joiden päivittäinen katseluaika vaihtelee merkittävästi. Viiteaikojen käyttöön ei ole olemassa yhtä yleispätevää ohjetta. Eri asioiden mittaaminen luotettavasti vaatii eripituisia ajanjaksoja.
Edellä esitetyt esimerkit ovat vain pintaraapaisu kyselyjen numerotiedon keruuvaiheen luotettavuustekijöihin. Mittaamisen luotettavuutta arvioidaan yleensä sekä validiteetin että reliabiliteetin kannalta. Validiteetilla tarkoitetaan mittarin kykyä mitata haluttua asiaa ja reliabiliteetilla mittarin kykyä tuottaa ei-sattumanvaraisia tuloksia. (Ks. myös artikkeli Mittaaminen)
Lomakekyselyistä saadun numerotiedon käyttäjä voi arvioida tutkijan tekemiä valintoja tarkistuskysymysten ja päättelyn avulla.
Kyselymittaamisen avainkysymyksiä
- Minkälaista mittaria on käytetty? Onko valinta tehty useiden vakiintuneiden mittareiden joukosta vai onko tutkija kehitellyt mittarin itse?
- Onko valinnat tehty avoimesti ja ovatko ne perusteltuja?
- Mitä kysymysmuotoa ja vastausvaihtoehtoja on käytetty? Onko mittari selkeä ja tarkoituksenmukainen? Selostetaanko mittari tiedon käyttäjälle riittävän tarkasti?
- Ovatko esitetyt vastausvaihtoehdot olleet toisensa poissulkevia silloin, kun vastaaja on voinut valita vain yhden annetuista vaihtoehdoista? Onko käytetty asteikko tarpeeksi kattava ja symmetrinen, ja onko kysymyksen mahdollisesti edellyttämä viiteaika soveltuva?
Otanta
Numerotiedon pohjana olevat tutkittavat yksiköt on mahdollista valita eri tavoin. Ensimmäinen olennainen kysymys on, voidaanko tiedot koota kokonaistutkimuksena, jossa tutkitaan kaikki kiinnostuksen kohteena olevat yksiköt. Mikäli tämä ei ole mahdollista tai järkevää, seuraava kysymys on, valitaanko tutkittavat yksiköt satunnaisesti vai harkinnanvaraisesti. Satunnaiseen valintaan perustuvat yksikköjoukot ovat otoksia kun taas harkinnanvaraisesti kerätyt yksikköjoukot ovat näytteitä. Tilastollinen päättely ja siihen liittyvien merkitsevyystestien käyttö edellyttää, että tutkittava joukko on valittu jollain satunnaisotannan menetelmällä. Kokonaistutkimuksissa merkitsevyystestejä ei tarvita, koska silloin ei ole tarpeen tehdä yleistyksiä otoksesta perusjoukkoon. (Ks. myös artikkeli Otos ja otantamenetelmät)
Otantatutkimuksessa on keskeistä ero perusjoukon ja otantakehikon välillä. Perusjoukolla eli populaatiolla tarkoitetaan sitä joukkoa, jota tutkimuksella pyritään kuvaamaan. Otantakehikko on puolestaan se luettelo, josta otos käytännössä tehdään. Esimerkiksi tutkittaessa "suomalaisia" otosta tehdään yleensä aina monin tavoin rajatusta joukosta. Tutkijat valitsevat tutkittavien ikähaarukan (esim. 15-65 vuotta tai 18-75 vuotta), kielen (kustannussyistä tutkimuksissa käytetään usein vain suomenkielistä lomaketta) ja alueen (alueista Ahvenanmaa rajataan usein pois, myös kielen perusteella). Näin lopullinen otantakehikko, josta otos poimitaan, saattaa siis sisältää jo monia rajauksia.
Joitakin ryhmiä tutkittaessa ero perusjoukon ja saatavissa olevan otantakehikon välillä voi olla jopa niin merkittävä, että satunnaisotannan käyttäminen ei ole mahdollista. Jos esimerkiksi halutaan tutkia ympäristöjärjestöjen ja -ryhmien toimijoita ja tilaisuuksiin osallistujia, heistä ei ole olemassa otantakehikkoa. Järjestöjen jäsenluetteloissa on paperijäseniä ja toisaalta kaikki osallistujat eivät liity jäseniksi. Tällaisessa tilanteessa Esa Konttinen ja Jukka Peltokoski (2000) päätyivät keräämään lomakeaineistonsa sekä järjestöjen ja ryhmien kokouksissa että julkisissa tilaisuuksissa. Näin menettelemällä he tavoittivat haluamansa ryhmän, mutta eivät toisaalta pystyneet laskemaan vastausprosenttia tai tekemään tilastollisia yleistyksiä. Tästä huolimatta aineistonkeruun ratkaisut olivat teoreettisesti perusteltuja.
Useimmiten kvantitatiivisia menetelmiä käyttävä yhteiskuntatutkimus pyrkii esittämään perusjoukkoa koskevia tilastollisia yleistyksiä otosaineiston perusteella. Tällöin tietojen luotettavuuden kannalta on olennaista, että otosaineisto on riittävän suuri, että se edustaa riittävästi ja tasapainoisesti perusjoukkoa, ja että mahdolliset tähän liittyvät puutteet on otettu huomioon tulosten laatimisessa ja niitä koskevissa tulkinnoissa. Usein aineistojen edustavuuden puutteita pyritään korjaamaan painottamalla aineistoa. Tällaiset painotusmenettelyt perustuvat oletukselle, että kerätyn aineiston kato ei ole vinoa.
Joskus aineistoja on myös mahdollista täydentää varsinaisen aineistonkeruun jälkeen.
Otannan avainkysymyksiä
- Miten tutkittavat yksiköt on valittu?
- Onko kyse kokonaistutkimuksesta, jostain satunnaisotannan menetelmästä vai jostain muusta poimintatavasta, jossa valikoitumisen todennäköisyys ei ole tunnettu?
- Onko aineisto tarpeeksi suuri ja kattava haluttujen tietojen kannalta?
- Mikä on vastausprosentti? Miten katoa on analysoitu ja sisältääkö aineisto joitakin olennaisia vinoutumia?
- Onko käytetty jotain kadon korjailumenetelmiä?
- Miten tuloksia yleistetään?
Tiedonkeruumenetelmä
Lomakeaineistojen keruussa on mahdollista käyttää erilaisia tiedonkeruumenetelmiä. Näistä tavallisimpia ovat postikyselyt ja erilaiset sähköiset tiedonkeruut sekä puhelin- ja käyntihaastattelut tai niiden yhdistelmät. Tilastokeskus (Avautuu uuteen välilehteen) myös yhdistää eri henkilörekistereistä tietoja lomaketiedonkeruisiin. Tällaisia ovat tyypillisesti henkilön koulutus ja tulot. Eri tiedonkeruumenetelmien välillä ei ole enää paljonkaan eroja siinä, kuinka hyvin ne pystyvät täyttämään otannan satunnaisuuden kriteerin. Myös verkkokyselyt soveltuvat nykyisin moniin tutkimusongelmiin ja -asetelmiin, joissa otos kerätään satunnaisesti.
Eri tiedonkeruumenetelmien välillä on kuitenkin eroja siinä, millaisia kysymyksiä niissä on mahdollista esittää tai miten eri tiedonkeruumenetelmät tavoittavat erilaisia vastaajia. Puhelinhaastattelussa lomake on yleensä lyhyempi kuin käyntihaastattelussa ja kysymysten vastausvaihtoehtojen tulee olla varsin yksinkertaisia, koska vastaajien on pystyttävä pitämään asteikko mielessä.
Postikyselyllä on mahdoton tutkia luotettavasti esimerkiksi tietämykseen liittyviä kysymyksiä. Tämä johtuu siitä, että ns. itse täytettävissä lomakekyselyissä vastaajilla on mahdollisuus hakea oikeat vastaukset tietokysymyksiin ennen vastaamista. Lisäksi tutkijan on mahdoton kontrolloida sitä, kuka lopulta kyselyyn on vastannut.
Haastattelijan kanssa toteutettavissa kyselyissä on mahdollista antaa muutakin kuin kirjallista ohjeistusta, mikä voi nostaa tietojen luotettavuutta. Toisaalta haastattelijan läsnäolo saattaa vaikuttaa eri tavoin annettaviin vastauksiin. Anja Ahola (1993) on vertaillut puhelin- ja käyntihaastatteluista saatuja vastauksia hyvinvointia koskeviin kysymyksiin. Puhelinhaastatteluissa vastaajat antoivat hyvinvoinnistaan merkittävästi myönteisemmän arvion kuin käyntihaastatteluissa. Tulos ei vastannut aikaisemman kansainvälisen tutkimuksen pohjalta tehtyjä oletuksia, joiden mukaan tiedonkeruumenetelmien välillä ei ole olennaisia eroja. Tämä esimerkki viittaa siihen, että metodologisen tutkimuksen tulokset eivät välttämättä ole suoraan siirrettävissä maasta ja kulttuurista toiseen.
Muutkin esimerkit osoittavat, että tiedonkerääjä ja tiedonkeruunkonteksti vaikuttavat eri tavoin saatuihin tietoihin. Tutkittaessa äitien raskausaikaisen tupakoinnin määrää tulokset näyttävät riippuvan siitä, missä tiedot on kerätty ja kenen keräämiä ne ovat. Sairaalan rekisteri, kotona tehdyt haastattelut ja postikysely tuottavat erilaisen tuloksen siten, että sairaalan rekisterin mukaan raskausaikainen tupakointi on vähäisintä ja postikyselyn mukaan suurinta.
Poltettujen
savukkeiden määrä |
sairaalarekisteri | kotihaastattelu | postikysely |
1–9 | 23 | 21 | 11 |
10–19 | 57 | 57 | 42 |
20 tai enemmän | 20 | 22 | 47 |
Yhteensä | 100 | 100 | 100 |
Lähde: Oakley 2000, 69. |
Aihepiirin englanninkielisessä kirjallisuudessa tunnetaan myös ns. kirjepohjaefekti. Tällä tarkoitetaan sitä, että saadut vastaukset vaihtelevat riippuen siitä, kuka kysyy. Esimerkkitutkimuksessa vastaajille esiteltiin massamurhaajia esittelevä lehtijuttu, minkä jälkeen heitä pyydettiin arvioimaan, miksi massamurhia tapahtuu. Vastaajat painottivat enemmän persoonallisuustekijöitä tai sosiaalisia tekijöitä sen mukaan, oliko tiedonkeruu toteutettu persoonallisuustutkimuslaitoksen vai sosiaalitutkimuslaitoksen nimissä. Tämän eron on tulkittu kertovan siitä, että vastaajat pyrkivät päättelemään mistä tutkijat ovat kiinnostuneita. (Ahola ym. 2002, 74, alun perin Schwartz 1999.)
Tiedonkeruun avainkysymyksiä
- Mitä tiedonkeruumenetelmää tai -menetelmiä on käytetty?
- Soveltuuko menetelmä tutkimusongelmaan?
- Mikäli tiedot koskevat muutosta ajankohdasta toiseen, onko tiedonkeruumenetelmä pysynyt samana?