KvantiMOTV

Ajankohtaista | MOTV-lista | Palaute

Menetelmäopetuksen tietovaranto - KvantiMOTV
!

KvantiMOTV on päivitetty Kvantitatiivisen tutkimuksen verkkokäsikirjaksi. Lue päivitetty artikkeli Mittaaminen: Muuttujien ominaisuudet.

Mittaaminen: Muuttujien ominaisuudet

Yleistä mittaamisesta
Tilastoyksikkö ja muuttujat
Havaintomatriisi
Muuttujien ominaisuudet: numeerinen/sanallinen, jatkuvuus, dikotomia, mittaustasot ja mitta-asteikot
Mittareiden luotettavuus: operationalisointi, validiteetti, reliabiliteetti

Muuttujilla mitataan mm. mielipiteitä, olettamuksia, arvoja, asenteita, tietämistä tai taustatietoja. Muuttujien sisällölliset ominaisuudet ovat tärkeitä. On syytä pohtia, millaisella muuttujalla mitäkin asiaa kuvataan; mitä ominaisuusvaatimuksia tilastolliselle muuttujalle asetetaan. Näitä asioita on syytä pohtia jo lomakkeen suunnitteluvaiheessa. Näihin vaatimuksiin vaikuttaa myös yhtäältä se, millaisia tilastomenetelmiä halutaan myöhemmin soveltaa ja toisaalta se, miten tutkija uskoo saavansa vastaajilta mahdollisimman relevanttia tietoa. Myös tutkimustuloksia tulkittaessa on syytä tiedostaa, millaisen kysymyksen tai väittämän avulla kyseiseen tilastolliseen muuttujaan on päädytty.

On olemassa numeerisia ja ei-numeerisia muuttujia. Ei-numeeriset muuttujat mielletään usein nimenomaan mahdollisiksi kuvaamaan tilastoyksikön laatua. Kuitenkaan laatu ja määrä eivät ole toisistaan täysin erillisiä: sukassa olevien reikien määrä kertoo sukkien laadusta! Sairaalan osastolla toimivien hoitajien määrä kertoo hoidon laadun potentiaalisista mahdollisuuksista. Vaaleissa annetut äänimäärät kertovat ehdokkaiden suosiosta, mikä myös on eräänlaista laadun mittaamista. Myöskään numeerisen ja ei-numeerisen raja ei ole välttämättä täsmällinen: Esimerkiksi palkkaluokkamuuttuja on tietyssä mielessä numeerinen, sillä palkkaluokat voidaan määritellä numeroilla; toisaalta palkkaluokilla ei voi esimerkiksi suorittaa laskutoimituksia samoin kuin tavanomaisilla numeerisilla muuttujilla.

Muuttuja on jatkuva, kun sen kahden arvon välissä on ääretön määrä arvoja. Konkretisoituna se tarkoittaa, että lukuarvon perään voidaan aina lisätä desimaaleja; lukuarvo voidaan ilmoittaa aina tarkemmin ja tarkemmin. Lukusuoralla ajateltuna: kahden pisteen välistä voidaan aina osoittaa uusi piste. Esimerkiksi 1 km:n ja 1,1 km:n välissä on 1,01 km; edelleen 1 km:n ja 1,01 km:n välissä 1,005 km jne. Aika voidaan myös ilmoittaa tarkemmin ja tarkemmin: 1/10 000 sekuntia, 1/100 000 sekuntia tai vaikkapa miljardisosa sekuntia jne. Mittaustarkkuus on kuitenkin rajoitettu. Yhteiskunnallisia ilmiöitä tarkasteltaessa ajasta usein riittää vuoden tai puolen vuoden tarkkuus. Matkoissa riittää kilometrien tai kymmenien kilometrien tarkkuus, riippuen tutkimusaiheesta. Joskus muuttujan jatkuvuusominaisuutta halutaan korostaa esimerkiksi siten, että aikasarjoja kuvataan viivadiagrammilla tai pylväskuviota käytettäessä pylväät ovat kiinni toisissaan.

Muuttuja on epäjatkuva eli diskreetti, kun sen mitta-asteikolla siirrytään hyppäyksittäin arvosta toiseen. Tyypillinen epäjatkuva muuttuja on lukumäärä, esimerkiksi lasten lukumäärä: perheessä on 2 tai 3 lasta, ei 2,7456 lasta. Mielenkiintoista kuitenkin on, että suomalaisilla on Tilastokeskuksen mukaan vuonna 1999 keskimäärin 1,82 alle 18-vuotiasta lasta! Muuttujan jatkuvuus tai epäjatkuvuus voidaan huomioida graafisissa esityksissä: Esimerkiksi histogrammissa, jossa pylväät ovat kiinni toisissaan, jatkuvuusominaisuus korostuu verrattuna pylväsdiagrammiin. Jatkuvuusominaisuus liitetään yleensä kvantitatiivisiin muuttujiin, mutta tarkemmin ajateltuna myös monet kvalitatiiviset muuttujat ovat jatkuvia. Voisivatko esimerkiksi 'väri' tai 'hyvinvoinnin taso' olla jatkuvia muuttujia?

Muuttujan sanotaan olevan dikotominen, jos se saa kaksi arvoa: ominaisuus on olemassa kyseisellä tilastoyksiköllä tai sitä ei ole olemassa; henkilö on Suomen kansalainen tai ei ole. Mikäli muuttujan dikotomiaominaisuutta nimenomaan halutaan hyödyntää, se koodataan 0-1-muuttujaksi (0=ei, 1=kyllä). Tällaisia muuttujia kutsutaan dummy-muuttujiksi. Esimerkiksi muuttujan 'siviilisääty' alkuperäisistä arvoista, naimisissa - naimaton - eronnut - leski, voidaan muodostaa neljä dummy-muuttujaa: naimisissa (0=ei, 1=kyllä), naimaton (0=ei, 1=kyllä), eronnut (0=ei, 1=kyllä) ja leski (0=ei, 1=kyllä). Dummy-muuttujia käytetään mm. regressioanalyysissä.

Hyvin tärkeä muuttujan ominaisuus on se, millä tasolla muuttuja määrittelee tilastoyksiköiden väliset erot. Tällöin on kysymys esimerkiksi siitä, onko muuttujan tehtävä pelkästään luokitella tilastoyksiköt jonkin ominaisuuden mukaan vai panna tilastoyksiköt ominaisuuden mukaiseen järjestykseen (ei lainkaan, vähän, paljon ominaisuutta) vai määritelläänkö tilastoyksiköiden erot muuttujalla jopa tarkkoina lukuarvoina ominaisuuden määrän mukaan. Tällaisessa muuttujan mittaustason määrittämisessä käytetään mitta-asteikkoja.

Mitta-asteikot ja mittaustaso

Jokaisen tilastollisen muuttujan mahdolliset arvot ovat peräisin tietyltä mitta-asteikolta. 'Mitta-asteikko' on helppo mieltää numerisiin muuttujiin. Kuitenkin kvantitatiivista tutkimusta tehtäessä puhutaan mitta-asteikosta myös ei-numeeristen eli sanallisten, ns. merkkitietomuuttujien yhteydessä. Mittaustaso riippuu mitta-asteikon tarkkuudesta ja mitattavasta asiasta; esimerkiksi henkilön tulot voidaan ilmoittaa valinnan mukaan joko täsmällisinä markkamäärinä tai palkkaluokkana, mutta onnellisuuden mittaaminen on epätarkempaa, sillä siihen ei ole mittayksikköä. Mitta-asteikkojen luokittelu neljään eri tyyppiin perustuu niiden ominaisuuksiin. Usein termejä 'mittaustaso' ja 'mitta-asteikko' käytetään synonyymeinä: puhutaan esimerkiksi sekä luokittelutason että luokitteluasteikon muuttujasta.

Käytettävän mittaustason määrääminen kullekin muuttujalle on tärkeää jo tiedonkeruuta suunniteltaessa. Pääsääntönä voidaan pitää, että tieto kerätään mahdollisimman alkuperäisenä, siis tarkimmalla mahdollisella mittaustasolla. Toisinaan luotettavuusseikat edellyttävät tarkkuusvaatimusten lieventämistä. Viimeistään aineistoa analysoitaessa tutkija törmää mittaustasoihin, sillä tilastomenetelmät on kehitetty siten, että niillä on tiettyjä mitta-asteikkovaatimuksia. Käytännössä näistä matemaattisista vaatimuksista joudutaan usein tinkimään. Tämä on yleisesti hyväksyttyä silloin, kun ratkaisu palvelee tutkittavan ilmiön tutkimista ja esilletuomista. Vaikka mitta-asteikkovaatimuksissa joustetaan, on hyvä tietää, milloin käytetyn menetelmän vaatimukset toteutuvat ja milloin eivät.

Numeerinen mittaaminen: Välimatka-asteikko ja suhdeasteikko

Numeerisessa mittaamisessa on perinteisesti erotettu kaksi tasoa: välimatka-asteikko ja suhdeasteikko. Suhdeasteikko on vaativampi taso, sillä se edellyttää että muuttujan arvoilla on välimatka-asteikon ominaisuuksien lisäksi absoluuttinen nollapiste. Tätä vaatimusta ei kuitenkaan käytännössä yleensä tarvitse huomioida. Tällöin voidaan mittaustasojen hierarkiaan perustuen puhua vähintään välimatka-asteikon muuttujista. Numeerisilla muuttujilla voidaan luonnollisestikin suorittaa laskutoimituksia.

Välimatka-asteikosta käytetään myös nimityksiä välimatkatason asteikko ja intervalliasteikko. Välimatkan mittaaminen on määrällistä ts. numeerista mittaamista. Nimessä oleva 'välimatka' tai 'intervalli' viittaa siihen, että välimatka-asteikon muuttujan arvot ovat säännöllisen välimatkan päässä toisistaan. Siirryttäessä edellisestä seuraavaan asteikon pisteeseen, siirrytään aina täsmälleen saman verran. Tyypillinen välimatka-asteikon muuttuja on esimerkiksi syntymävuosi, jonka mittayksikkö on gregoriaanisen kalenterin vuosi. Asteikolla liikuttaessa mittayksikön verran, siirrytään aina yhtä pitkä aika. Numeerisiin muuttujan arvoihin liittyy yleensä aina mittayksikkö, kuten aikayksikkö vuosi. Kouluarvosana on sikäli harvinainen numeerinen muuttuja, että siihen ei liity varsinaista mitta-yksikköä (ellei se ole 'arvosana'). Suhdeasteikolla on kaikki välimatka-asteikon ominaisuudet, mutta lisäksi sillä on "suhdeominaisuus": muuttujan arvojen suhde (eli toinen jaettuna toisella) pysyy samana, vaikka mittayksikköä muutetaan. Tämä tarkoittaa myös sitä, että muuttujalla on olemassa "absoluuttinen nollapiste", esimerkiksi 0 euroa. Suhdeasteikosta käytetäänkin myös nimitystä absoluuttinen asteikko. Mielenkiintoista on havaita, että ikämuuttujalla on nollapiste eli se on suhdeasteikon muuttuja, mutta syntymävuosimuuttujalla sitä ei ole. Tällä erottelulla ei kuitenkaan ole käytännön merkitystä. Myös lukumäärämuuttujat ovat suhdeasteikon muuttujia.

Yhteiskuntatieteellisessä tutkimuksessa suhdeominaisuudella on harvoin todellista merkitystä. Joskus jopa välimatkaominaisuuden merkitystä voidaan spekuloida. Mittaustarkkuuden määrääminen, onko se ajalle esimerkiksi kuukausi, päivä vai sekunti, ja mittausvirheiden olemassaolo, ovat joka tapauksessa huomioitava tiedonkeruuta suunniteltaessa. Mietittäessä, kuinka todellisia muuttujien käytetyt mitta-asteikot ja mittaustasot ovat sisällöllisesti, päästään mielenkiintoisiin pohdintoihin. Esimerkiksi vaaleissa laskettavien äänimäärien yksikkö on joko "ääni" tai "kpl". Yhden äänen lasketaan sisältävän saman verran kannatusta, antoipa sen aktiivipoliitikko tai puolipakolla äänestyspaikalle tuotu "nukkuva". Voidaan kysyä, mittaako "ääni" siis absoluuttista, todellista kannatusta. Toinen henkilö voi kannattaa ehdokasta enemmän kuin toinen. Yhden ihmisen sisäistämän kannatuksen määrää ei voida mitata kovin helposti. Virallisesti yksi Suomen kansalainen saa kannattaa yhden äänen verran yksissä vaaleissa ja kunkin äänen tulkitaan olevan yhtä paljon. Monien vähintään välimatka-asteikollisina pidettyjen muuttujien tarkempi sisällöllinen pohtiminen panee miettimään "välimatkojen" todellista merkitystä. Onko esimerkiksi kouluarvosanojen 4 ja 5 sisällöllinen välimatka sama kuin arvosanojen 7 ja 8?

Sanallinen mittaaminen

Vaikka mittaaminen mielletäänkin yleensä numeroihin, survey-tutkimuksissa mittaaminen on hyvin usein myös sanallista. Ollaan kiinnostuneita sellaisista tilastoyksikön ominaisuuksista, jotka on ilmaistava sanallisesti. Tällaisten sanallisten muuttujien mittaustaso on aina luokitteleva, mutta joissakin tapauksissa sillä on myös järjestysominaisuus.

Luokitteluasteikko

Luokitteluasteikosta käytetään myös nimityksiä luokittelutason asteikko, luokitusasteikko, laatueroasteikko ja nominaaliasteikko. Muuttuja, jolla on luokitteluominaisuus eli joka jakaa tilastoyksiköt tietyn ominaisuuden mukaisiin ryhmiin tai luokkiin, on luokittelutasoa. Tällaisia "ominaisuuksia" voivat olla esimerkiksi sukupuoli, siviilisääty ja kansalaisuus. Näiden muuttujien arvoilla (luokilla) ei ole mitään yksiselitteistä järjestystä.

Järjestysasteikko

Järjestysasteikosta käytetään myös nimityksiä järjestystason asteikko ja ordinaaliasteikko. Mikäli muuttujan arvot voidaan panna jonkin ominaisuuden mukaiseen järjestykseen, muuttujan mittaustaso on järjestysasteikko. Järjestämiseen ei tarvita tarkkaa mittayksikköä, millä välimatkoja mitattaisiin. Esimerkiksi Likert-asteikko muodossa 'täysin eri mieltä - jokseenkin eri mieltä - jokseenkin samaa mieltä - täysin samaa mieltä' on järjestysasteikko: mahdollisilla muuttujan arvoilla on yksiselitteinen järjestys; toiseen suuntaan samanmielisyys kasvaa ja toiseen vähenee.

Käytännössä sanallisten järjestysasteikkojen laatiminen kyselylomakkeisiin on joskus hankalaa: "Aina - usein - silloin tällöin - joskus - harvoin - ei koskaan". Sanalliset ilmaisut tarkoittavat eri ihmisille eri asioita: toiselle 'joskus' on harvemmin kuin 'harvoin', toiselle ilmaisujen merkitykset ovat päinvastaiset; jollekin taas 'silloin tällöin', 'joskus' ja 'harvoin' merkitsevät suunnilleen samaa. Vastausvaihtoehtojen järjestys kyselylomakkeessa kuitenkin kertonee tutkijan tarkoituksen. Lisäksi osa vastaajista haluaa ilmaista mielipiteensä hillitysti, toiset antavat mielellään äärivastauksia. Vastaustilanteessa on siten hyvä, että on tarpeeksi vaihtoehtoja. Aineiston käsittelyvaiheessa "liioista" luokista päästään yhdistämällä luokkia.

Mitta-asteikoiden yleisominaisuus on hierarkisuus niiden vaativuuden perusteella: suhdeasteikko, välimatka-asteikko, järjestysasteikko, luokitteluasteikko. Tämä tarkoittaa sitä, että vaativammalla asteikolla on myös vähemmän vaativan asteikon ominaisuudet: Järjestysasteikko järjestysominaisuuden lisäksi myös luokittelee. Suhdeasteikolla on erityisten suhdeasteikon ominaisuuksiensa lisäksi välimatka-asteikon, järjestysasteikon ja luokitteluasteikon ominaisuudet. Kysymykseen, mitä mittaustasoa tai mitta-asteikkoa muuttuja on, vastauksena ilmoitetaan vaativin mitta-asteikko eli se, jolla on eniten ominaisuuksia. Se siis "vaatii" muuttujalta eniten. Ikämuuttuja on suhdeasteikon muuttuja, koska sillä on absoluuttinen nollapiste kaikkien muiden mitta-asteikkojen ominaisuuksien lisäksi. Ikä-muuttuja on myös välimatka-asteikollinen, sillä iän mittaukseen on olemassa mittayksikkö, vuosi. Edelleen vuodet voidaan panna aikajärjestykseen (järjestysasteikko) ja iän avulla voidaan myös luokitella; puhekielessäkin käytetään ilmaisua "ikäluokka".

Pääsääntöisesti sanalliset muuttujat koodataan numeerisessa muodossa havaintomatriisiin. Sanoilla on vaikea tehdä laskutoimituksia, mutta numeeriset koodit mahdollistavat "sanoilla laskemisen". Matemaattisen eksaktisti tämä ei ole luvallista, mutta käytännön tutkimuksissa siitä on todettu olevan hyötyä ja se on yleisesti hyväksytty silloin, kun se on sisällöllisesti perusteltua, johdonmukaista ja tulkittavissa olevaa. Tyypillinen esimerkki tällaisesta mittaustasovaatimusten lieventämisestä on summamuuttujan laskeminen asenneväittämistä. Voidaan todeta, että jopa luokittelutason muuttujien välisistä suhteista on mahdollista saada informaatiota korrelaatiokertoimia laskemalla, muistaen kuitenkin, että luokittelutason riippuvuustarkasteluihin on olemassa selkeä ja kiistaton menetelmä, ristiintaulukointi.

Asenteita mitataan usein Rensis Likertin (1932) kehittämällä asteikolla, joka järjestää vastaajat "samanmielisyyden" määrän mukaan. Likert-asteikon vastausvaihtoehdot ovat 'täysin samaa mieltä', 'jokseenkin samaa mieltä', 'jokseenkin eri mieltä', 'täysin erimieltä'. Vastausvaihtoehtoihin voidaan lisätä vaihtoehtoja, jolloin asteikko voi olla esimerkiksi seuraavanlainen: 'täysin samaa mieltä', 'jokseenkin samaa mieltä', 'ei samaa eikä eri mieltä', 'jokseenkin eri mieltä', 'en osaa sanoa', 'en halua sanoa'. Analysointivaiheessa 'en osaa sanoa (eos)' ja 'en halua sanoa' vaihtoehdot voidaan määritellä puuttuvaksi tiedoksi.

Harjoituksia

Tehtävä 1. Mitä mittaustasoa ovat seuraavat muuttujat:

  1. luokan oppilasmäärä
  2. suuntautumisvaihtoehto (tai opintojakso)
  3. vastaus muotoa: usein - harvoin - ei koskaan
  4. ulospäinsuuntautuneisuus (ulkopuolinen tarkkailija havainnoi näkymättömissä 20 henkilön ryhmätilannetta ja antaa heille pisteitä 1-10 heidän käyttäytymisensä perusteella
  5. juostu matka Cooperin testissä
  6. kunto mitattuna Cooperin testin avulla
  7. kunnassa tehtyjen rikosten määrä suhteessa kunnan asukaslukuun

Tehtävä 2. Mieti, missä 'en osaa sanoa' -vaihtoehdon paikka on Likert-asteikolla. Jos 'en osaa sanoa' -vaihtoehto on mukana, onko mittaustaso edelleen järjestysasteikko?

Tehtävä 3. Millaisia dummy-muuttujia tekisit seuraavasta osaWVS-aineiston muuttujasta? Mitä teet neljälle viimeiselle vaihtoehdolle?

"Entä mitä puoluetta Te ette äänestäisi missään nimessä?"

  1. SDP (Suomen Sosialidemokraattinen puolue)
  2. KESK (Suomen Keskusta)
  3. KOK (Kansallinen Kokoomus)
  4. VASEMMISTOLIITTO
  5. RKP (Ruotsalainen Kansanpuolue)
  6. Vihreä liitto
  7. SKL (Suomen Kristillinen Liitto)
  8. NUSU (Nuorsuomalainen Puolue)
  9. PS (Perussuomalaiset)
  10. Jokin muu ryhmittymä
  11. En äänestäisi
  12. En halua sanoa
  13. En osaa sanoa

Jatkuu seuraavalle sivulle


viimeksi päivitetty 2007-02-18

Yhteiskuntatieteellinen tietoarkisto Menetelmäopetuksen tietovaranto
FSD