Koodaaminen

Lukuaika noin 3 min

Koodaaminen esitellään laadullisen tutkimuksen menetelmäoppaissa usein aineistojen käsittelyn perusvälineenä (esim. Coffey & Atkinson 1996; Eskola & Suoranta 2008). Koodaamista voidaan pitää yhtenä sisällönanalyysin työvälineenä, mutta toisaalta se on työvaihe, jolla minkä tahansa laadullisen tutkimuksen aineiston käsittely alkaa. Kyse on aineiston ensivaiheen järjestämisestä ja luokittelusta, josta edetään varsinaiseen analyysiin.

Koodaamisessa on yksinkertaisesti ilmaistuna kysymys siitä, että aineiston osia eli pidempiä ja lyhyempiä katkelmia esimerkiksi litteroiduista haastatteluista tai mediateksteistä yhdistellään ja erotellaan jonkin ominaisuuden mukaan. Samankaltaiset osat luokitellaan yhteen ja tälle luokalle annetaan yhteisen ominaisuuden mukainen nimi. Esimerkiksi elämäkertahaastatteluista voidaan koodata omia vanhempia koskevat kuvaukset luokan ”vanhemmat” alle, jos tutkimuksen kohteena on sosiaalisten suhteiden merkitys ihmisten elämässä. Koodaaminen etenee yleensä siten, että ensin paikannetut koodit hienojakoistuvat alaluokiksi. Esimerkiksi ”vanhemmat” koodin alle voi syntyä sellaisia alaluokkia kuin "läheiset suhteet" tai "etäiset suhteet".

Koodaaminen on yhtäältä moninaisen ja rikkaan raaka-aineiston "yksinkertaistamista" ja saattamista hallittavaan muotoon. Toisaalta koodaamisessa aineistoa järjestetään niin, että se alkaa elää uusilla tavoilla, joten tavallaan koodaaja myös "monimutkaistaa" aineistoaan ja saa siitä esiin yllättäviäkin näkökulmia. Koodaaminen ei ole koskaan pelkkä tekninen luokittelutoimenpide, sillä luokat, alaluokat ja niistä muodostettavat aineistokoosteet syntyvät paljolti koodausprosessin aikana. Laadullisen tutkimuksen aineistot ovat aina niin rikkaita, että niistä löytyy koodattavaa monista eri näkökulmista. Näin ollen koodaamisessa on kyse myös tutkijan tekemistä valinnoista.

Luokittelu voi kohdistua monenlaisiin aineistonpiirteisiin, kuten haastattelujen sisällöllisiin aiheisiin tai tunnekuvauksiin, mediakuvien rakenteisiin ja symboliikkaan tai videoidun keskusteluvuorovaikutuksen yksityiskohtiin ja non-verbaaliin viestintään. Yhdessä tutkimuksessa ei voi koodata kaikkea mahdollista. Siksi on tärkeää, että koodaamista ohjaavat tutkimuksen ongelma ja keskeiset tutkimuskysymykset, jotka tosin usein myös muokkautuvat koodausprosessin edetessä tutkijan tutustuessa aineistoonsa syvällisemmin.

Koodatessa syntyvät luokat ja alaluokat ovat tutkijan synnyttämiä ja nimeämiä, eivätkä ne siis löydy sellaisinaan aineistosta. Jari Eskola ja Juha Suoranta esittelevät kirjassaan Johdatus laadulliseen tutkimukseen (2008, 154–159) esimerkin tällaisesta koodaamisesta. Kyse on eläytymismenetelmällä kerätystä aineistosta, jossa tutkittavat kirjoittivat itse kehittelemänsä jatkon aloitetulle tarinalle. Tarinan aiheena oli simputus armeijassa. Tekstiaineisto koodattiin ensin pääluokkiin kuten tapahtuman näyttämö, episodin alkusyy tai selitys, päivä- tai viikko-ohjelma. Kunkin pääluokan alle muodostettiin alaluokkia. Esimerkiksi pääluokan tapahtuman näyttämö alaluokkia olivat kasarmi, maasto ja siirtyminen (ruokailuun, maastoon, kasarmille tms.). Pääluokan episodin alkusyy tai -selitys alaluokkia olivat seuraavat: alkuna yksilön veltto/huono suoritus, alkuna ryhmän veltto/huono suoritus, alkuna sääntöjä rikkonut yksilö, alkuna sääntöjä rikkonut ryhmä jne.

Tämänkaltainen koodaaminen ja sen kautta syntyvä luokitus ei ole valmiina aineistossa odottamassa, vaan se muodostuu tutkijan aktiivisen jäsennystyön tuloksena. Siksi se on myös elävä ja joustava. Luokat muotoutuvat ja ryhmittyvät koodauksen edetessä. Jotkut luokat voivat yhdistyä ja toiset jakautua useammaksi.

Perinteisiä koodaamisen tekniikkoja ovat "värikynät" ja "lakanat". Ensin mainittu tarkoittaa sitä, että tutkija merkitsee väreillä aineistotekstiensä marginaaliin tai tekstiin samaan luokkaan kuuluvat tekstikohdat. Jälkimmäinen tarkoittaa puolestaan sitä, että isolle paperille hahmotellaan pääluokat ja alaluokat sekä näiden keskinäiset suhteet. Näin voi syntyä ajatuskarttaa muistuttava kuvio. Lakanaan merkitään kunkin luokan alle ne aineistokohdat, josta raakahavainnot löytyvät (esim. haastattelu 1, sivu 8).

Tämänkaltaista koodaamista tehdään nykyisin yhä enemmän erilaisilla laadullisen aineiston käsittelyohjelmilla (esim. ATLAS.ti ja NVivo). On kuitenkin hyvä muistaa, että nämä tietokoneohjelmat eivät koodaa aineistoja tutkijan puolesta, vaan edelleen tutkija nimeää pää- ja alaluokat ja päättää mitkä raaka-aineiston katkelmat tai kohdat kuhunkin luokkaan kuuluvat.

Koodaaminen mahdollistaa myös aineiston numeerisen esittämisen. Esimerkiksi edellä mainitusta eläytymismenetelmäaineistosta voi laskea, kuinka monta kertaa episodin alkusyyksi tai selitykseksi esitetään sääntöjä rikkonut yksilö ja kuinka monta kertaa puolestaan yksilön veltto/huono suoritus. Tämänkaltaisen laskemisen pohjalta esitetyt esiintymistiheydet eivät voi olla laadullisen tutkimuksen päätuloksia. Niiden kautta voi kuitenkin kertoa erilaisten asioiden esiintymisen yleisyydestä aineistossa.

Tutkimusasetelmasta riippuen koodaaminen voi tapahtua joko teoria- tai aineistovetoisesti. Teoriavetoisemmassa koodaamisessa aiemmissa tieteellisissä jäsennyksissä ja empiirisissä tutkimuksissa syntyneet kategoriat ja käsitteet ovat aineiston koodaamisessa mukana. Aineistovetoisemmassa koodaamisessa tutkija pyrkii sulkemaan aiemmat käsitteellistykset pois ja koodaaman aineiston luokkiin ja alaluokkiin ensisijaisesti raaka- aineistoon tukeutuen.