Aineiston tuottaminen

Jaana Vuori (viittausohje)

Lukuaika noin 7 min

Termi empiirinen on peräisin antiikin kreikasta ja tarkoittaa havaintoihin ja kokemukseen perustuvaa. Empiirisessä tutkimuksessa havainnot maailmasta tehdään tutkimusaineiston välityksellä. Aineistojen voidaan ajatella olevan näytteitä, otteita ja jälkiä todellisuudesta – siitä mitä maailmassa tapahtuu, miten ihmiset muodostavat ryhmiä ja toimivat yhdessä, mitä he ajattelevat maailmasta, millaisia kulttuurisia esityksiä ja esineitä he tuottavat ja miten he rakentavat yhdessä yhteiskuntaa ja sen instituutioita ja niin edelleen.

Empiirinen tutkimus pohjaa siis siihen, miten tutkijat analysoivat erilaisia aineistoja. Aineistoksi kelpaa periaatteessa mikä tahansa. Laadullisessa tutkimuksessa voidaan erottaa karkeasti ainakin seuraavat aineistotyypit:

Kukin näistä aineistotyypeistä sisältää lukuisia erilaisia alaryhmiä. Esimerkiksi haastatteluja on erilaisia, tekstit voivat olla mitä tahansa kirjoitettuja tekstejä mediateksteistä aina kaunokirjallisuuteen ja vuorovaikutusaineistot voivat olla sekä ääni- että videonauhoitettuja vuorovaikutustilanteita. Erilaisista aineistotyypeistä on tässä käsikirjassa omat lyhyet esittelynsä. Niissä kerrotaan myös kunkin aineistotyypin hankkimiseen ja käsittelyyn liittyvistä erityiskysymyksistä.

Nykyisin ajatellaan, että on syytä puhua aineistojen tuottamisesta keräämisen tai hankkimisen sijaan, sillä aineistojen muodostaminen tutkimusta varten on tutkijan aktiivisen työn tulosta. Tutkija keksii idean aineistosta, hän valitsee ja rajaa aineiston sopivan kokoiseksi kulloiseenkin tarkoitukseen, yhdistelee erilaisia aineistoja ja työstää aineistoa analyysia varten.

Siinä on kuitenkin eroa, kuinka vahvasti tutkija vaikuttaa siihen, millainen aineistosta tulee. Tutkijan oma toiminta on olennainen syntyehto aineistolle esimerkiksi silloin kun hän tekee haastatteluja. Tällöin hän muotoilee kysymykset ja keskustelunaiheet ja on läsnä haastattelutilanteessa. Samoin on laita myös silloin, kun tutkija pyytää ihmisiä kirjoittamaan kokemuksistaan tai näkemyksistään. Silloin, kun aineisto on syntynyt ilman tutkijan panosta, puhutaan luonnollisesta aineistosta. Tällaisia aineistoja voivat olla esimerkiksi erilaiset mediaesitykset kuten televisiosarjat tai aikakauslehtien artikkelit. Myös vuorovaikutustilanteiden ääni- ja videotallenteet ajatellaan tällaisiksi aineistoiksi, vaikka toki jo tallennelaitteiden läsnäolo voi vaikuttaa aineiston sisältöön.

Toinen aineiston luokittelutapa liittyy siihen, onko aineisto tuotettu nimenomaisesti juuri tätä tutkimusta varten, vai onko se tuotettu jo aiemmin jotakin muuta tutkimusasetelmaa varten. Aiempien tutkijoiden tuottamia aineistoja on tallennettu erilaisiin arkistoihin, joista niitä voi saada käyttöönsä. Koska aineiston tuottaminen vaatii paljon työtä eikä mitään aineistoa voi analysoida läpikotaisin yhdessä tutkimuksessa, nykyisin suositaan aineistojen arkistoimista myös muiden tutkijoiden käyttöön.

Aineiston valinta ja yhdistely Ankkurilinkki ikoni

Aineiston tuottaminen on siis aktiivista toimintaa. Ensiksikin aineiston tuottaminen pitää suunnitella, ja käytettävä aineisto pitää valita ja rajata. Ei ole olemassa mitään sääntöjä siitä, kuinka paljon aineistoa on riittävästi. Tutkijan pitää punnita sekä omaa työmääräänsä että sitä, että aineistossa on tarpeeksi vaihtelevuutta, jotta sen avulla voi tarkastella tutkimusongelmaa eri puolilta, ja kuitenkin sen verran vähän, ettei aineistoon tutustuminen jää pintapuoliseksi. Laadullisessa tutkimuksessa ei useinkaan pelata suurilla lukumäärillä, sillä on parempi pyrkiä saamaan analyysiin enemmän syvyyttä ja oivaltavuutta kuin laajuutta. Mallia saa muista tutkimuksista ja ohjaajan kanssa kannattaa neuvotella.

Kun laadullista aineistoa ajatellaan näytteenä todellisuudesta, tutkijan omat valinnat ja niiden perustelu on tärkeää. Voi olla hyvä punnita kahta erilaista näkökulmaa näytteen valinnassa: ajatellaanko, että aineisto on näyte jostakin tavanomaisesta ja tyypillisestä vai onko se päinvastoin näyte jostakin poikkeuksellisesta ja epätavallisesta? (Esim. Alasuutari 2019.) Laadullisessa tutkimuksessa ajatellaan, että poikkeuksia voidaan käyttää joskus erityisen oivaltavalla tavalla hyväksi, koska poikkeus kertoo aina jostakin tavallisesta eli sosiaalisesta säännöstä. Niinpä esimerkiksi se, miten hulluus tai mielisairaus ymmärretään eri aikoina, kertoo paljonkin siitä mikä on ajateltu normaaliksi käyttäytymiseksi. Toisessa tutkimuksessa voidaan puolestaan ajatella, että missä tahansa peruskoulun luokkahuoneessa tapahtuva toiminta kuvaa jotakin kiinnostavaa yleisestä koulullisuudesta.

Toisenlaista valintaa tapahtuu silloin, kun tutkija valitsee kriteerit, joilla hän voi ottaa otoksen aineistosta ilman, että päättää itse, mitkä näytteet tulevat mukaan aineistoon. Tällöin oletetaan, että otoksessa tulevat esiin samanlaiset asiat ja samanlaisessa suhteessa kuin ne tulisivat laajemmassakin aineistossa (Ronkainen ym. 2011, 186–187). Esimerkki tällaisesta on tutkimusasetelma, jossa tutkija haluaa saada käsityksen siitä, miten jotakin ilmiötä – vaikka yritystoimintaa – koskeva ymmärrys on muuttunut pitkän ajan kuluessa. Hän päättää ensiksikin ottavansa aineistoksi ilmiötä koskevat tv-uutisten raportit kahdelta kanavalta vuosilta 1990, 2000, 2010 ja 2020. Uutisia on edelleen aivan liikaa, jotta hän pystyisi käymään ne kaikki läpi. Niinpä hän päättää arpoa kultakin kuukaudelta mukaan 10 satunnaista uutispäivää.

Joskus tutkija voi löytää aineistokseen niin sanotun kokonaisaineiston, joka käy tutkimukseen sellaisenaan. Tällainen voisi olla esimerkiksi se, että tutkija analysoisi jotakin suuronnettomuutta koskevan kaiken tv-uutisten raportoinnin koko siltä ajalta, milloin ilmiötä on julkisuudessa käsitelty.

On hyvä pitää näytteen, otoksen ja kokonaisaineiston käsitteet erillään toisistaan. Tyypillisin tapa laadullisessa tutkimuksessa on käyttää aineistona tutkijan harkitsemia näytteitä.

Tutkimusasetelman voi rakentaa myös niin, että yhdistää samaan asetelmaan useampia aineistoja. Etnografiassa ja tapaustutkimuksessa suositaan eri aineistojen yhdistelyä, mutta se on melko tavallista laadullisessa tutkimuksessa muutoinkin. Vertailuasetelma voi vaatia kahden tai useamman erilaisen aineiston käyttöä. Toisinaan samassa tutkimuksessa yhdistetään laadullista ja määrällistä eli kvantitatiivista aineistoa. Tällöin käytetään sekä tilastolliseen päättelyyn perustuvaa kvantitatiivista analyysia että laadullista analyysia.

Pääsääntöisesti voi kuitenkin sanoa, ettei useamman aineiston yhdistely sinänsä tee tutkimuksesta parempaa tai monipuolisempaa kuin yhden aineiston huolellinen analyysi.

Aineiston käsittely analyysia varten ja aineistojen tallentaminen Ankkurilinkki ikoni

Jotta aineistot olisivat analysoitavissa, niille täytyy yleensä tehdä jotakin, jotta ne olisivat hallittavissa. Tämä on käsityömäistä toimintaa, jonka aikana aineisto tulee tutkijalle tutuksi ja alkaa herättää ideoita siitä, mitä aineistosta voi saada analyysilla irti.

Ensiksikin aineisto pitää tallentaa sellaiseen muotoon, että se helpottaa analyysia. Esimerkiksi haastattelut ja vuorovaikutusaineistot tallennetaan ääni- tai videotiedostoina. Tämän jälkeen ne yleensä myös litteroidaan eli saatetaan tekstimuotoon. Myös kuvia ja audiovisuaalisia aineistoja voi litteroida. Analyysi tapahtuu osin näiden tekstimuotoisten aineistojen avulla, mutta aina on syytä kuunnella ja katsella myös alkuperäisiä tallenteita. Aineiston käsittelyä on myös se, kun käsin kirjoitetut havainnointimuistiinpanot kirjataan sähköiseksi kenttäpäiväkirjaksi.

Tekstit tai kuvat kootaan sähköisessä muodossa tai kopioina kansioihin sellaisessa järjestyksessä, että niitä on helpompi käsitellä. Eri aineistoyksiköt kannattaa nimetä niin että ne löytyvät helposti. Samalla ne on syytä kontekstoida huolella eli lisätä esimerkiksi tiedoston alkuun tieto siitä, milloin aineistoyksikkö on tuotettu, ketä ja mitä se koskee, mikä oli alkuperäinen lähde ja niin edelleen. Usein aineistoyksiköille annetaan järjestysnumero, joka helpottaa aineistoon palaamista analyysivaiheessa. Jos aineisto on sellainen, että se pitää tutkimuseettisistä syistä anonymisoida eli tutkittavia ihmisiä koskevat tiedot pitää muuttaa mahdollisimman tunnistamattomaksi, tämä kannattaa tehdä jo tässä vaiheessa.

Tutkittavilta pyydetyt tutkimusluvat pitää myös dokumentoida ja säilyttää. Jos tutkimuslupa on pyydetty kirjallisesti, se sisältää henkilötietoja. Tällaiset dokumentit pitää säilyttää niin, ettei tietoja voi yhdistää anonymisoituihin aineistoyksikköihin – toisin sanoen fyysisesti eri paikassa niin, etteivät ulkopuoliset pääse niihin käsiksi.

On tärkeää, että kustakin aineistoyksiköstä tallennetaan sellainen versio, jota ei käsitellä analyysia tehtäessä eli toisin sanoen siihen ei lisätä eikä siitä poisteta mitään (yllä mainittua anonymisointia lukuunottamatta). Analyysia varten tätä master-tiedostoa voidaan sitten kopioida. Aineiston eri yksiköistä ja niiden tiedostonimistä, ajoittamisesta ja säilytyspaikasta on syytä pitää erillistä listaa varsinkin silloin, kun aineistoyksiköitä on paljon.

Aineiston säilyttämiseen pitää myös kiinnittää huomiota. Muista varmuuskopiot! Varmuuskopioita on syytä säilyttää eri paikassa kuin toisia kappaleita. Kun varmuuskopio on sähköinen, muistitikku on hyvä ratkaisu. Henkilöä koskevia tietoja tai arkaluontoisia tietoja sisältävät aineistot pitää säilyttää esimerkiksi lukitussa kaapissa ja muistitikuilla salasanojen takana. Aineistonhallinnan käsikirjasta saat lisäohjeita.

Tutkimusprosessin loppuvaiheessa aineistot arkistoidaan väliaikaisesti tutkijan käyttöön tai pysyvästi tutkimusaineistoja vastaanottavaan arkistoon. Myös tutkimusaineistojen hävittäminen on tehtävä suunnitelmallisesti, ja hävittämisen sijaan on syytä suosia niiden arkistointia.