Teksti: Jani Hautamäki ja Arja Kuula

Lisäarvoa laadullisille aineistoille uuden palvelun avulla

Tietoarkisto aloitti laadullisten aineistojen arkistoinnin 2003. Tietoteknisiä työkaluja aineistojen prosessointiin arkistokelpoisiksi on kehitetty pienissä paloissa tarpeen vaatiessa. Tietoarkisto 2015 -hanke on mahdollistanut entistä suunnitelmallisemman kehitystyön. Sen tuloksena on syntynyt uusi palvelu helpottamaan aineiston hallintaa ja analysoitavien yksikköjen valintaa.

Metadata eli aineiston kuvailu on edellytys tutkimusaineiston käyttökelpoisuuden säilymiselle ja sopivan aineiston löytymiselle. Aluksi tietoarkistossa panostettiin koko aineistoa koskeviin metatietoihin, kuten keruun ajankohdan, keskeisen sisällön ja keruutavan kuvailuun. Lisäksi aineiston tiedostot konvertoitiin rtf- tai txt-muotoon ja laadittiin erillinen tiedostoluettelo.

Aineiston kuvailusta tutkimusyksiköiden kuvailuun

Asiakkaiden tarpeet ovat ohjanneet arkistoaineistojen käsittelyn kehittämistä. Nykyisin laadullisen aineiston kuvailussa entistä oleellisimpia ovat yksikkökohtaiset tiedot. Niitä ovat tyypillisesti yhtä haastattelua, kirjoitusta tai ryhmähaastattelua koskevat taustatiedot: mikä on juuri tämän tiedoston keruuajankohta ja mitkä ovat tallenteella esiintyvien henkilöiden taustatiedot ja kyseisen tiedoston tai yksikön sisällön erityistiedot.

Kuvailu tiedosto- tai yksikkötasolla on erityisen tärkeää jatkokäyttäjille, jotka tyypillisesti käyttävät arkistoaineistoja omiin tarkoituksiinsa ja eri tavalla kuin alkuperäisessä tutkimuksessa. Alkuperäinen tutkimus on voinut keskittyä esimerkiksi kännykänkäytön vaikutukseen nuorten ja lasten elämässä. Jatkokäyttäjä saattaakin olla kiinnostunut vain laajan aineiston muutamasta haastattelusta, joissa on tutkijan lisäksi mukana sekä perheen lapsi että vanhempi, koska tutkii tutkimusvuorovaikutuksen vaihtelua suhteessa haastateltavan ikään.

Työkaluja tutkimushankkeiden aineistojen hallintaan

Tietoarkisto 2015 -hankkeessa on kehitetty työkalut, joilla parannetaan oleellisesti laadullisten aineistojen hallintaa. Yksi laadullinen aineisto voi sisältää kymmeniä tai jopa satoja erillisiä tiedostoja. Arkistoaineiston selailun ja analysoitavien yksikköjen valinnan helpottamiseksi tietoarkisto on luonut automatisoiun datan käsittelyn prosessin, jossa tekstiaineistoista tuotetaan HTML-esitysversio. Esitysversioiden avulla voi hahmottaa aineiston kokonaisuuden jäsentyneesti. Hakemistonäkymän (FSD2510 ja FSD2607) otsikoita näpäyttämällä voi säätää yksiköiden järjestystä ja tarkistaa aineistoyksiköiden määrän taustatietojen mukaan. Lisäksi voi lukea valitsemaansa aineistoyksikköä html-muodossa.

Laadullisen tekstiaineiston prosessointi html-tiedostoiksi on palvelu, jota tietoarkisto tarjoaa jo meneillään oleville tutkimuksille, jos tutkijat sitoutuvat aineistojensa arkistointiin tutkimuksen päättyä. Tämä helpottaa projekteja, joissa kerätään paljon aineistoja. Laajan tutkimuksen aineistojen hallinta lukuisine hakemistoineen ja tiedostoineen on aina haasteellista ja usein myös hidasta. Tietoarkiston tarjoamaa palvelua kannattaa hyödyntää, sillä aika on tärkeä resurssi tutkimuksessa.

Lisätietoja