Aineiston kuvailu ja metadata

Tutkimusaineiston sisällön, keruun ja muuttujien huolellinen kuvailu on edellytys aineiston käyttökelpoisuuden säilymiselle. Ilman kuvailevaa tietoa eli metadataa tutkimusaineisto on vain merkityksetön kokoelma yksittäisiä tiedostoja, numeroita ja merkkejä. Lisäksi hyvin tehty kuvailu helpottaa tutkimusaineiston löytämistä. Tutkimusaineiston perustietojen huolellinen ja kattava kuvaus (esimerkiksi julkaisun liitteessä) on tärkeä luotettavuuden osoitus myös tutkimustulosten raportoinnissa.

Tietoarkistoon tallennettujen aineistojen kuvailut julkaistaan sekä tietoarkiston omassa aineistoluettelossa että eurooppalaisten arkistojen yhteisluettelossa. Kun aineisto on luetteloitu, siihen voi helposti myös viitata.

Tutkimusaineiston kuvailussa on muistettava keskittyä nimenomaan itse aineiston eikä siitä tehtyjen johtopäätösten tai julkaisujen kuvailuun.

Metadatan tallennus Ankkurilinkki ikoni

Jokaiselle tutkimusaineistolle kannattaa luoda oma hakemisto, johon tallennetaan sekä itse tutkimusaineistot että kuvailutiedot. Osa kuvailutiedosta sisältyy yleensä myös varsinaiseen datatiedostoon (esimerkiksi kvantitatiivisen aineiston muuttujien selitteet tai kvalitatiivisen aineiston aineistoyksikön tiedot). Kuvailutiedot voi tallentaa esimerkiksi tekstitiedostona kirjaamalla dokumenttiin alla jäsennellyt aineiston perustiedot. Toinen vaihtoehto on valita oman aineiston kuvailuun soveltuva metadataformaatti.

Metadataformaatteja

Erityisesti silloin, kun kuvailtavia aineistoja tai kuvailutietoja on paljon, metadata kannattaa tallentaa jonkun metadataformaatin mukaisesti tietokantaan. Tietokantamuotoinen metadata mahdollistaa nopeat haut ja erilaiset raportoinnit. Pitkäaikaissäilytykseen kannattaa valita rakenteistettu xml-tiedosto.

Tutkimusaineistosta tallennetaan soveltuvin osin seuraava metadata:

Lisäksi tallennetaan aineiston kerääjille ja käsittelijöille (esimerkiksi haastettelijoille, tallentajille, koodaajille tai litteroijille) annetut ohjeet ja muut dokumentit. Ne voi tallentaa esimerkiksi tekstitiedostoina tai pdf-tiedostoina.

Tutkimuksen toteutuksen kuvailu Ankkurilinkki ikoni

Olennaisia tietoja ovat on aineiston alkuperäinen käyttötarkoitus, tekijät, tuottajat, perusjoukon ja havaintoyksikköjen valintaperusteet sekä aineistonkeruun tiedot. Seuraavat tiedot tallennetaan sekä kvalitatiivisista että kvantitatiivisista tutkimusaineistoista:

Alkuperäinen käyttötarkoitus: Tiedot tutkimuksesta, jota varten aineisto on kerätty, teoreettisesta viitekehyksestä ja käytetyistä operationalisoinneista.

Julkaisut: Lista julkaisuista, joissa aineistoa on käytetty ja/tai kuvailtu.

Tekijät: Aineiston tekijöitä ovat henkilöt, jotka ovat vastuussa aineiston varsinaisesta ajatuksellisen sisällön kehittelystä, useimmiten siis tutkimushankkeen vetäjät. Lisäksi merkitään muistiin aineiston kerääjät (voi olla myös ulkopuolinen organisaatio), tallentajat ja käsittelijät (esimerkiksi kvantitatiivisen aineiston koodaajat ja tallentajat tai kvalitatiivisen aineiston litteroijat) ja henkilöiden taustaorganisaatiot.

Tuottajat: Kirjataan, kuka on rahoittanut aineistonkeruun tai tutkimusprojektin, jota varten aineisto on kerätty.

Perusjoukko: Kuvataan aineiston kattama populaatio eli se ihmis- tai asiaryhmä, joka on tutkimuksen kohteena tai johon tutkimuksen tulokset viittaavat.

Havaintoyksikkö: Kuvataan aineiston havaintoyksikkö eli kohde, josta tutkimuksessa tehdään empiirisiä havaintoja. Se voi olla esimerkiksi henkilö, kunta, tapahtuma tai lehtiartikkeli.Vaikka tutkimuksessa olisi haastateltu henkilöitä, havaintoyksikkö voi olla jotain muutakin, esimerkiksi organisaatio, jota henkilö edustaa.

Aineistoyksikkö: Kvalitatiivisesta aineistosta luetellaan kaikki kerätyt aineistot. Ne voivat olla haastatteluja, vuorovaikutuksen tallenteita, päiväkirjoja, kenttämuistiinpanoja, lehtileikkeitä jne. Aineistoyksikkökohtaiset tiedot kirjataan huolella. Esimerkiksi lehtijutuista niitä ovat lehti, päivämäärä, jutun sijainti lehdessä, kirjoittaja ja aihe/otsikko. Haastatteluissa niitä ovat haastateltavan taustatiedot ja muut taustatiedot. Perustiedot aineistoyksiköistä on hyvä olla kunkin yksikön yhteydessä, esimerkiksi haastattelulitteraatin alussa, ja myös erillisenä listauksena.

Havainto- tai aineistoyksikköjen valintaperusteet: Kuvaus otantamenetelmästä ja/tai muista havainto- tai aineistoyksikköjen valitsemisessa käytetyistä keinoista.

Aineistonkeruu: Tallennetaan alkamis- ja päättymispäivät ja kuvaus tiedonkeruun menetelmästä (esimerkiksi puhelinkysely, tietokoneavusteinen käyntikysely, internet-kysely, ohjattu lomakekysely, audiotallenne, audiovisuaalinen tallenne tai kirjoituspyyntö). Kvantitatiivissa aineistoissa tallennetaan tiedot mahdollisista karhukierroksista ja katoanalyysi, kvalitatiivisissa aineistoissa keinot joita tutkittavien tavoittamiseksi ja aineiston kartuttamiseksi on käytetty. Myös haastattelijan tiedoilla (esimerkiksi ikä, sukupuoli, koulutus, ammatti) voi olla merkitystä, samoin haastattelupaikalla, ajankohdalla ja erilaisilla tilannekohtaisilla tekijöillä. Kvantitatiivisissa aineistoissa haastattelijan ja haastatteluhetken tiedot tallennetaan havaintomatriisiin, kvalitatiivisissa aineistossa aineistoyksikköjen perustietojen yhteyteen.

Lähdeaineistot: Jos kyseessä ei ole kysely- tai haastatteluaineisto, tallennetaan tiedot lähdeaineistoista: luetellaan esimerkiksi kirjat, artikkelit ja rekisteritiedot, jotka ovat olleet aineiston lähteenä.

Aineistonkeruuinstrumentti Ankkurilinkki ikoni

Kirjoituspyyntö (esim. lehdissä tai verkkosivuilla julkaistu), haastattelukysymykset, kyselylomake tai haastattelurunko, saatekirje ja mahdolliset haastattelijan ohjeet tallennetaan samaan hakemistoon aineiston ja kuvailutiedon kanssa.

Aineistonkeruuinstrumentista tallennetaan kaikki eri kieliversiot. Sähköisten versioiden lisäksi tallennetaan yksi blanco paperinen kyselylomake, jos sellainen on olemassa.

Tietokoneavusteisissa kyselyissä, joissa ei ole varsinaista kyselylomaketta, kysymykset ja vastausvaihtoehdot sekä kysymysten esitysjärjestys voidaan tallentaa tekstitiedostona.

Tiedostojen kuvailu Ankkurilinkki ikoni

Tutkimusaineisto voi koostua yhdestä tai useammasta tiedostosta. Kvantitatiivisissa aineistoissa yksi tiedosto sisältää tyypillisesti kymmeniä tai satoja muuttujia. Kvalitatiivisissa aineistoissa yksi tiedosto sisältää usein yhden aineistoyksikön.

Kaikkien yksittäisen tiedostojen ominaisuudet kuvaillaan. Jokaisesta tiedostosta kirjataan ylös:

  • tiedoston nimi
  • missä tiedosto sijaitsee (tiedostopolku)
  • tiedoston koko
  • tiedostoformaatti
  • millä ohjelmalla tiedosto on tuotettu
  • milloin tiedosto on tuotettu
  • kuka tiedoston on tuottanut
  • tiedoston versio
  • tiedoston käyttöoikeudet

Monet näistä tiedoista saadaan helposti listattua tietokoneen komentorivin (command prompt) dir-komennolla, joka tuo näytölle listan hakemiston tiedostoista ja alihakemistoista. Esimerkiksi komento

  C:\> dir Aineisto /S >tiedostolistaus.txt

luo uuden tiedoston nimeltään tiedostolistaus.txt, joka sisältää listan kaikista hakemiston Aineisto sisältämistä tiedostoista ja alihakemistoista tiedostoineen.