Miksi aineistonhallintaa ja jatkokäyttöä?

Aineistonhallinnalla tarkoitetaan sitä, että tutkimusaineistot (data) ja niihin liittyvä kuvaileva tieto (metatieto, metadata) on luotu, tallennettu ja järjestetty siten, että aineiston säilyy käyttökuntoisena ja luotettavana ja että tietosuoja ja tietoturva on varmistettu aineiston koko elinkaaren ajan.

Jatkokäytöllä tarkoitetaan toisten kokoaman, johonkin muuhun tarkoitukseen kerätyn aineiston hyödyntämistä. Jatkokäytössä käytetään usein myös erilaisia menetelmiä kuin mitä alkuperäiset tutkijat ovat käyttäneet. Jatkokäyttöön viitataan usein myös termillä sekundaarianalyysi.

Osa hyvää tieteellistä käytäntöä Ankkurilinkki ikoni

Yksi tieteellisen tutkimuksen luotettavuuden edellytys on, että tutkimus on suoritettu hyvän tieteellisen käytännön edellyttämällä tavalla. Tutkimusaineistot ovat keskeinen osa tutkimusprosessia ja tutkimushanketta.

Tutkimuseettisen neuvottelukunnan ohjeiden mukaan hyvään tieteelliseen käytäntöön kuuluu muun muassa että tutkimuksessa sovelletaan tieteellisen tutkimuksen kriteerien mukaisia ja eettisesti kestäviä tiedonhankinta-, tutkimus- ja arviointimenetelmiä ja että tutkimuksessa syntyneet tietoaineistot tallennetaan tieteelliselle tiedolle asetettujen vaatimusten edellyttämällä tavalla.

Tutkimuseettinen neuvottelukunta: Hyvä tieteellinen käytäntö (Avautuu uuteen välilehteen)

Rahoittajat edellyttävät aineistonhallintaa Ankkurilinkki ikoni

Suomen Akatemia edellyttää, että rahoitushakemuksen liitteenä olevassa tutkimussuunnitelmassa kuvataan tutkimusmenetelmät ja tutkimusaineistojen aineistonhallintasuunnitelma. Suunnitelmassa kerrotaan, miten tutkimuksessa käytettävät aineistot hankitaan, miten aineistoja käytetään ja säilytetään ja miten mahdollistetaan aineistojen käyttö tutkimuksen päätyttyä.

Aineistonhallinnansuunnitelmaa edellyttävät hakuohjeissaan myös Koneen säätiö, Työsuojelurahasto ja Alkoholitutkimussäätiö. Tekes puolestaan edellyttää, että sen rahoittamissa hankkeissa syntyvät aineistot hallinnoidaan tavalla, joka mahdollistaa niiden tehokkaan hyödyntämisen jatkossa. Euroopan komissio on linjannut, että Horizon 2020 -rahoituksen saajien tulee noudattaa FAIR-periaatteita elisaattaa tutkimusaineistonsa löydettäväksi (findable), saavutettavaksi (accessible), yhteentoimivaksi (interoperable) ja uudelleen käytettäväksi (reusable).

Jatkokäytön ja avoimen saatavuuden hyödyt Ankkurilinkki ikoni

Tutkijalle aineiston arkistointi on tieteellinen meriitti. Suomen Akatemian, tutkimuseettisen neuvottelukunnan ja UNIFI ry:n laatimassa ansioluettelomallissa tutkimustyön tieteelliseen ja yhteiskunnalliseen vaikuttavuuteen luetaan ansiot tutkimus- ja tietoaineistojen tuottamisessa ja jakamisessa. Myös osa kansainvälisistä tiedejulkaisuista edellyttää aineiston saatavuutta edellytyksenä artikkelin julkaisemiselle. Tutkijaa arkistointi meritoi myös viittauksina. Tutkimusjulkaisut, joiden taustalla oleva aineisto on arkistoitu, saavat enemmän viittauksia kuin julkaisut joiden aineisto ei ole saatavilla jatkokäyttöön. Tämä perustuu siihen, että käytettäessä arkistoaineistoja uusiin tutkimuksiin viitataan aineiston lisäksi usein aineiston alkuperäisten tekijöiden aineistosta tuottamiin julkaisuihin.

Tutkimuseettinen neuvottelukunta: Tutkijan ansioluettelomalli (Avautuu uuteen välilehteen) PDF

Tieteen kehityksen ja tutkimuksen johtopäätösten tieteellisten luotettavuuden arvioimiseksi on välttämätöntä, että julkaisuissa käytetyt tutkimusaineistot ovat tiedeyhteisön saatavilla. Aineistojen mahdollisimman laaja ja avoin saatavuus tukee myös tutkimuksen innovatiivisuutta ja verkostoitumista, lisää tutkimusorganisaatioiden ja tutkijoiden tunnettuutta ja mahdollistaa eri tieteenalojen tuottamien aineistojen monipuolisen käytön. OECD:n datasuosituksen mukaan julkisrahoitteisen tutkimusdatan avoin saatavuus on olennainen edellytys myös tulokselliselle kansainväliselle yhteistyölle.

Arkistoidut aineistot mahdollistavat ajalliset vertailut, ja ennen koottujen tutkimusaineistojen valossa voi tarkastella monipuolisia ja vaihtoehtoisia tutkimusongelmia. Lisäksi aineistojen saatavuus voi edistää tutkimusmenetelmien kehittämistä. Kehittyvät menetelmät, ohjelmistot ja teknologia tarjoavat puolestaan uusia mahdollisuuksia tutkimukseen. Arkistoiduista aineistoista on hyötyä myös opetuksessa ja opiskelussa.

Aineistojen jatkokäyttö on taloudellista ja säästää rajallisia resursseja. Aikaa ja rahaa ei tarvita uuden materiaalin keräämiseen, jos sopiva aineisto on jo saatavilla. Lisäksi laajat kysely- ja haastatteluaineistot sisältävät usein täysin analysoimatonta materiaalia. Jo olemassa olevien aineistojen käytöllä voidaan myös välttää päällekkäiset tiedonkeruut.

Arvokkaista tutkimusaineistoista ei ole tutkimusyhteisölle ja tulevaisuudessa tehtävälle tutkimukselle hyötyä, jos tiedot aineistoista ovat ensisijaisesti alkuperäisten tutkijoiden mielissä ja häviävät sitä mukaa, kun kyseiset henkilöt siirtyvät muihin tehtäviin tai eläkkeelle.

Tutkimusaineiston elinkaari Ankkurilinkki ikoni

Tutkimusaineiston elinkaari on tavallisesti pidempi kuin aineiston tuottaneen tutkimushankkeen elinkaari. Hanke päättyy, kun rahoitus loppuu, mutta aineistoa voi ja kannattaa hyödyntää myöhemminkin.

Tutkimusaineiston elinkaari.

Kuvassa on esitetty tutkimusaineiston elinkaaren eri vaiheet. Tutkimushanke luovuttaa keräämänsä aineiston arkistoitavaksi ja jatkokäyttöön hankkeen päätyttyä. Tutkimusaineistoa käsitellään ja dokumentoidaan sekä tutkimusprojektin aikana että arkistointivaiheessa. Päällekkäiseltä työltä ja informaation katoamiselta vältytään, kun tutkimusaineiston elinkaaren eri vaiheet suunnitellaan jo tutkimussuunnitelmaa laadittaessa.

Esimerkiksi tutkimusaineistoa kuvaileva metadata on helpointa ja kustannustehokkainta tallentaa vaiheittain aineiston elinkaaren aikana. Puutteellisen metadatan täydentäminen ja korjaaminen vuosia aineistonkeruun jälkeen ei ole välttämättä edes mahdollista tai ainakin maksaa monikymmenkertaisesti sen, mitä maksaisi metadatan tuottaminen aineiston elinkaaren alkuvaiheissa.