Aineistonhallinnan suunnittelu
Aineistonhallintasuunnitelma on osa tutkimussuunnitelmaa. Suunnitelmaa voi täsmentää tutkimushankkeen aikana, mutta tärkeimmät suuntaviivat ja periaatteet täytyy miettiä jo ennen projektin alkua ja viimeistään ennen aineiston keräämistä.
Aineistonhallinnan suunnittelun tarkoitus on varmistaa, että tutkimusaineistojen suhteen noudatetaan hyvää tieteellistä käytäntöä, että tutkimusaineisto ei vaarannu missään vaiheessa ja että aineiston jatkokäyttö on mahdollista.
Ennen tutkimuksen aloitusta ja aineistokeruuta on tarkistettava, edellyttääkö oma tutkimus eettistä ennakkoarviointia. Kun aineistonkeruu tehdään Suomen ulkopuolella, on hyvä selvittää ennakkoon maan käytännöt eettisessä ennakkoarvioinnissa. Ulkomaisten yliopistojen sivuilta löytyy useimmiten ohjeet asiasta (hakufraasit 'ethics review board', 'ethics review committee', 'ethical review of research projects involving human participants').
- Tutkimuseettinen neuvottelukunta: Hyvä tieteellinen käytäntö (Avautuu uuteen välilehteen)
- Tutkimuseettinen neuvottelukunta: Eettinen ennakkoarviointi (Avautuu uuteen välilehteen)
Aineistonhallintasuunnitelma
Aineistonhallintasuunnitelmassa kuvataan miten tutkimusaineisto hankitaan, miten sitä käytetään ja säilytetään tutkimusprojektin aikana ja miten mahdollistetaan aineiston käyttö projektin päätyttyä. Tutkimushankkeen alettua aineistonhallintasuunnitelmaa pitää tarkentaa ja olosuhteiden muuttuessa sitä pitää päivittää. Tutkimuksen aineistonhallinta on varmistettu, kun kaikki alla luetellut osa-alueet ovat selvillä.
DMPTuulin FSD-ohjeet 2016 englanniksi (FSD's Guidelines in DMPTuuli)
1. Aineisto
- Mitä aineistoa kerätään?
- Miten aineisto kerätään?
Tutkimuskysymykset määrittävät keskeisimmin, mitä aineistoa kerätään. Tyypillisimpiä aineistoja ovat kyselyt, haastattelut, ryhmähaastattelut, kirjoitukset, asiakas- tai asiointitilanteet, viralliset dokumentit, arkistoaineistot, verkkosivustot, rekisteriaineistot ja media-aineistot.
Aineistotyyppi vaikuttaa aineiston keruutapaan. Kvantitatiivisia aineistoja voidaan kerätä haastattelemalla, postikyselyinä, verkkokyselyinä, poimimalla tiedot erilaisista lähdedokumenteista tai mittaamalla. Haastattelut, ryhmähaastattelut ja asiakas- ja asiointitilanteet kerätään yleensä tallentaen ne ääni- tai äänikuvatiedostoiksi. Kirjoitukset kerätään tavallisesti kirjoituspyyntöjen tai -kutsujen avulla sähköpostitse, maapostitse tai tarkoitusta varten luodun verkkosivuston kautta. Virallisista dokumenteista saa nykyisin suuren osan suoraan verkosta, mutta osan dokumenteista saa vain erikseen pyytämällä tai anomalla lupaa niiden tutkimuskäyttöön. Rekisteriaineistojen saaminen edellyttää lupamenettelyä. Ohjeita lupien hakemiseen saa Rekisteritutkimuksen tukikeskuksesta.
Rekisteritutkimuksen tukikeskuksen ohjeita tutkijoille (Avautuu uuteen välilehteen)
Tutkija tai projekti voi kerätä ja tallentaa aineiston itse, tai aineisto voidaan tilata joltain tiedonkeruu- tai haastatteluorganisaatiolta. Jos tutkimusprojekti päättää ostaa tiedonkeruun, tarjouspyyntö kannattaa lähettää usealle tiedonkeruuorganisaatiolle. Tarjouspyynnön laatimisessa voi ja kannattaa käyttää apuna tutkimusaineiston aineistonhallintasuunnitelmaa.
2. Oikeudet
- Mitkä ovat tutkimusaineiston omistus-, hallinta- ja tekijänoikeudet?
- Kuka antaa käyttöoikeudet aineistoon?
- Miten tutkittavia informoidaan?
Aineistoon voi liittyä tekijänoikeuksia, vaikka suuri osa empiiristä aineistoa jää tekijänoikeuslain suojan ulkopuolelle. Jos aineistoon liittyy tekijänoikeuksia, aineiston tekijänoikeuden haltija määrää aineiston käyttötavat ja aineiston käyttöön on saatava oikeudenhaltijan suostumus. Riippumatta siitä, onko aineisto tekijänoikeudella suojattua vai ei on aineiston tekijöiden määrittäminen tärkeää, sillä arkistoidun aineiston jatkokäyttäjät viittaavat omissa tutkimuksissaan aineistoon ja sen tekijöihin.
Tutkimuksessa tulee aina erikseen sopia aineiston omistamisesta ja käyttöoikeuksista. Aineiston käyttöoikeuksista on hyvä sopia koskien sekä alkuperäistä tutkimusta että sen jälkeistä aikaa. Ennen tutkimussopimuksen laatimista tulee tarkistaa, mitkä ovat tutkimusrahoittajan tutkimusaineistoja koskevat vaatimukset, jotta aineistosta sovitaan rahoittajan edellyttämällä tavalla.
Kun käytetään ulkopuolista tiedonkeruu- tai haastatteluorganisaatiota, viimeistään keruusopimusta tehtäessä tulee määritellä ja sopia, kuka omistaa tutkimusaineiston tai hallinnoi sitä ja miten tutkittavia informoidaan aineiston käytöstä. Jos tutkimusaineisto on tarkoitus arkistoida jatkokäyttöä varten, voidaan sopia, että keruuorganisaatio toimittaa tutkimusaineistosta ja dokumentaatiosta kopiot suoraan Yhteiskuntatieteelliseen tietoarkistoon.
Arkistoaineistojen käyttöoikeudet määrittää kukin arkisto. Viralliset dokumentit ja asiakirjat ovat yleensä tutkijoiden vapaasti käytettävissä. Kun tutkimuksessa käytetään salassapidettäviä asiakirjoja, niiden käyttöoikeudet määrittää aineistojen luovuttaja. Avoimesti saatavilla olevat verkkoaineistot ovat vapaasti tutkimukseen käytettävissä, mutta niiden arkistointi jatkokäyttöä varten ei aina ole mahdollista esimerkiksi tekijänoikeuslain tai henkilötietolain perusteella.
Kun aineistoa kerätään suoraan tutkittavilla, heille annettu informaatio määrittää olellisesti aineiston käyttöoikeuksia.
- Lisätietoa tekijänoikeuksista ja tutkijoiden välisistä sopimuksista
- Lisätietoa tutkittavien informoinnista
3. Tietosuoja ja tietoturva
- Miten tietoturva ja tietosuoja ovat yhteydessä toisiinsa?
- Minkälaista tietoa käsitellään? Sensitiivisen datan tietoturva?
- Miten tietoturva toteutetaan hallinnollisesti ja teknisesti?
- Miten hoidetaan varmuuskopiointi?
Tutkimuksessa tietosuoja kiteytyy tutkittavia koskevien henkilötietojen käsittelyn suunnitelmallisuuteen, vastuullisuuteen ja huolellisuuteen. Henkilötietoja kerätään ja käsitellään laillisen perusteen nojalla, ennalta määriteltyihin käyttötarkoituksiin ja rekisteröityjen oikeuksia kunnioittaen. Tietosuojan läpinäkyvyysperiaatteen mukaisesti on erityisen tärkeää huolehtia siitä, että tutkittaville kerrotaan henkilötietojen käsittelystä tietosuoja-asetuksen edellyttämällä tavalla. Kaikessa henkilötietojen käsittelyssä noudatetaan tietosuojaa koskevia yleisiä periaatteita.
Tietoturva ja tietosuoja ovat läheisesti yhteydessä toisiinsa. Tietosuojan yleisten periaatteiden mukaisesti henkilötietoja käsitellään tavalla, jossa varmistetaan asianmukainen turvallisuus. Henkilötiedot on suojattava etenkin luvattomalta ja lainvastaiselta käsittelyltä. Samoin tiedot on suojattava muun muassa vahingossa tapahtuvalta tuhoutumiselta ja vahingoittumiselta. Muiden yleisten tietosuojaperiaatteiden noudattaminen tukee tämän toteutumista: esimerkiksi henkilötietoja ei tule kerätä ja käsitellä tarpeettomasti ja niitä säilytetään muodossa, josta rekisteröity on tunnistettavissa vain välttämättömän ajan. Tietoturva ei kuitenkaan rajoitu henkilötietoihin. Se koskee yleisemmin kaikkia tietoja ja järjestelmiä.
Tietoturvalla tarkoitetaan usein luottamuksellisuuden, eheyden ja käytettävyyden varmistamista. Näitä näkökulmia toteutetaan erilaisilla hallinnollisilla ja teknisillä toimenpiteillä. Jos tutkija toimii osana laajempaa organisaatiota, on tärkeä tutustua huolella tietojärjestelmiä koskeviin käyttöehtoihin ja ohjeisiin. Näihin kuuluvat yleisten ohjeiden lisäksi menettelyt, kun havaitaan tietosuoja- tai tietoturvapoikkeama. Samoin tarjottava koulutus tietoturvasta on tärkeää hyödyntää. Tutkimuksessa on usein tarpeellista käyttää ulkopuolisia palveluita. Näitä käytettäessä on tärkeä huolehtia siitä, että niiden tarjoamat palvelut täyttävät sekä tietosuoja- että tietoturvavaatimukset.
Tietoturvalta edellytetty taso riippuu osittain käsiteltävistä tiedoista. Henkilötietojen osalta lähtökohtana on muun muassa käsittelyn luonne, laajuus ja todennäköiset riskit. Esimerkiksi erityisiin tietoryhmiin kuuluvat tiedot (tai muuten sensitiivinen data) voivat edellyttää usein kattavampia suojatoimia. Hyvä on myös huomioida myös se, että tietoturvaratkaisut on sopeutettava jatkuvasti teknologiseen kehitykseen ja muuttuviin riskeihin. Tietoturvan – ja siihen liittyvien luottamuksellisuuden, eheyden ja käytettävyyden - toteuttamiseen on useita keinoja. Organisaatioiden on tärkeä huolehtia sitä, että tietoturvasta huolehtimiseen on varattu riittävästi resursseja. Erilaisia keinoja toteuttaa tietoturvaa on useita: esimerkiksi salaus, pseudonymisointi, fyysinen kulunvalvonta, pääsyoikeuksien hallinta, varmuuskopiointi, sopimusjärjestelyt ja koulutus.
Suurta tallennuskapasiteettia vaativat aineistot kannattaa säilyttää tutkimuksen ajan oman organisaation tarjoamassa turvallisessa tallennusympäristössä tai Opetus- ja kulttuuriministeriön tarjoamassa Fairdata-kokonaisuuteen kuuluvassa IDA-säilytyspalvelussa. IDA on hyödyllinen ja tietoturvallinen ratkaisu myös eri yliopistojen välisille yhteisprojekteille, joissa analysoidaan samaa aineistoa. Palvelu on tarkoitettu Suomen korkeakouluille ja valtion tutkimuslaitoksille. Tieteen tietotekniikan keskus CSC tarjoaa myös datan hallinnan palveluja sensitiivisille aineistoille (Avautuu uuteen välilehteen) .
- Tietosuoja: Viranomaisohjeet informoinnista (Avautuu uuteen välilehteen)
- Lisätietoa henkilötietojen käsittelystä informoinnista
- Lisätietoa tutkimusaineistojen tunnisteellisuudesta ja anonymisoinnista
- Lisätietoa tietoturvasta
- IDA – Tutkimusdatan säilytyspalvelu (Avautuu uuteen välilehteen)
4. Tiedostoformaatit ja ohjelmistot
- Mitä ohjelmistoja käytetään aineiston tallentamiseen ja prosessointiin?
- Mitä tiedostoformaatteja ja tallennusmedioita käytetään?
Kvantitatiivisten aineistojen käsittelyyn on olemassa useita tilasto-ohjelmia. Myös laadullisten aineistojen käsittelyyn ja jäsentelyyn on omat ohjelmansa, vaikka esimerkiksi tekstien analyysissä käytetään edelleen usein tavallisia tekstinkäsittelyohjelmia. Valittu ohjelma määrittää käytettävät tiedostoformaatit. Koska ohjelmistot uusiutuvat koko ajan, aineistosta on hyvä tallentaa yksi täysin ohjelmistoriippumaton versio tai ainakin versio, jota useat eri ohjelmistot tukevat.
Aineistotiedostoja voidaan tallentaa ja siirtää optisilla medioilla (esim. CD, DVD, Blu-ray) ja haihtumattoman muistin medioilla (esim. USB-muistitikut). Varmin tapa säilyttää aineistotiedostoja on tallentaa ne magneettisille medioille (esim. kiintolevyt ja magneettiset nauhat).
5. Aineiston käsittelyn ja sisällön kuvaus
- Miten varmistetaan aineiston (tekninen) laatu?
- Miten aineiston käsittely dokumentoidaan?
- Miten tallennetaan aineiston keruuta ja sisältöä kuvaava tieto (metadata)?
Aineiston laatuun vaikuttavat tallennusvaiheessa tehtävät sisällölliset ja tekniset ratkaisut. Niitä ovat esimerkiksi tietojen syöttö havaintomatriisiin tai ääni- ja äänikuvatallennuksen tekninen toteutus. Myös aineiston keruun jälkeen tehtävät aineiston käsittelyn ratkaisut vaikuttavat aineiston laatuun. Niitä ovat esimerkiksi aineistotiedostojen nimeäminen ja järjestäminen, puuttuvien tietojen määrittäminen ja muuttujien nimeäminen kvantitatiiviselle aineistolle ja tekstintäminen eli litterointi kvalitatiiviselle aineistolle.
Huolellinen dokumentaatio aineiston keruun vaiheista ja aineiston käsittelystä varmistaa tutkimuksen laadun. Aineiston dokumentointi on elintärkeää myös aineiston pitkäaikaissäilyttämisessä. Aineiston kattava kuvailu eli huolella tehty metadata mahdollistaa aineiston informoidun jatkokäytön ja pitkän elinkaaren.
- Lisätietoa ja ohjeita kvantitatiivisen aineiston käsittelyyn
- Lisätietoa ja ohjeita kvalitatiivisen aineiston käsittelyyn
- Lisätietoa metadatasta eli aineiston kuvailusta
6. Elinkaari
- Mitä aineistolle tapahtuu tutkimuksen päätyttyä?
Tutkimusaineiston käyttöarvo perustuu pitkälti tutkimushankkeen aikana tehtävään aineistonhallintatyöhön. Kun se on tehty suunnitelmallisesti, aineisto voi olla hyvin käyttökelpoinen tutkimuksen päätyttyä jatkotutkimuksissa tai menetelmien opetuksessa ja opiskelussa.
Mikäli tutkimusaineisto jää tutkimuksen päätyttyä yksittäiselle tutkijalle, yliopistolaitokselle, tutkimusyksikölle tai organisaatiolle, aineiston haltijan tulee ratkaista aineistonhallinnan perusasiat: säilytys, käyttö- ja arkistokopiot, aineistosta tiedottaminen, käyttöehdot ja jakelu. Kun aineisto arkistoidaan tietoarkistoon, huolehtii tietoarkisto kaikista mainituista tehtävistä ja varmistaa aineiston tietosuojan ja tietoturvan.
Kaikkia tutkimusaineistoja ei kannata säilyttää pysyvästi. Arkistointia harkittaessa on arvioitava muun muassa aineiston ainutkertaisuutta, käytettävyyttä, käyttörajoituksia, jatkokäyttöarvoa opetuksessa ja tutkimuksessa sekä arkistoinnin kustannuksia. Arkistoinnin kustannuksia lisää huomattavasti puutteellinen aineistonhallinta tutkimuksen aikana, sillä tutkimuksen päätyttyä aineiston perustietojen hankkiminen ja aineiston järjestäminen voi viedä kohtuuttoman paljon aikaa. Aineiston tuhoamisen tulee silti aina olla tietoinen päätös eikä seurausta puutteellisesta tai huolimattomasta aineistonhallinnasta.