Tietoarkiston aineistonhallintapolitiikka

Tietoarkiston aineistonhallintapolitiikka on muodostettu Tampereen yliopiston tutkimusinfrastruktuureille laaditun avoimen tieteen politiikan pohjalta (Data Management Policy for Open Research Infrastructures at Tampere University).

Periaate 1Toimintasääntöjä ja eettisiä ohjeistuksia noudatetaan.

Tutkimusyhteisön luottamuksen ylläpitämiseksi on välttämätöntä noudattaa tutkimuseettisiä käytäntöjä ja lainsäädäntöä. Kun tutkijat ja aineistojen tuottajat arkistoivat aineistonsa Tietoarkistoon, ne on avattu paitsi FAIR-periaatteiden mukaisesti myös vastuullisesti, turvallisesti ja luotettavasti.

Tutkimuseettinen neuvottelukunta (TENK) on luonut viralliset eettiset ohjeet suomalaiselle tutkimusyhteisölle. Tietoarkiston aineistojen yleisissä käyttöehdoissa jatkokäyttäjät sitoutuvat aineistoja käyttäessään ja tuloksia julkaistessaan noudattamaan tutkimuseettisen neuvottelukunnan eettisiä periaatteita ja olemaan vaarantamatta aineiston tietoihin liittyvien henkilöiden tai tahojen yksityisyydensuojaa.

Periaate 2Tietoarkisto noudattaa kansallisia ja kansainvälisiä sopimuksia ja säädöksiä, kuten EU:n yleistä tietosuoja-asetusta.

Tietoarkisto varmistaa, että aineistojen arkistointi noudattaa voimassa olevaa lainsäädäntöä erityisesti tekijänoikeuksien ja yksityisyydensuojan osalta. Jos aineisto kerätään luonnollisilta henkilöiltä, tarkastamme, että se täyttää yleisen tietosuoja-asetuksen (GDPR, 2016/679) vaatimukset. Pyydämme tutkijoita anonymisoimaan aineistonsa ennen arkistointia.

Ennen aineiston siirtoa Tietoarkistoon solmimme luovuttajan (tutkijan) kanssa sopimuksen henkilötietojen käsittelystä. Näin varmistetaan tietosuoja-asetuksen mukainen siirto Tietoarkistoon. Edellytämme aina sopimuksen tekemistä, sillä usein anonymisoidutkin aineistot sisältävät vähintään epäsuoria tunnisteita siinä määrin, että ne katsotaan Tietoarkistossa henkilötietoja sisältäviksi. Koska luovuttaja on arkistoidun aineiston rekisterinpitäjä, pyydämme hyväksynnän Tietoarkistossa tehdyille tunnisteiden poistoille ja muokkauksille.

Aineistonkäsittelijämme varmistavat aineiston aihepiiristä riippumatta, että pitkäaikaissäilytettävät aineistotiedostot eivät sisällä tunnisteellisia tai arkaluonteisia tietoja. Jokaiselle aineistolle tehdään tapauskohtainen anonymisointisuunnitelma (Aineistonhallinnan käsikirja: Kvantitatiivisten aineistojen anonymisointi & Kvalitatiivisten aineistojen anonymisointi).

Jos tutkija haluaa arkistoida tunnisteita sisältävän tutkimusaineiston, autamme tutkijaa arvioimaan tietosuoja-asetuksen ja tietosuojalain asettamien ehtojen täyttymistä. Käytännöllisin vaihtoehto on soveltaa tietosuoja-asetuksen 85 artiklaa ja siihen pohjautuvia tietosuojalain 27 §:n säännöksiä (henkilötietojen käsittely journalistisen, akateemisen, taiteellisen tai kirjallisen ilmaisun tarkoituksia varten).

Periaate 3Tietoarkiston hallinnoimien aineistojen immateriaalioikeudet ovat selvillä.

Tietoarkisto ei ota vastaan aineistoja, joiden tekijänoikeuksissa tai muissa immateriaalioikeuksissa on epäselvyyksiä. Jos aineistossa on tutkittavien tuottamaa tekijänoikeussuojattua materiaalia, Aineistonhallinnan käsikirja opastaa asianmukaisen oikeuksiensiirtosopimuksen muodostamiseen aineiston arkistoinnin ja jatkokäytön mahdollistamiseksi (Aineistonhallinnan käsikirja: Tekijänoikeuksien ja omistusoikeuden siirtymisestä sopiminen ulkopuolisten kanssa).

Suomen tekijänoikeuslaissa ei ole niin sanottua tutkimuspoikkeusta, joka mahdollistaisi tutkimuksessa analysoitujen teosten arkistoinnin tutkimuskäyttöön ilman tekijän lupaa tai erillistä lisenssisopimusta. Tietoarkisto ja Kopiosto ovat solmineet 2015 sopimuksen, jonka mukaan tutkimuksen aineistoksi digitoidut tai valmiiksi sähköisessä muodossa olevat Kopioston edustamien oikeudenhaltijoiden aloihin lukeutuvat teokset saa arkistoida Tietoarkistoon tutkimuskäyttöä varten (esim. lehtiartikkelit, kuvat, kuvitukset ja sarjakuvat). Sopimus ei koske audiovisuaalisia teoksia eikä sävellysteoksia.

Periaate 4Aineistojen omistuksesta ja käyttöoikeuksista on tarvittavat sopimukset.

Tutkimusaineiston luovuttaja suostuu aineiston arkistointiin ja jatkokäyttöön toimittamiseen arkistointisopimuksessa PDF mainituin ehdoin. Aineiston alkuperäiset tekijät säilyttävät kaikki aineistoon liittyvät tekijänoikeudet ja muut immateriaalioikeudet. Tietoarkisto huolehtii tietosuojalainsäädännön mukaisesti aineiston pitkäaikaissäilyttämisestä sekä jatkokäyttöön toimittamisesta arkistointisopimuksessa sovittuihin tarkoituksiin.

Periaate 5Tietoarkisto edistää hallinnoimiensa aineistojen levitystä ja julkisuutta ja käyttää mahdollisuuksien mukaan avoimia lisenssejä, jotta aineistot ja metadata ovat helposti ja avoimesti saatavilla.

Kaikki metadatamme on avattu Creative Commons By 4.0 -lisenssillä. Palveluportaali Ailassa kaikki käyttäjät voivat tutkia ja selata aineistokuvailuja, koodikirjoja ja aineisto-oppaita, muuttujia ja niiden jakaumia sekä yksinkertaisia frekvenssejä ja kohdistaa niihin hakuja. Varsinaiset analysoitavat datatiedostot saa maksutta kellon ympäri Ailasta kullekin aineistolle asetettujen käyttöehtojen mukaisesti.

FAIR-periaatteiden mukaisesti Ailan metadata on saatavilla koneluettavassa muodossa mm. DDI 2.0 -formaatissa. Ylläpidämme lisäksi erillistä OAI-PMH-palvelinta (Kuha), josta metadatan voi haravoida koneellisesti erilaisiin katalogeihin. Ailan lisäksi Tietoarkiston aineistojen metadata on löydettävissä Etsin-, Finna- ja CESSDA-aineistoluetteloista.

Periaate 6Ohjeilla ja työkaluilla varmistetaan yhdenmukainen metadata.

Aineiston dokumentointiin ja metadataan liittyviä ohjeita on Tietoarkiston tuottamassa Aineistonhallinnan käsikirjassa. Palveluportaali Ailassa on aineistonluovutustyökalu, jolla luovuttaja siirtää Tietoarkistoon datatiedostot, kuvailevan metadatan ja muut tiedot käyttäen salattua yhteyttä (ohjeet aineiston luovuttamiseen Ailassa).

Kuvailemme kaikki arkistoitavat aineistot DDI Codebook -standardin mukaisesti. DDI (Data Documentation Initiative) on kansainvälinen standardi yhteiskunta-, käyttäytymis-, talous- ja terveystieteissä kyselyillä ja muilla menetelmillä kerätyn datan kuvailuun. DDI:ssä aineistot kuvaillaan käyttämällä XML-rakenteita.

Tietoarkisto käyttää aineistokuvailuissaan useita kontrolloituja sanastoja ja tesauruksia: Opetus- ja kulttuuriministeriön tieteenalaluokitusta ja CESSDAn aihepiiriluokitusta sekä asiasanoitukseen suomeksi Yleistä suomalaista ontologiaa (YSO) ja englanniksi monikielistä ELSST-sanastoa. Tämän lisäksi käytetään DDI-allianssin kehittämiä kontrolloituja sanastoja aineistojen otanta- ja keruumenetelmien, aikaulottuvuuden, keruuinstrumenttien ja havaintoyksiköiden kuvailemiseen.

Periaate 7Käyttäjiä ohjeistetaan huomioimaan tutkimustuotoksissaan Tietoarkiston tekemä työ.

Vastuullinen tieteen tekeminen edellyttää toisten tutkijoiden saavutusten kunnioittamista ja niihin viittaamista asianmukaisesti. Tietoarkistoon arkistoitujen aineistojen käyttäjät sitoutuvat aineistojen yleisissä käyttöehdoissa viittaamaan aineistoihin ja niiden alkuperäisiin tekijöihin. Tietoarkiston jokaiselle aineistolle tarjoaman malliviittauksen ansiosta viittaaminen on aineiston käyttäjälle mahdollisimman vaivatonta.

Ailan rekisteröityneet käyttäjät sitoutuvat ilmoittamaan Tietoarkistolle kaikista julkaisuista, joissa käytetään Ailasta ladattuja aineistoja. Tietoarkisto näyttää aineistoon pohjautuvien julkaisujen viitetiedot Ailan aineistokuvailussa. Tutkijat voivat myös pyytää vuosiraportin aineistojensa jatkokäytöstä julkaisuissa.

Periaate 8Pysyviä tunnisteita (PID) tuetaan.

Annamme kaikille arkistoiduille aineistoille pysyvän URN-tunnisteen. Pysyvillä tunnisteilla eli PIDeillä varmistetaan aineistojen löytyvyys myös siinä tilanteessa, että niiden sijainti jostain syystä muuttuisi. Sitoudumme FAIR-periaatteisiin, mihin myös selkeä PID-politiikka kuuluu.

Periaate 9Laadunvarmistusprosessit ovat selkeitä käyttäjille.

Datankäsittelijämme tarkistavat perusteellisesti kaikki arkistoitavat aineistot. Kaikki aineistoihin tehtävät muutokset dokumentoidaan. Kvantitatiivisten aineistojen muuttujat tarkistetaan kyselylomakkeen (tai muun aineistonkeruuinstrumentin) perusteella, ja mahdolliset puutteet selvitetään. Datatiedostoihin lisätään yksityiskohtaisia tietoja muuttujien sisällöistä ja arvoista, ja muuttujille ja arvoille annetaan selitteet kyselylomakkeen perusteella. Kvalitatiiviset aineistot tarkistetaan huolellisesti aineistoon jääneiden tunnistetietojen varalta. Tiedostot nimetään järjestelmällisesti ja sisäisen metadatan (tiedostonimet, selitteet) yhdenmukaisuus tarkistetaan. Datatiedostot muunnetaan jatkokäyttöön ja pitkäaikaissäilytykseen soveltuviin tiedostoformaatteihin (ks. Formaattitaulukko).

Laadunvarmistus toteutetaan järjestelmällisesti: aineistonkäsittelijät noudattavat tarkkoja sisäisiä ohjeistuksia aineistojen prosessoinnissa ja tekevät aineistoille ristiintarkistuksia. Säännöllisin väliajoin aineistoille tehdään myös jäännösriskin arviointia (residual risk assessment), jolla varmistetaan anonymisoinnin riittävyys (Laatutyö Tietoarkistossa).

Periaate 10Aineistoihin pääsyn ehdot ovat selkeitä käyttäjille.

Tietoarkistoon arkistoiduilla aineistoilla on neljä saatavuusluokkaa, joiden pääsyehdot on selitetty selkeästi jokaisen aineiston kuvailussa.

Periaate 11Avoimilla rajapinnoilla ja standardeilla varmistetaan yhteentoimivuus muiden kansallisten ja kansainvälisten infrastruktuurien ja prosessien kanssa.

FAIR-periaatteiden mukaisesti kaikki metadata on saatavilla palveluportaali Ailan kautta koneluettavassa muodossa. Tietoarkisto ylläpitää erillistä OAI-PMH-palvelinta metadatan haravoimiseksi erilaisiin kansainvälisiin aineistoluetteloihin. (Ks. Aineistokuvailut koneluettavissa formaateissa.)

Tietoarkisto kehittää parhaita käytäntöjä, prosesseja, työkaluja ja ohjelmistoja tutkimusaineistojen keräämiseen, käsittelyyn, hallintaan ja pitkäaikaissäilytykseen. Mahdollisuuksien mukaan Tietoarkisto tuottaa avointa lähdekoodia ja ohjelmat julkaistaan Tietoarkiston verkkosivuilla (Avoimen lähdekoodin ohjelmistot).

Periaate 12Vaikuttavuutta ja käyttöä (itse-)arvioidaan tasaisin väliajoin. Tilastot ja metriikka ovat vapaasti saatavilla käytön mittaamiseksi.

Vuosikertomuksessamme julkaistaan perustilastoja palveluistamme sekä yksityiskohtaisia lukuja esimerkiksi aineistojen hankinnasta ja verkkosivuston käytöstä. Julkaisemme vuosittain myös tietotilinpäätöksen, joka kuvaa aineistonkäsittelyn tilaa, yksityisyydensuojaan ja tietosuojaan liittyviä riskejä sekä tehtyjä tietosuojatoimenpiteitä.

Osana Tampereen yliopiston laadunhallintaa itsearvioimme säännöllisesti suoriutumistamme käyttäen Common Assessment Framework (CAF) -laadunarviointimallia. Sen lisäksi toimintamme arvioinnissa hyödynnetään käyttäjäkyselyitä, käyttäjiltä saatua palautetta sekä sisäisestä tietokannasta ajettuja raportteja.

Kansainvälinen asiantuntijapaneeli arvioi kehityssuunnitelmiamme ja niiden toteutumista, kun haemme tutkimusinfrastruktuurirahoitusta Suomen Akatemialta ja kun kansallista tutkimusinfrastruktuuristrategiaa ja -tiekarttaa päivitetään.

Periaate 13Kehittämisessä sitoudutaan avoimuuteen, ideoiden jakamiseen, kestävään kehitykseen, reiluuteen ja tasa-arvoon.

Tietoarkisto on toteuttanut avoimen tieteen kulttuuria ja puhunut sen puolesta jo yli 20 vuoden ajan. Nykyinen strategiamme painottaa vastuullista avointa tiedettä. Lähestymistapamme tieteeseen ja tutkimukseen on ”FAIR + avoin”. Tietoarkisto on CoreTrustSeal-sertifioitu luotettava arkisto.

Tasa-arvo on asiakaspalvelumme perusperiaatteita. Palvelumme ovat saatavilla kaikille asiakkaille Suomessa ja ulkomailla iästä ja sukupuolesta riippumatta. Minkä tahansa tutkimusorganisaation tai korkeakoulun tutkijat ja opiskelijat voivat rekisteröityä Ailan käyttäjiksi ja saada pääsyn arkistoituihin tutkimusaineistoihin. Tietoarkisto kääntää asiakkaan pyynnöstä kvantitatiivisia aineistoja englanniksi. Käännöspalvelu on maksuton asiakkaalle sekä aineiston luovuttajalle.

Tietoarkisto edistää kestävän kehityksen tavoitteita hankkimalla, kuratoimalla ja tarjoamalla jatkokäyttöön aineistoja, jotka soveltuvat kestävään kehitykseen liittyvien aiheiden tutkimiseen (ks. aineistojen tieteenaloja/aihealueita).

Tampereen yliopiston ja Tampereen teknillisen yliopiston yhdistyminen vuonna 2019 uudeksi Tampereen yliopistoksi on tarjonnut Tietoarkistolle mahdollisuuden hyödyntää paremmin Tampereen yliopiston henkilöstö-, talous- ja IT-palveluita sekä muuta yliopiston tuki-infrastruktuuria. Vuonna 2020 Tietoarkiston palvelimet siirrettiin yliopiston hallinnoimaan palvelintilaan. Sen lisäksi, että muutos on parantanut Tietoarkiston teknisen infrastruktuurin toimintavarmuutta, keskitetty palvelinratkaisu vähentää huomattavasti palvelinten energiankulutusta (noin 80 %) ja pienentää siten Tietoarkiston hiilijalanjälkeä. Lentämisen hiilidioksidipäästöjen vähentämiseksi henkilöstöä kannustetaan mahdollisuuksien mukaan osallistumaan virtuaalisesti kansainvälisiin projekteihin. Koska Suomi on kaukana kaikesta, Tietoarkiston henkilökunta on jo vuosien ajan osallistunut etäyhteyksin kansainvälisiin kokouksiin aina kun mahdollista.

Periaate 14Tietoarkisto edistää kanssakäymistä ja innovaatiota elinkeinoelämän, teollisuuden, julkisten palveluiden ja kansalaisten kanssa.

Yhteistyö teollisuuden ja yksityisten yritysten kanssa ei ole keskeistä Tietoarkiston toiminnassa, mutta aineistojen hankinnassa tehdään yhteistyötä aineistonkeruuorganisaatioiden kuten Taloustutkimus Oy:n ja Kantar TNS Oy:n kanssa.

Kansalaistieteen edistämiseksi Tietoarkisto on kehittänyt aineistojen ymmärtämistä helpottavia palveluita. Tietomilli on julkinen verkkopalvelu mielipidetutkimusten tarkasteluun. Tietomillin avulla kuka tahansa koululaisista poliittisiin päättäjiin voi helposti analysoida suomalaisia väestökyselyitä. Tietomillin käyttö ei vaadi tilastotieteellisten ohjelmistojen käytön osaamista.

Tietoarkistossa on kasvava määrä avoimia A-saatavuusluokan aineistoja, joita käyttötarkoituksesta riippumatta voi käyttää kuka tahansa aina yksittäisistä kansalaisista julkisen ja yksityisen sektorin organisaatioihin. Ailan aineistojen kattavat metadatatiedot ovat myös avoimesti kaikkien hyödynnettävissä.