Teksti: Mari Kleemola | Kuva: Jani Hautamäki

IASSIST 2012 halusi sekä vapauttaa että valjastaa tutkimusaineistot

Ihmistieteiden alan tutkimusaineistojen arkistoinnin, dokumentoinnin ja jakelun ammattilaisten vuoden päätapahtuma, IASSIST-konferessi, pidettiin kesäkuussa Washingtonissa Yhdysvalloissa. Järjestyksessä jo 38. konferessi oli saanut teemakseen Data Science for a Connected World: Unlocking and Harnessing the Power of Information. Kolmepäiväisen konferenssin satakunta esitystä tarjosivat kattavan kuvan alan nykytilanteesta ja tulevaisuuden kehityskohteista. Tutkimusdatan mahdollisimman laajaa ja vapaata käyttöä kannatettiin laajasti. Data pitää voida valjastaa tutkimuksen tarpeisiin ja muuhunkin tuottavaan toimintaan. Keskeisiksi keskustelunaiheiksi nousivat muun muassa metadata, sähköisen pitkäaikaissäilytyksen luotettavuus ja pääsy arkaluonteisiin aineistoihin.

Metadata puhuttaa vuodesta toiseen

Sähköisen aineiston löytäminen, käyttäminen ja säilyminen ymmärrettävänä vaatii runsaasti metadataa. Ei siis ihme, että metadata on jo vuosia ollut IASSIST-konferenssien suosituimpia teemoja. Washingtonissa kuulimme niin käytännön kokemuksia metadatan parissa työskentelystä kuin myös suunnitelmia siitä, miten tulevaisuudessa voitaisiin saada talteen aina vain parempaa metadataa. Metadataan liittyivät myös konferenssin ohessa järjestetyistä kokouksista tietoarkiston kannalta tärkeimmät: DDI-allianssin vuotuinen kokoontuminen ja DDI-kehittäjien tapaaminen. Allianssin kokouksessa keskusteltiin muun muassa allianssin organisaatiorakenteen muutoksesta, DDI:n standardoinnista ISO-järjestelmän mukaisesti ja DDI-Lifecycle -mallin kehittämisestä. Varsinaisten DDI-kokousten ja konferenssiesitysten lisäksi saimme ja jaoimme runsaasti tietoa DDI-formaatin hyödyntämisestä käytäväkeskusteluissa. Tietoarkistossa on tällä hetkellä käytössä DDI-Codebook, ja Tietoarkisto 2015 -hankkeessa tutkimme siirtymistä DDI-Lifecycle -formaattiin.

Sähköisen pitkäaikaissäilytyksen luotettavuus

Tämän vuoden alussa julkaistiin ISO-standardi sähköiselle pitkäaikaissäilyttämiselle (ISO 16363:2012 Audit and certification of trustworthy digital repositories). Teema olikin vahvasti esillä Washingtonissa. Ennen konferenssia järjestettiin luotettavan sähköisen arkistoinnin työpaja, ja varsinaisessa konferenssissa asiaan paneuduttiin kahden session verran.

Viimeisen parin vuoden aikana useat organisaatiot ovat innostuneet tekemään itsearviointeja ISO-standardin tai sen edeltäjän TRACin avulla. Konferenssissa saimme kuulla arviointien tuloksia. Tutuksi tuli myös eurooppalainen viitekehys sähköisen säilytyksen arvioinnille ja varmentamiselle. Esittelimme Washingtonissa alustavia tuloksia osana Tietoarkisto 2015 -hanketta toteuttamastamme itsearvioinnista. Tulokset ovat hyvin samansuuntaiset kuin muilla data-arkistoilla: perusasiat ovat kunnossa, mutta parannettavaa ja kehitettävää riittää.

Käytön kätevyys on parasta tietoturvallisuutta

Viimeisten vuosien aikana keskustelu on ilahduttavasti siirtynyt aineistojen suojelemisesta ja käyttörajoituksista siihen, miten tutkijoille mahdollistettaisiin turvallinen pääsy henkilötietoja sisältäviin tai muuten arkaluonteisiin aineistoihin, kuten esimerkiksi rekisteridataan. Konferenssissa esiteltiin erilaisia ratkaisuja, esimerkiksi etäkäyttöjärjestelmiä ja dataenklaaveja eli paikkoja, jossa dataa voi käyttää valvotuissa olosuhteissa ja eristettynä verkosta. Teknisillä järjestelmillä voidaan kuitenkin ratkaista vain osa tietoturvasta, sillä heikoin lenkki on yksittäinen ihminen. Usemmankin puhujan suulla kuulimme, että "convenience is security". Mitä helpompaa ja kätevämpää aineiston käyttö on, sitä vähemmän tutkijalla on kiusausta yrittää kiertää määräyksiä ja siten rikkoa tietosuojaa, vaikka tahattomastikin. Tutkijoille pitää myös tarjota koulutusta tietosuojaan liittyvistä asioista; joidenkin aineistojen kohdalla vuosittainen osallistuminen koulutukseen on jopa aineiston käytön ehto.

kuvituskuva

Lisätietoja

  • IASSIST 2012 -konferenssisivut
  • IASSIST-järjestön verkkosivut. IASSIST (International Association for Social Science Information Services and Technology) on data-arkistointi- ja tietopalvelualan kansainvälinen järjestö, jonka yli 300 jäsentä työskentelevät yliopistoissa, data-arkistoissa, tieteellisissä kirjastoissa, tutkimuslaitoksissa ja alan ei-kaupallisissa järjestöissä. Järjestön tavoitteena on luoda data- ja tietopalveluverkostoja, edistää yhteiskuntatieteen infrastruktuureja sekä luoda ja edistää datan arkistointiin, dokumentointiin, jakeluun, käyttöön ja avoimuuteen liittyviä hyviä käytäntöjä.
  • DDI-allianssi. DDI (Data Documentation Initiative) on tutkimusaineistojen kuvailuun kehitetty formaatti. DDI-Codebook tarjoaa ratkaisuja yksittäisten survey-aineistojen dokumentointiin ja DDI Lifecycle vertailu-, paneeli- ja sarja-aineistojen dokumentointiin ja elinkaaren hallintaan.