Tietoarkisto edisti digiarkistojen luotettavuutta ja sertifiointia yhteiseurooppalaisessa hankkeessa

EU:n rahoittama Social Sciences & Humanities Open Cloud (SSHOC) -projekti päättyy huhtikuun lopussa 2022. Tavoitteena on ollut luoda pilvipohjaisia ratkaisuja eurooppalaisille yhteiskunta- ja humanististen tieteiden tutkijoille sekä siirtyä yhteiseen, kehittyneeseen palveluinfrastruktuuriin. Tietoarkisto on kolmen vuoden ajan koordinoinut hankkeessa kahta tehtävää, joista toisessa keskityttiin digitaalisesta pitkäaikaissäilytyksestä vastaavien data-arkistojen luotettavuuden parantamiseen erityisesti CoreTrustSeal-sertifioinnin näkökulmasta.

Kuvituskuvassa SSHOC-hankkeen logo ja kaksi toisiaan kohti kurottavaa kättä.

Tukea arkistoille kädestä pitäen – hyvin tuloksin

Tehtävä 8.2, Trust & Quality Assurance, Impact, antoi tukea 14 arkistolle niiden matkalla kohti CoreTrustSeal (CTS) -sertifiointia. Arkistot valittiin avoimessa haussa kesällä 2020. Jokaiselle osallistujalle nimettiin T8.2-tiimistä kaksi henkilöä, jotka opastivat arkistojen edustajia CTS-itsearviointilomakkeen täyttämisessä ja vastasivat itsearviointiin liittyviin kysymyksiin.

Mukaan valikoituneista arkistoista kahdeksalla oli tavoitteena hakea sertifikaattia projektin aikana ja loput osallistuivat perehtyäkseen sertifikaattiin ja sen vaatimuksiin. Arkistokohtaisen tuen ohella projektin aikana järjestettiin useampi tapahtuma, joissa tuettujen arkistojen edustajat pääsivät kertomaan sertifiointiin liittyvistä haasteistaan ja jakamaan kokemuksiaan.

Kolme arkistoa lähetti CoreTrustSeal-hakemuksensa ennen projektin loppua. Kolme muuta sai hakemuksensa käytännössä valmiiksi ja lähettää sen tämän vuoden aikana. Myös useimmat muut osallistujat pääsivät hakemustensa kanssa pitkälle ja onnistuivat kehittämään käytäntöjään CTS-vaatimusten mukaisiksi. Kolme arkistoa jättäytyi tukiprosessista pois, koska eivät kyenneet käyttämään siihen riittävästi aikaa.

Prosessiin osallistuneet arkistot pitivät tukea hyödyllisenä ja kokivat sen helpottavan sertifikaatin hakemista. Erityisen hyödyllisenä koettiin virtuaalitapaamiset tukitiimin ja arkistojen edustajien välillä, joissa voitiin käsitellä hakemuksen täyttämisessä esiin nousseita kysymyksiä ja keskittyä haastaviin hakemuskohtiin.

Sertifiointi parantaa arkistojen käytäntöjä

Tukiprosessin lisäksi 8.2-työpaketissa tutkittiin SSHOC-hankkeeseen osallistuvia data-arkistoja sertifioinnin ja luotettavuuden näkökulmasta. Arkistoille tehdyn kyselyn ja niiden verkkosivuilta kerättyjen tietojen perusteella tehdyn kartoituksen nojalla kävi ilmi, että arkistot ovat hyvin moninaisia. Erityisesti niiden palvelemat tieteenalat ja käyttäjäryhmät sekä tallentamat datatyypit eroavat toisistaan huomattavasti. Arkistojen moninaisuus on hyvästä ja tarpeellista, mutta eroavaisuudet hankaloittavat kaikille sopivan sertifiointiratkaisun löytämistä.

Sertifioidut data-arkistot ottavat toiminnassaan selvästi paremmin huomioon esimerkiksi aineistojen löydettävyyden ja tarjoavat käyttäjilleen enemmän ja läpinäkyvämmin tietoa toiminnastaan kuin arkistot, joilla sertifikaattia ei vielä ole. Sertifioituja arkistotoimijoita on erityisen paljon yhteiskuntatieteitä palvelevan CESSDAn ja kielitieteisiin keskittyvän CLARIN-infrastruktuurin arkistojen joukossa. Sertifiointi ei näyttänyt olevan kovin yleistä digitaalisia humanistisia tieteitä ja kulttuuriperinnön tutkimusta palvelevien DARIAH ja E-RIHS-infrastruktuurien jäsenillä.

Tulosten perusteella sertifioinnin tukemisessa on vielä paljon tehtävää, ja yhteiskuntatieteellisten ja humanististen arkistojen olisikin syytä tehdä nykyistä tiiviimpää yhteistyötä määritelläkseen luotettaviin arkistoihin kohdistuvia odotuksia entistä tarkemmin ja lisätäkseen tietoa sertifiointiin liittyvistä hyödyistä.

Sertifioinnin hakemista tuetaan jatkossakin

Työpaketin loppupäätelmänä oli, että CoreTrustSeal on perustason sertifikaattina useimmille yhteiskuntatieteellisten ja humanististen alojen pitkäaikaissäilytyksestä vastaaville arkistoille varsin sopiva. Datapalvelut, jotka eivät vastaa pitkäaikaissäilyttämisestä, eivätkä siten voi suoranaisesti hakea virallista sertifikaattia, voivat silti parantaa käytäntöjään ottamalla CTS-vaatimukset toiminnassaan huomioon.

Jotta CoreTrustSeal pysyisi perustason sertifikaattina, sen vaatimuksia ei tulisi juuri laajentaa nykyisestä. Toisaalta vaatimuksia ei ole syytä myöskään keventää, sillä sertifikaatti sisältää nykyisellään ydinvaatimukset, jotka jokaisen digitaalisen tiedon pitkäaikaissäilytystä ja uudelleenkäyttöä tarjoavan luotettavan arkiston tulee täyttää.

SSHOCin osallistujaorganisaatiot ovat sopineet yhteistyön jatkumisesta yhteiskunta- ja humanististen tieteiden avoimena klusterina (SSH Open Cluster) myös projektin jälkeen. Yksi tulevista yhteistyön muodoista on luotettujen digitaalisten arkistojen verkosto, joka on suunnitteilla sertifiointituen jatkamiseksi. Useimmat tukiprosessiin osallistuneet arkistot olivat kiinnostuneita verkostoon liittymisestä. Vaikka SSHOC-hanke päättyy, jatkuva tuki luotettujen arkistojen sertifioinnin edistämiseksi on vasta alussa.

Teksti: Henri Ala-Lahti, kuvituskuva: Austin Kehmeier (Unsplash), logo: SSHOC