FIN-CLARIN ja tietoarkisto yhteistyöhön
Helena Laaksonen
Kielentutkimuksen ja yhteiskuntatieteiden tutkimusinfrastruktuurien rakentajilla on ratkaistavanaan useita yhteisiä kysymyksiä, jotta olemassa olevat resurssit saadaan tehokkaasti laajan käyttäjäkunnan ulottuviin. Yhteiskuntatieteellinen tietoarkisto ja FIN-CLARIN virittelivät yhteistyötään Tampereella helmikuun alussa.
FIN-CLARIN on suomalainen osapuoli ESFRI-projektissa, joka suunnittelee Euroopan laajuista kieliaineistojen ja -teknologian infrastruktuuria. CLARIN on lyhenne sanoista Common Language Resources and Technology Infrastructure. Projekti on humanististen tieteiden vastine yhteiskuntatieteellisten data-arkistojen Cessda-PPP-projektille. Kumpikin ESFRI-tiekartalla oleva projekti saa rahoitusta EU:n tutkimuksen seitsemännestä puiteohjelmasta ja valmistelee infrastruktuurin rakentamista. FIN-CLARINin rahoituksesta suuri osa tulee kotimaisista lähteistä, muun muassa Helsingin yliopiston strategisena rahoituksena.
ESFRI-projektien suomalaiset partnerit FIN-CLARIN ja Yhteiskuntatieteellinen tietoarkisto joutuvat kumpikin etsimään kansallisia ratkaisuja, jotka sopivat yhteen myös syntyvien eurooppalaisten infrastruktuurien toimintojen kanssa.
FIN-CLARINin tehtävänä CLARIN projektissa on rakentaa Suomeen eurooppalaisen infrastruktuurin kanssa yhteensopiva järjestelmä, tarjota suomalaisille tutkijoille vaivaton pääsy Euroopan laajuisiin CLARINin aineistovarantoihin ja vastaavasti eurooppalaisille tutkijoille vaivaton pääsy kieliaineistoihin Suomessa. Yhteiskuntatieteellisen tietoarkiston rooli Cessda-PPP-projektissa on hyvin samanlainen. Eurooppalaisten data-arkistojen aineistoyhteistyöllä on tosin paljon PPP-projektia pitemmät perinteet.
Yhteistyön mahdollisuuksia
Molempien projektien suomalaisilla edustajilla on ratkaistavanaan muun muassa käyttäjien tunnistaminen ja käyttöoikeuksien myöntäminen verkossa. Käyttölupaprosessi on kummassakin organisaatiossa hyvin samantyyppinen. Sekä CLARIN että tietoarkisto suunnittelevat prosessia HAKA-järjestelmään pohjautuvaksi. Kumpikin järjestelmä vaatisi käyttäjiltä lisätietoja HAKA-tunnusten lisäksi. Aineistojen käyttöehdot esimerkiksi vaihtelevat. Ei riitä, että käyttäjällä on HAKA-federaatioon liittyneen yliopiston tunnukset, jos tutkimusaineistoa saa käyttää vaikkapa vain opiskeluun. Tieteen tietotekniikan keskus CSC tekee käyttöesimerkkiä luvanmyöntöprosessista FIN-CLARINille. Yhteistyökokouksessa todettiin, että käyttölupaprosessin suunnittelu ja toteuttaminen tarjoaa hyvät mahdollisuudet yhteistyöhön.
Erityisesti tietoarkistoon tallennettujen kvalitatiivisten aineistojen ja kieliaineistojen välillä on paljon yhteistä. Suurin osa kvalitatiivisesta aineistosta on tekstiä, kuten kieliaineistoistakin. Kvalitatiivisen AV-aineiston ja kielentutkimuksen AV-aineistojen pitkäaikaissäilytyksen ja tietosuojan erityiskysymykset ovat niin ikään monilta osin samanlaisia, joten ratkaisuja voidaan etsiä yhdessä. Myös aineistojen käyttäjäkunta voi olla osin samaa, koska aineistoja voidaan tarkastella monen tieteenalan näkökulmista.
Aineistojen kuvailussa sekä ohjeiden ja toiminta- ja sopimusmallien laatimisessa nähtiin myös yhteistyön mahdollisuuksia.
Kuva: Yhteistyötapaamisen osallistujia tietoarkistossa: (vas.) Kimmo Koskenniemi (HY), Sami Borg (tietoarkisto), Krister Lindén (HY), Jaana Kekäläinen (TaY) ja Totti Mäkelä (CSC) sekä Arja Kuula (tietoarkisto).
Kieliaineistoja voi tekijänoikeussyistä käyttää usein vain siellä, missä ne ovat. Kopioita, ainakaan koko aineistosta ei saa ottaa. Tämä asettaa aineistojen käyttäjät eriarvoiseen asemaan. Resurssien äärellä asuvien on tietenkin vaivattomampaa käyttää niitä tehokkaasti. Tämä voi olla ongelma kansallisella tasolla. Euroopan laajuisessa infrastruktuurissa aineistojen turvatun etäkäytön mahdollisuus on vielä ilmeisempi.
Pelkästään tutkimustarkoituksiin kerättyjen yhteiskuntatieteellisten aineistojen käyttöä tekijänoikeudet eivät yleensä rajoita. Sen sijaan arkaluontoisten ja suoria henkilötietoja sisältävien aineistojen tutkimuskäyttöä rajoittaa tietosuoja. Tutkimukseen kerättyjen AV-aineistojen jatkokäytössä on sama ongelma. Etäkäyttöjärjestelmiä suunnittelevat sekä Tilastokeskus että Rekisteritutkimuksen tukikeskus ReTki. FIN-CLARINin ja tietoarkiston edustajat pohtivat olisiko mahdollista rakentaa yhteinen kansallinen etäkäyttöjärjestelmä, jossa kaikki tahot olisivat mukana.
FIN-CLARINia edustivat Tampereen kokouksessa Helsingin yliopistosta projektin vastuuhenkilö professori Kimmo Koskenniemi ja tutkimuskoordinaattori Krister Lindén, Tampereen yliopistosta dosentti Jaana Kekäläinen ja CSC:stä kehityspäällikkö Totti Mäkelä.
Lisätietoa ja lähteitä:
» FIN-CLARIN: Finnish CLARIN
» ESFRI, the European Strategy Forum on Research Infrastructures
» CESSDA PPP
|