Erityislaatuinen toiminta edellyttää omia sovelluksia

Tietojärjestelmien ylläpitäminen ja kehittäminen kuuluvat Tietoarkiston ydintoimintoihin. Ilman kattavaa tietojärjestelmää perustoiminnot, sähköisen datan tallentaminen, säilyttäminen ja jatkokäyttö, eivät olisi mahdollisia. Omien sovellusten kehittäminen on oikeastaan ainut mahdollisuus, koska tarpeet ovat ainutlaatuisia eikä niihin ole sopivaa kaupallista tarjontaa.

Tietoarkiston it-palvelupäällikkö Matti Heinosen mielestä Tietoarkiston toiminnan kuvaukseen sopii sipulivertaus.

—Ytimessä ovat sähköiset tutkimusaineistot, joiden ympärille rakentuu kerros kerrokselta erilaisia palveluja ja sovelluksia. Koko toiminnan kannalta oleellista on sen ytimen turvaaminen eli datan säilyttäminen.

It-palvelupäällikkö Matti Heinonen jatkaa vielä toiminnan esittelyä mielikuvan avulla:

—Jos sipulin uloimmat kuoret sattuisivat vahingoittumaan, se ei olisi kovin dramaattista - siitä selviydyttäisiin. Joskin paljon lisätyötä rikkoutuneiden sovellusten tai palvelujen korjaaminen teettäisi, Heinonen kertoo.

—Mutta jos ydin vahingoittuisi, niillä uloimmilla kuorilla ei olisi enää olemassaolon edellytyksiä. Sen vuoksi aineistojen varma pitkäaikaissäilytys on Tietoarkiston toiminnan elinehto.

Etualalla Matti Heinonen seisoo ulkona, taustalla ikkunaseinä ja ajoluiska
It-palvelupäällikkö Matti Heinonen visioi tulevaisuutta, jossa verkostoituneen yhteistyön ansiosta palvelut on integroitu toimimaan nykyistä paremmin keskenään.

Tietojärjestelmien ylläpitäminen ja jatkuva kehittäminen kuuluvat Tietoarkiston ydintoimintoihin. Ilman toimivaa, kaiken kattavaa tietojärjestelmää perustoiminnot eli sähköisen datan tallentaminen, säilyttäminen ja jatkokäyttö eivät olisi mahdollisia. Operatiivisessa järjestelmässä luodaan puitteet datan siirtämiseksi järjestelmästä toiseen ja mahdollistetaan perusdatan käyttö erilaisissa sovelluksissa.

Tutkimusdatasta omat arkistointikopiot

Tutkijoiden tallennettavaksi antamat sähköiset tutkimusaineistot eivät siirry sellaisenaan arkistoon, vaan ne vaativat paljon muokkausta. Jokaisesta aineistosta tehdään Tietoarkistossa uusi versio arkistointia ja jatkokäyttöä varten. Prosessiin kuuluu erityisesti metadatatietojen täydentäminen, koska aineistojen sujuva käsittely operatiivisissa järjestelmissä edellyttää metadatan samanmuotoisuutta.

—Arkiston ensimmäisenä vuonna valitsimme XML-merkintäkielen metatietojen tallentamiseen, sen avulla tehdään kuvailu aineiston muuttujista ja muista kentistä, Heinonen kertoo.

Kun data on tallennettu, sitä pystytään siirtämään järjestelmästä toiseen operatiivisen järjestelmän puitteissa. Tietoarkiston hallintaliittymässä aineistot ohjataan erilaisten sovellusten käyttöön sekä palveluportaali Ailaan, joka on Tietoarkiston asiakasliittymä.

—Kun tutkimusdata siirretään Ailaan ja verkon kautta jatkokäyttöön, jokaisessa vaiheessa on käytössä jokin meidän omana työnämme kehitetty tietojärjestelmä, kertoo Heinonen.

Datan siirto automatisoituu

Uusin sovellus on syksyllä 2018 käyttöön otettu Ailan palvelu, jonka avulla aineiston arkistoija voi turvallisesti siirtää datan verkon yli Tietoarkistoon.

—Perusprosessi on pysynyt samana, mutta järjestelmä on pikkuhiljaa kasvanut ja tietenkin tietoa tulee jatkuvasti valtavasti lisää. Uusia tietojärjestelmiä on otettu käyttöön ja sisäisiä hallintaprosesseja on automatisoitu.

"Kun tutkimusdata siirretään Ailaan ja verkon kautta jatkokäyttöön, jokaisessa vaiheessa on käytössä jokin meidän omana työnämme kehitetty tietojärjestelmä."

Operatiivinen tietokanta mahdollistaa muun muassa sen, että Tietoarkisto toimii FAIR-periaatteen mukaisesti, eli että palvelut ja aineistot ovat helposti löydettäviä, saavutettavia, yhteentoimivia ja jatkokäytettäviä. Suomalaisten tutkimusaineistojen pitkäaikaissäilytyksestä on vuoden 2017 loppupuolelta lähtien huolehtinut opetus- ja kulttuuriministeriön alainen Kansallinen digitaalinen kirjasto, KDK. Sen PAS-palveluun kirjastojen, arkistojen ja museoiden sähköiset aineistot voidaan toimittaa pitkäaikaissäilytykseen, jonka aikajänne on satoja vuosia.

Tietoarkiston aineistot siirtyvät tätä nykyä PAS-palveluun puoliautomaattisesti, vielä tarvitaan ihminen valitsemaan siirrettävä tieto. Mutta Heinonen lupaa uudistusta tähänkin toimintoon.

—Ennen pitkää siirto muuttuu kokonaan automaattiseksi.

Kommunikointia koneiden kanssa ja puhetta ihmisille

Matti Heinonen kuvaa vastuullaan olevaa Tietoarkiston teknistä toimintaympäristöä henkilöintensiiviseksi resurssiksi, sillä vain pieni osa toiminnan kustannuksista on koneita. Työntekijöiden tietopääoma pitää toiminnan pystyssä ja mahdollistaa kehitystyön, joten ammattiosaajien kirjon täytyy olla riittävän laaja. It-puolella työskentelee reilu kolmannes Tietoarkiston työntekijöistä.

—Työntekijöistä osa puhuu koneille, osa ihmisille. Esimerkiksi PAS-työtä tekevä kommunikoi koneiden kanssa, kun taas Ailan kehittäjä puhuu ihmisille, Heinonen kärjistää ja korostaa, että eri työntekijäryhmien yhteistyö on tärkeää, toimintojen pyörittämiseen tarvitaan tiivistä vuoropuhelua ja ryhmätyötä.

Järjestelmäsuunnittelijat hoitavat arkipäivän it-toimintojen sujumisen. He myös vastaavat siitä, että silloin kun käytetään valmiita ohjelmistoja, niistä muokataan Tietoarkisto-versiot, jotka integroidaan toimiviksi muun järjestelmän kanssa.

Hyödyllistä softaa jaetaan muillekin

Sovelluskehittäjät puolestaan luovat Tietoarkistolle uusia ohjelmia.

—Omien sovellusten ja ohjelmien kehittäminen on oikeastaan ainut mahdollisuus, koska tarpeet ovat ainutlaatuisia eikä niihin ole sopivaa kaupallista tarjontaa. Tulisi paljon kalliimmaksi ottaa uusia järjestelmiä käyttöön ulkopuolisen tahon kanssa, ja se olisi myös paljon jäykempi työskentelytapa.

Tietojärjestelmien pohjana ovat open source -ohjelmistot, ja toiminta tapahtuu Linux-ympäristössä. Julkisella rahoituksella toimivalle, maksuttomia palveluja tarjoavalle organisaatiolle se on kustannussyistä ainoa mahdollinen toimintatapa.

—Open source -pohjalle kehitetylle softalle on tärkeää luoda käytön mahdollistava lisenssi. Tarjoamme jakoon vain sellaista softaa, jolle voi näkemyksemme mukaan olla hyödyllistä käyttöä joissakin muissa yhteyksissä.

Parhaana keinona pysyä mukana nopeasti kehittyvällä alalla Matti Heinonen pitää työntekijöiden jatkokoulutusta ja itseopiskelua, johon kuuluvat myös alan kansainväliset konferenssit ja kontaktiverkostojen ylläpitäminen. Merkittävä etu Tietoarkistolle on Tampereen yliopiston läheisyys.

—Sujahdan silloin tällöin kiinnostaville luennoille takarivin kuunteluoppilaaksi, Heinonen paljastaa.

—Lisäksi opiskelijoiden harjoitteluprojektit ovat Tietoarkistolle valtavan tärkeitä, niiden kautta saamme erilaisia näkemyksiä asioista. It-alalle on ominaista yhteistyö ja tiedon avoin jakaminen.

Kansainvälinen yhteistyö

Tietoarkisto on heti alusta alkaen pitänyt yhteyttä eurooppalaisiin kollegoihin ja ollut hyvin aktiivinen erilaisissa CESSDAn kehityshankkeissa. Ennen CESSDAn ERICvaihetta yhteistyötä muiden maiden tietoarkistojen kanssa Heinonen kuvaa vertaistukitoiminnaksi.

—Kaikki käyttivät samaa perusmetatietomallia, jonka ylläpitämisessä ei ollut kovia vaatimuksia.

ERIC-vaiheessa CESSDAn vaatimustaso on noussut ja yhteistyön muodot ovat systematisoituneet. Kansainvälisen yhteistyön sujuminen halutaan varmistaa yhteisten työkalujen kehittämisellä. Esimerkiksi uusi CESSDA-luettelo verkossa mahdollistaa tutkimusdatan leviämisen laajaan kansainväliseen käyttöön.

—Tietoarkisto on omalta osaltaan voinut valmistautua hyvin tulevaan yhteistyöhön, nyt voimme auttaa alkuvaiheessa olevia pieniä tietoarkistoja mukaanpääsyssä, kertoo Matti Heinonen. Hän näkee tulevaisuudessa paljon hyvää.

—Kehitys jatkuu kohti entistä verkostoituneempaa yhteistyötä, jossa palveluja integroidaan toimimaan paremmin keskenään. Koneet juttelevat keskenään eikä perustoimintoihin tarvita niin paljon ihmistyötä.

Teksti ja kuva: Eija Savolainen

Artikkeli julkaistiin ensimmäisen kerran Tietoarkisto-lehden numerossa 1/2019.