Teksti: Arttu Ylä-Outinen

Kuvailujen haravointirajapinta - Kuha
vie tietoarkiston kuvailutiedot Finnaan

Syyskuun alussa tietoarkiston aineistojen kuvailutiedot tulivat näkyviin Finna-hakupalvelussa, joka kokoaa yhteen Suomen arkistojen, kirjastojen ja museoiden aineistot. Metatiedot siirretään käyttäen OAI-PMH-protokollaa. Siirtoa varten tietoarkistossa toteutettiin oma OAI-PMH-ohjelmisto: kuvailujen haravointirajapinta, Kuha.

Open Archives Initiative - Protocol for Metadata Harvesting eli OAI-PMH on käytäntö, jolla arkistot tarjoavat arkistoitujen aineistojen metatietoja palveluntarjoajien kerättäväksi. Arkistoilta "haravoitujen" metatietojen avulla palveluntarjoajat tuottavat loppukäyttäjille erilaisia palveluita, kuten hakukoneita tai luetteloita.

Protokollan nykyinen versio 2.0 julkaistiin vuonna 2002. Vuosien varrella se on vakiinnuttanut asemansa suurten metatietomäärien välityksessä ja on edelleen laajasti käytössä. Nyt myös Yhteiskuntatieteellinen tietoarkisto tarjoaa metatietonsa OAI-PMH:lla.

Tietoarkiston ohjelmisto

Tietoarkiston omatekoisen OAI-PMH-palvelimen, kuvailujen haravointirajapinnan Kuhan, kehittäminen alkoi helmikuussa 2014. Helteisestä kesästä huolimatta ohjelmiston kehitys ja yhteensovittaminen Finnan kanssa etenivät ripeästi. Ohjelmisto valmistui elokuussa ja aineistojen metatiedot saatiin näkyville Finnaan syyskuun alussa. Myös itse palvelinohjelmisto päätettiin julkaista. Se on saatavilla GitHubissa avoimen lähdekoodin sovelluksena.

Metatiedon välitysmuodot

OAI-PMH-palvelimien on mahdollista tarjota metatietoa useissa eri formaateissa. Tietoarkiston OAI-PMH-palvelussa tuettaviksi formaateiksi valittiin Dublin Core ja EAD. Palvelinsovellus Kuha generoi nämä ohjelmallisesti tietoarkiston DDI-formaatissa olevista aineistokuvailuista.

kuvituskuva

Metatiedot siirretään Finnaan käyttäen OAI-PMH-protokollaa. Siirtoa varten toteutimme oman kuvailujen haravointirajapinnan, Kuhan.

Dublin Core on yksinkertainen, vain 15 tietokenttää määrittelevä formaatti. Se on kuitenkin määritelty pakolliseksi formaatiksi OAI-PMH:ssa. Näin taataan, että arkistoilla ja palveluntarjoajilla on ainakin yksi formaatti, jota molemmat ymmärtävät.

Toista tuotettua formaattia, EAD:ta, käytetään aineistokuvailujen välittämisessä Finna-hakupalveluun. EAD:ssä metatiedot saa esitettyä yksityiskohtaisemmin kuin Dublin Corella. Aineistot pystytään muun muassa esittämään hierarkkisesti aineistosarjoihin lajiteltuna.

Näkyvyyttä aineistoille

Tietoarkiston OAI-PMH-palvelun päätarkoitus on metatietojen välittäminen Finnaan. Se yhdistää samaan hakuun Suomen arkistot, kirjastot ja museot, joten mielenkiintoiseen tutkimusartikkeliin törmäävä käyttäjä voi löytää samasta paikasta myös siinä käytetyn aineiston. Näin tietoarkiston aarteet avautuvat entistä laajemmalle käyttäjäkunnalle. Tietoarkiston aineistojen myötä Finnaan lisättiin kokonaan uusi aineistotyyppi: tutkimusdata.

Muita mahdollisia käyttäjiä voisivat tulevaisuudessa olla esimerkiksi Avoin tiede ja tutkimus -hankkeen Kata-metadatakatalogi ja Euroopan laajuinen CESSDAn aineistoluettelo. Tietoarkiston OAI-PMH-palvelun käyttöä ei suinkaan ole rajoitettu edellä mainittuihin tahoihin, vaan kuka tahansa voi haravoida kuvailutiedot omaa palveluaan varten.

Lisätietoja