Rajoja ylittävät työkalut ja palvelut (C-BoTS): Tietoarkiston kansallinen datainfrastruktuuri 2024
Hankkeella Tietoarkisto vastaa toimintaympäristönsä muutospaineisiin sekä asiakkaiden ja yhteistyökumppaneiden esittämiin toiveisiin. Avoimen tieteen periaatteiden tukeminen on hankkeen keskeisiä tavoitteita. Hankkeen lyhenne C-BoTS muodostuu sanoista Crossing Boundaries with Tools and Services.
Hankkeessa automatisoidaan Tietoarkiston palveluiden käytön raportointia, tutkitaan olemassa olevien anonymisointia avustavien ohjelmistojen soveltuvuutta Tietoarkiston käyttöön ja kehitetään työkaluja kvalitatiivisen tekstiaineiston hallintaan. Hanke sisältää lisäksi kansainvälisesti vertailevaan tutkimukseen keskittyvän työpaketin.
Hanke koostuu kokonaisuudessaan kuudesta toisiaan täydentävästä työpaketista:
- Näkyvyyden ja vaikuttavuuden kehittäminen
- Tietoarkiston palveluarkkitehtuurin uudistaminen
- Hakumahdollisuuksien tehostaminen koneoppimisen avulla
- Anonymisoinnin apuvälineiden arviointi
- Kvalitatiivisten aineistojen hallintatyökalun päivitys
- Vertailevan tutkimuksen palvelut
Hankkeen työpaketit tukevat kansallisella tutkimusinfrastruktuurien tiekartalla esitettyjä Tietoarkiston tavoitteita sekä Tietoarkiston strategiasuunnitelmaa, joka korostaa asiantuntevaa palvelua, yhteistyötä ja vastuullista avointa tiedettä.
Hanke saa rahoituksensa Suomen Akatemian FIRI 2018 Tutkimusinfrastruktuurit -hausta. Tietoarkiston saaman rahoituksen taustalla on voimassa oleva tutkimuksen infrastruktuurien tiekartta, joka käsittää Tietoarkiston valtakunnallisen palvelutehtävän sekä toimimisen palveluntuottajana yhteiskuntatieteellisen alan CESSDA ERIC -tutkimusinfrastruktuurissa. Tämä hanke keskittyy kotimaisen palvelun kehittämiseen. Rahoituskausi on 1.1.2019–31.12.2024. Hankkeen toteuttamiseen myönnettiin vuoden mittainen pidennys.
Näkyvyyden ja vaikuttavuuden kehittäminen
Tietoarkisto laajentaa käyttäjäkuntaansa sekä parantaa näkyvyyttään ja vaikuttavuuttaan järjestämällä käyttäjille koulutuksia ja seminaareja sekä tekemällä yhteistyötä kansallisten ja kansainvälisten tutkimusinfrastruktuurien ja muiden sidosryhmien kanssa. Vuoropuhelua nykyisten ja potentiaalisten käyttäjien kanssa kehitetään käyttäjien tarpeita kartoittavilla kyselyillä. Työpaketin tavoitteena on myös parantaa palveluiden käytettävyyttä sekä mukauttaa Tietoarkiston verkkosivut ja palvelut vuonna 2019 voimaan astuneen saavutettavuusdirektiivin asettamiin vaatimuksiin.
Tietoarkiston palveluarkkitehtuurin uudistaminen
Jaamme palveluarkkitehtuurimme pienempiin osiin kokonaisuudeksi, joka mahdollistaa ulkopuolisten palvelujen ketterämmän hyödyntämisen. Uuden arkkitehtuurin myötä helpotamme myös pääsyä Tietoarkiston palveluihin ulkopuolelta erilaisten rajapintojen kautta. Työpakettiin kuuluu myös raportoinnin automatisoinnin kehittäminen: aineistoja arkistoivien tutkijoiden ja heidän taustaorganisaatioidensa näkyvyyttä parannetaan tarjoamalla ajantasaista tietoa arkistoiduista aineistoista ja tilastoja niiden käytöstä.
Hakumahdollisuuksien tehostaminen koneoppimisen avulla
Rakennamme koneoppimista hyödyntävän käyttöliittymän, jonka avulla voimme tuottaa ja ylläpitää samankaltaisia muuttujia sisältäviä ryhmiä sekä käyttöliittymän, jonka avulla asiakkaamme pystyvät hakemaan muuttujia ja tutkimusaineistoja. Tampereen yliopiston signaalinkäsittelyn laboratorio tekoälyosaamisineen on tässä työpaketissa merkittävä kumppani.
Anonymisoinnin apuvälineiden arviointi
C-BoTS pyrkii helpottamaan anonymisointia arvioimalla olemassa olevia apuvälineitä kvalitatiivisten ja kvantitatiivisten aineistojen anonymisointiin. Samalla kehitämme datan anonymisoinnin prosessiamme ja tuotamme ohjeistusta tutkijoille.
Kvalitatiivisten aineistojen hallintatyökalun päivitys
Päivitämme hankkeessa myös lähes kymmenen vuotta sitten julkaisemamme Kvalikirstu-ohjelmiston, joka on tehty helpottamaan kvalitatiivisen tekstimuotoisen aineiston arkistointia ja jatkokäyttöä. Uusi Kvalikirstu tuottaa nykyisiä pitkäaikaissäilytyksen vaatimuksia vastaavaa dataa ja tarjoaa jatkokäyttäjille helppokäyttöisen suomen- ja englanninkielisen käyttöliittymän. Se tukee vanhaa Kvalikirstua useampaa tiedostotyyppiä ja taustamuuttujien automaattista luomista.
Vertailevan tutkimuksen palvelut
C-BoTS-hankkeeseen kuuluu myös vertailevan tutkimuksen työpaketti, joka tukee muun muassa yhteistyötä Suomen ihmistieteiden ERICien kanssa ja osallistumista kahteen kansainvälisesti merkittävään vertailevaan aineistosarjaan: International Social Survey Programme- ja European Values Study -tutkimukseen.