Tutkimusaineistojen julkisten kuvailutietojen lisenssiksi CC0

Tietoarkiston tutkimusaineistojen julkiset kuvailutiedot on 19.3.2026 alkaen lisensoitu CC0-lisenssillä. Lisenssimuutoksen myötä kuvailutiedot muodostavat avoimen ja laajan metadatakorpuksen, jota voi hyödyntää myös tekoälypohjaisessa käytössä.

Tutkimusaineistojen kuvailutiedot ovat siis nyt täysin vapaasti hyödynnettävissä. Aiemmin käytössä ollut CC BY 4.0 -lisenssi velvoitti käyttäjää mainitsemaan kuvailutietojen tekijän nimen ja alkuperäisen lähteen lisenssin vaatimalla tavalla. Tämä muodosti esteen muunmuassa monen kaupallisen tekoälysovelluksen käytölle. Lisenssimuutoksen myötä kuvailutiedot soveltuvat entistä monipuolisempiin käyttötarkoituksiin.

Hyvän tieteellisen käytännön mukaista on edelleen viitata alkuperäiseen lähteeseen, jos metatietoja käytetään esimerkiksi tutkimuksessa.

Kuvailutiedot sisältävät tällä hetkellä lähes 2 200 tutkimusaineiston perustiedot kuten tekijät, abstraktin ja otantamenetelmät suomeksi ja englanniksi. Lisäksi mukana on yli 420 000 muuttujan tiedot, mukaan lukien kysymystekstit.

CC0-lisensoidut kuvailutiedot ovat saatavilla monella eri tavalla ja useissa eri formaateissa.

  • Zip-paketeissa ja Ailan verkkosivujen kautta ladattavissa olevat DDI Codebook 2.5 -XML-tiedostot tarjoavat kattavimmat rakenteiset kuvaukset jokaisesta aineistosta. Ne sisältävät tutkimusaineiston perustiedot ja usein myös muuttujatason metatiedot.
  • Kuha2 OAI-PMH-rajapinta tarjoaa metatietoja DDI Codebook-, Dublin Core- ja EAD3-muodoissa.
  • FSD SKG-IF OpenAPI-rajapinta välittää tutkimusaineistojen perustietoja SKG-IF-määrittelyjen mukaisesti.

Lisenssimuutos toteutettiin osana FSD AIMS 2030 -hankkeen tekoälyyn keskittyvää työpakettia.