FSD - EtusivuFSD neWWWs
OOO


 

Etusivulle

Numero 2 kesäkuu 2000

LIMBER pyrkii murtamaan kieltenvälisiä esteitä

Maria Forsman 6.6.2000

Eurooppalaisten tietoarkistojen piirissä on aloitettu uusi EU:n rahoittama projekti, jonka tavoitteena on monikielisen tiedonhaun ja -tallennuksen välineiden luominen Internetiin. LIMBER (Language Independent Metadata Browsing of European Resources) on projekti, jossa kehitellään monikielistä käyttöliittymää eurooppalaisten yhteiskuntatieteellisten tietoarkistojen aineistojen löytämiseksi. Siinä ovat mukana Saksan, Kreikan, Ranskan, Norjan ja Britannian tietoarkistot. Projektin edetessä tietoa välitetään myös muille tietoarkistoille ja asiasta kiinnostuneille.

Tavoitteena tutkimusaineistojen löytyminen

Yhteiskuntatieteellisissä tietoarkistoissa on aineistoa, joka kiinnostaa eri maissa työskenteleviä tutkijoita. LIMBER-projektissa kehitellään monikielisen tiedonhaun välineitä, joiden tarkoituksena on auttaa käyttäjiä löytämään tarvitsemaansa aineistoa paikasta ja kielestä riippumatta. Jos LIMBER-projektin tavoitteet toteutuvat, tutkijat voivat lähivuosina tehdä hakuja tietoarkistojen yhteisestä NESSTAR-aineistotietokannasta valitsemallaan kielellä.

LIMBER-projektin tavoitteiksi on asetettu

  • Tutkia ja kehittää yhteiskuntatieteellisten tutkimusaineistojen metadatamallia ja esitystapaa (XML ja RDF), tavoitteenaan aineistojen integrointi toisiinsa sekä tietoarkistoissa että niiden välillä ;
  • kehittää ja evaluoida monikielistä tesaurusta, jota voidaan käyttää yhteiskuntatieteellisten tutkimusaineistojen indeksoinnissa ja tiedonhaussa;
  • kehittää ja evaluoida tiedonhakuvälinettä, joka auttaa tiedonhakijaa hakulausekkeiden muodostamisessa ja monikielistä tesaurusta hyväksikäyttäen mahdollistaa haut useilla kielillä eri tietoarkistoista;
  • kehittää ja evaluoida välineitä, jotka tukevat automaattista indeksointia käyttävien tietokantojen rakentamista ja ylläpitoa ; sekä
  • evaluoida XML -metadatapalvelinta, joka käyttää yhteiskuntatieteellisiä aineistoja ja monikielistä tesaurusta varten tehtyä metadatamallia.

Monikielinen tesaurus

Monikielisen tesauruksen - ts. kontrolloidun asiasanaston - laatimisen perustana on brittien tietoarkiston tesaurus HASSET (Humanities and Social Science Electronic Thesaurus). HASSETin suomentaminen on ollut esillä koko Yhteiskuntatieteellisen tietoarkiston olemassa olon ajan. FSD käynnistääkin syksyllä 2000 hankkeen, jossa selvitellään mahdollisuuksia kääntää HASSET suomeksi ja/tai liittyä tavalla tai toisella LIMBER-projektiin.

Monikielinen yhteiskuntatieteellinen tesaurus sisältää kuitenkin monia ongelmia, joista on tärkeää keskustella. Ne eivät ole ylitsepääsemättömiä, mutta ne on otettava huomioon. Yksi olennainen seikka on maiden ja kulttuurien väliset erot. Ne voivat koskea esimerkiksi koulutusjärjestelmää, yhteiskuntaluokkia tai sosiaalipolitiikan käytäntöjä. Lisäksi alueelliset muutokset ja ikäryhmät voivat aiheuttaa pohdittavaa. Sanojen monimerkityksisyys on myös ongelmallista; esimerkiksi suomen kielen sana "tieto" voi englannin kielessä olla "data", "information" tai "knowledge".

Tieteenteoreettiset ja metodologiset seikat voivat aiheuttaa muutoksia terminologiassa. Esimerkiksi englanninkielisessä tiedeyhteisössä otetaan käyttöön uusi sana, jonka sisällön suomalainen sosiologi ymmärtää, mutta jolle ei vielä ole löytynyt tai vakiintunut suomenkielistä vastinetta.

Maailmankieliä ja pieniä kieliä

Brittien tietoarkisto (UK DA) kokosi huhtikuussa Essexiin 20 asiantuntijaa eri tietoarkistoista pohtimaan näitä ja muita monikieliseen tesaurukseen, tiedonhakuun ja sisällönkuvailuun liittyviä kysymyksiä. FSD:stä LIMBER Workshopiin osallistuivat Maria Forsman ja Arja Tuuliniemi. Workshopissa luotiin samalla uutta, yhteiskuntatieteellisen tiedon tallennuksen ja haun eurooppalaista yhteistyöverkostoa.

Yhtenä tulevaisuuden visiona LIMBER Workshopissa nähtiin ELSST eli European Language Social Science Thesaurus. Se olisi monikielinen väline paitsi tietoarkistojen aineistojen kuvailussa ja haussa, myös laajemmin Internetissä olevan yhteiskuntatieteellisen aineiston sisällönkuvailussa ja tiedonhaussa. Tesauruksen mahdollisuuksia pohdittaessa mainittiin mm. eurooppalaisten virtuaalikirjastojen yhteinen EU-projekti RENARDUS, johon myös Suomen virtuaalikirjasto osallistuu.

LIMBER

Kuva LIMBER-projekti

Sivun alkuun | Tietosuoja