LIMBER pyrkii murtamaan kieltenvälisiä esteitä
Maria Forsman 6.6.2000
Eurooppalaisten tietoarkistojen piirissä on aloitettu uusi EU:n rahoittama projekti, jonka
tavoitteena on monikielisen tiedonhaun ja -tallennuksen välineiden luominen Internetiin.
LIMBER (Language Independent Metadata Browsing of European Resources) on projekti,
jossa kehitellään monikielistä käyttöliittymää eurooppalaisten yhteiskuntatieteellisten
tietoarkistojen aineistojen löytämiseksi. Siinä ovat mukana Saksan, Kreikan, Ranskan,
Norjan ja Britannian tietoarkistot. Projektin edetessä tietoa välitetään myös muille
tietoarkistoille ja asiasta kiinnostuneille.
Tavoitteena tutkimusaineistojen löytyminen
Yhteiskuntatieteellisissä tietoarkistoissa on aineistoa, joka kiinnostaa eri
maissa työskenteleviä tutkijoita. LIMBER-projektissa kehitellään monikielisen tiedonhaun
välineitä, joiden tarkoituksena on auttaa käyttäjiä löytämään tarvitsemaansa aineistoa
paikasta ja kielestä riippumatta. Jos LIMBER-projektin tavoitteet toteutuvat, tutkijat voivat
lähivuosina tehdä hakuja tietoarkistojen yhteisestä NESSTAR-aineistotietokannasta
valitsemallaan kielellä.
LIMBER-projektin tavoitteiksi on asetettu
- Tutkia ja kehittää yhteiskuntatieteellisten tutkimusaineistojen
metadatamallia ja esitystapaa (XML ja RDF), tavoitteenaan aineistojen integrointi
toisiinsa sekä tietoarkistoissa että niiden välillä
;
- kehittää ja evaluoida monikielistä tesaurusta, jota voidaan käyttää
yhteiskuntatieteellisten tutkimusaineistojen indeksoinnissa ja tiedonhaussa;
- kehittää ja evaluoida tiedonhakuvälinettä, joka auttaa tiedonhakijaa hakulausekkeiden
muodostamisessa ja monikielistä tesaurusta hyväksikäyttäen mahdollistaa haut useilla kielillä
eri tietoarkistoista;
- kehittää ja evaluoida välineitä, jotka tukevat automaattista indeksointia käyttävien
tietokantojen rakentamista ja ylläpitoa
; sekä
- evaluoida XML -metadatapalvelinta, joka käyttää yhteiskuntatieteellisiä aineistoja ja
monikielistä tesaurusta varten tehtyä metadatamallia.
Monikielinen tesaurus
Monikielisen tesauruksen - ts. kontrolloidun asiasanaston -
laatimisen perustana on brittien tietoarkiston tesaurus HASSET
(Humanities and Social Science Electronic Thesaurus). HASSETin
suomentaminen on ollut esillä koko Yhteiskuntatieteellisen
tietoarkiston olemassa olon ajan. FSD käynnistääkin syksyllä 2000
hankkeen, jossa selvitellään mahdollisuuksia kääntää HASSET suomeksi
ja/tai liittyä tavalla tai toisella LIMBER-projektiin.
Monikielinen yhteiskuntatieteellinen tesaurus sisältää kuitenkin
monia ongelmia, joista on tärkeää keskustella. Ne eivät ole
ylitsepääsemättömiä, mutta ne on otettava huomioon. Yksi olennainen
seikka on maiden ja kulttuurien väliset erot. Ne voivat koskea
esimerkiksi koulutusjärjestelmää, yhteiskuntaluokkia tai
sosiaalipolitiikan käytäntöjä. Lisäksi alueelliset muutokset ja
ikäryhmät voivat aiheuttaa pohdittavaa. Sanojen monimerkityksisyys on
myös ongelmallista; esimerkiksi suomen kielen sana "tieto" voi
englannin kielessä olla "data", "information" tai "knowledge".
Tieteenteoreettiset ja metodologiset seikat voivat aiheuttaa
muutoksia terminologiassa. Esimerkiksi englanninkielisessä
tiedeyhteisössä otetaan käyttöön uusi sana, jonka sisällön suomalainen
sosiologi ymmärtää, mutta jolle ei vielä ole löytynyt tai vakiintunut
suomenkielistä vastinetta.
Maailmankieliä ja pieniä kieliä
Brittien tietoarkisto (UK DA) kokosi huhtikuussa
Essexiin 20 asiantuntijaa eri tietoarkistoista pohtimaan näitä ja muita monikieliseen
tesaurukseen, tiedonhakuun ja
sisällönkuvailuun liittyviä kysymyksiä. FSD:stä LIMBER Workshopiin osallistuivat Maria
Forsman ja Arja Tuuliniemi. Workshopissa luotiin
samalla uutta, yhteiskuntatieteellisen tiedon tallennuksen ja haun
eurooppalaista yhteistyöverkostoa.
Yhtenä tulevaisuuden visiona LIMBER Workshopissa nähtiin ELSST eli European Language Social
Science Thesaurus. Se olisi monikielinen väline paitsi tietoarkistojen aineistojen kuvailussa
ja haussa, myös laajemmin Internetissä olevan yhteiskuntatieteellisen aineiston
sisällönkuvailussa ja tiedonhaussa. Tesauruksen mahdollisuuksia pohdittaessa
mainittiin mm. eurooppalaisten virtuaalikirjastojen yhteinen EU-projekti
RENARDUS, johon myös Suomen virtuaalikirjasto osallistuu.
Kuva LIMBER-projekti
Sivun alkuun | Tietosuoja
|