Yhteiskuntatieteellisen tietoarkiston arkistonmuodostussuunnitelma Liite 6: Formaattitaulukko

Taulukossa on esitetty Tietoarkistossa käytettävät tiedostoformaatit eri aineistotyypeille.
Luotu alunperin 5.10.2015, päivitetty viimeksi 23.11.2022.

  • Hyväksyttävä sisäänottoformaatti tarkoittaa tiedostomuotoja, joita Tietoarkisto ottaa vastaan.
  • PAS (FSD) tarkoittaa Tietoarkistoon tallennetun tiedoston pitkäaikaissäilytyksen formaattia.
  • Jakelu tutkijalle tarkoittaa tiedostomuotoja, joita välitetään Ailan kautta.

Tiedostomuotojen jaottelu aineistotyypin mukaan ei ole tiukka, vaan suositeltuja tiedostomuotoja voi käyttää kaikille aineistotyypeille tarpeen mukaan.

Tietoarkisto suosittelee tiedostojen konvertointia suositeltuihin sisäänottoformaatteihin ennen niiden lähettämistä. Muissa kuin PAS- tai jakeluformaateissa lähetetyt tiedostot muunnetaan arkistointiprosessin yhteydessä hyväksyttyihin tiedostoformaatteihin. Muussa formaatissa olevaa alkuperäistä tiedostoa ei säilytetä arkistoinnin valmistuttua.

Aineistotyypit ja tiedostomuodot Tietoarkistossa

Aineiston tyyppi Hyväksyttävä sisäänottoformaatti PAS (FSD) Jakelu tutkijalle Huom.
Havaintomatriisi Ei rajoitettu.
Suositus: SPSS SAV tai muiden tilasto-ohjelmien tiedostot (esim. SAS, Stata, Excel), CSV tai SPSS Portable POR
CSV, POR (SPSS Portable), (ODS) SPSS SAV, CSV, (POR (SPSS Portable), ODS) Uudet datatiedostot toimitetaan SAV- ja CSV-tiedostoina. Vanhempien aineistojen por-tiedostot muunnetaan sav-muotoon myöhemmin.
OpenDocument-tiedostomuotoa (od*) käytetään säilytys- ja jakeluformaattina, jos datassa on muotoiluja, joiden säilyminen on ymmärrettävuuden kannalta oleellista.
Tietoarkisto tiedostaa SPSS-ohjelman rajoitukset ja seuraa alan kehitystä ja muiden arkistojen ratkaisuja formaattien valinnoissa.
Teksti, esim. haastattelulitteraatiot tai avokysymysten vastaukset Ei rajoitettu.
Suositus: puhdas teksti tai yleiset toimistoformaatit (esim. docx)
UTF-8 enkoodattu TXT tai CSV, xml, html/xhtml, od* UTF-8 enkoodattu TXT tai CSV, xml, html/xhtml, od* CSV-tiedostoissa voidaan käyttää muutakin kenttäerotinta kuin pilkkua (esim. tabulaattori).
Jos ymmärrettävyyden säilymiseksi aineiston muotoilu tai siihen liittyvät kuvat pitää säilyttää, suositus on PDF/A- tai OpenDocument-formaatin käyttö.
Humanististen aineistojen arkistointi voi edellyttää tiedostomuotojen uudelleenarviointia.
Sisäisen käsittelyprosessin dokumentaatio - UTF-8 enkoodattu TXT tai CSV, PDF/A, od* - Tiedostopääte asetetaan käytetyn ohjelmiston mukaan (esim. syntakseille .sps, python-ohjelmakoodille .py jne.)
Jos dokumentaatiossa on muotoiluja, jotka ymmärtämisen helpottamiseksi tulee säilyttää, käytetään PDF/A- tai OpenDocument-formaattia.
Kuva Ei rajoitettu
Suositus: JPEG, PNG, TIFF, SVG
JPEG, PNG, TIFF, (SVG, DNG) JPEG, PNG, (SVG) Poikkeustapauksissa myös DNG on PAS-kelpoinen. Jos Tietoarkisto tekee digitoinnin, PAS-formaatteja ovat TIFF tai DNG.
Tietoarkisto ottaa huomioon ajantasaiset digitointisuositukset.
SVG-formaattia käytetään vektorikuville. GIF-animaatiot konvertoidaan videoformaattiin tai puretaan yksittäisiksi PNG-kuviksi.
Digikamerojen RAW-formaatteja ei tavallisesti oteta vastaan. Tietoarkisto voi vastaanottaa kaikkia Adoben tiedostoja, mutta suosittelee avoimia formaatteja niiden sijaan.
Ääni (audio) Ei rajoitettu
Suositus: FLAC, WAV
FLAC, (MP3) FLAC, MP3 Äänitallenteiden formaattisuositusten kehitystä seurataan ja muutoksia tehdään, jos tarvetta.
MP3 käy PAS-formaattina vain, jos alkuperäinen vastaanotettu materiaali on MP3-formaatissa.
Video Ei rajoitettu
Suositus: MPEG-4 H.264
MPEG-4 H.264 (JPEG 2000) MPEG-4 H.264 Videon formaattisuositusten kehitystä seurataan ja muutoksia tehdään, jos tarvetta. Mahdollinen JPEG 2000 -sekvenssinä tallennettu tiedosto säilytetään ilman konversiota.
Videon pakkaustaso ratkaistaan tapauskohtaisesti. Arkistokopion ja käyttökopion formaatti, pakkaustaso ja resoluutio voivat poiketa toisistaan.
Paikkatieto Neuvotellaan tapauskohtaisesti Katsotaan tapauskohtaisesti Sama kuin PAS (FSD) -formaatti Mahdollisista dataan liittyvistä paikkatietoaineistoista neuvotellaan tapauskohtaisesti hyödyntäen kansallisen digitaalisen pitkäaikaissäilytys-ratkaisun formaattisuosituksia. GeoTIFF-tiedostot voidaan vastaanottaa ja säilyttää TIFF-tiedostoina.