SPSS Portable -tiedostojen avaaminen R:llä

R (Avautuu uuteen välilehteen) on ilmainen tilastolliseen laskentaan ja tilastografiikan tuottamiseen suunniteltu ohjelmistoympäristö. Tässä ohjeessa kuvataan, kuinka Ailasta ladattu Tietoarkiston välittämä kvantitatiivinen datatiedosto avataan R-ohjelmassa. Ohjeessa käytetyt esimerkkipolut (kuten 'D:/R_lib') tulee käyttäjän vaihtaa oman koneensa asetuksia vastaaviksi.

Portable-tiedostojen (*.por) avaamiseksi tarvitaan R-paketti memisc, jonka asentaminen onnistuu esim. RGui:n valikosta Packages → Install Package(s) tai antamalla R:n komentorivillä komento

install.packages('memisc') .

Asennuksen jälkeen paketti otetaan R-sessiossa käyttöön komennolla library('memisc'). Asennushakemiston voi halutessaan valita myös manuaalisesti käyttämällä komentoa

install.packages('memisc', lib='D:/R_lib') ,

jolloin se ladataan käyttöön komennolla

library('memisc', lib.loc='D:/R_lib') .

Memiscin lataamisen jälkeen Portable-muotoinen datatiedosto voidaan avata syöttämällä

ds <- as.data.set(spss.portable.file('D:/data.por')) .

Komento luo objektin ds, jonka tietotyyppi data set. Aineiston yksittäisten muuttujien tietotyyppinä on tällöin item, joka sisältää sekä muuttujan arvot että arvojen selitteet. Selitteitä vastaavat numeeriset arvot voi tarkastaa komennolla codebook(ds$$q1), joka näyttää muuttujan q1 frekvenssit. Vastaavasti komento codebook(ds) antaa frekvenssitaulukot kaikista muuttujista.

Numeeriset arvot saa tallennettua erilliseksi muuttujaksi komennolla

q1 <- as.numeric(ds$$q1) .

Aineisto voidaan myös muuttaa yleisemmin käytettyyn data frame -muotoon komennolla

df <- as.data.frame(ds) .

Tällöin kuitenkin item-muotoiset muuttujat muunnetaan factor-muotoon. Muunnos säilyttää arvojen selitteet mutta muuttaa alkuperäisten numeeristen arvojen tilalle indeksoinnin 1, 2, ..., n.