Ristiintaulukointi - SPSS-harjoitus 2

Jos olet ensimmäistä kertaa aloittamassa SPSS-harjoitusta, on ennen varsinaisen harjoituksen tekemistä syytä tutustua opiskeluohjeisiin.

Voit tehdä harjoituksen oheisen videon avulla, jossa käytetään European Social Survey 2012 -kyselyn Suomen aineistoa.

Voit myös tehdä harjoituksen seuraamalla alla olevia ohjeita, joissa käytetään havaintoaineistona European Values Study 2017 -tutkimuksen Suomen osa-aineistoa, osaEVS.

Havaintoaineiston hakemisesta SPSS-ohjelmaan on erilliset ohjeet.

Kolmiulotteinen ristiintaulukko Ankkurilinkki ikoni

Ristiintaulukoinnin harjoituksessa 1 tarkasteltiin naisten ja miesten välisiä eroja poliittisessa kiinnostuksessa. Naisten ja miesten välisessä poliittisessa kiinnostuksessa havaittiin tilastollisesti erittäin merkitsevä ero (p<0,001). Miehet olivat naisia kiinnostuneempia politiikasta.

Seuraavaksi yritetään selittää tarkasteltavia näkemyseroja vielä paremmin uuden ryhmittelevän muuttujan avulla. Siirrytään tarkastelemaan kolmiulotteisen ristiintaulukon avulla poliittista kiinnostusta sukupuolen lisäksi ikäryhmissä (alle 35-vuotiaat, 35–59-vuotiaat sekä vähintään 60-vuotiaat).

Tarvittavat muuttujat ovat:

q63 Sukupuoli
q29 Kuinka kiinnostunut olet politiikasta? ja
ikaLK, joka on laskettu aineistoon syntymävuosimuuttujasta (ks. muuttujamuunnosharjoitus 2)

Ristiintaulukointia varten kaikista muuttujista kannattaa määritellä luokat "en osaa sanoa" ja "ei vastausta" (arvot 8 ja 9) puuttuviksi tiedoiksi.

Ristiintaulukoinnin ikkuna avautuu komennolla Analyze - Descriptive Statistics - Crosstabs...

Crosstabs-valinta

Crosstabs-taulun avauduttua klikkaa ensimmäiseksi Reset-painiketta, jolloin Crosstabs-toiminnon mahdolliset aikaisemmat määritykset häviävät.

Kolmiulotteista ristiintaulukkoa varten tehtävät määritykset eroavat hieman edellisestä esimerkistä. Rivi- ja sarakemuuttujien määrittämisen lisäksi tulee määritellä ne luokat, joissa rivi- ja sarakemuuttujien yhteyksiä tutkitaan. Tämä tehdään Layer-valikon avulla.

Lisäksi voidaan tehdä samoja testejä ja solumäärityksiä kuin kaksiulotteisillekin ristiintaulukoille (ks. harjoitus 1).


Kolmiulotteisessa ristiintaulukossa rivi- ja sarakemuuttujat kannattaa järjestää hieman eri tavalla kuin tavallisessa ristiintaulukossa, sillä SPSS järjestää automaattisesti Layer-valikkoon valittavan muuttujan riveille. Molemmat syymuuttujat kannattaa esittää samalla puolella taulukkoa, joten toinen myös selittävä muuttuja kannattaa valita rivimuuttujaksi.

Mihin laatikoihin laittaisit käytettävät kolme muuttujaa?


Valitse muuttujaluettelosta hiirellä klikkaamalla sukupuolimuuttuja

q63 Sukupuoli

ja siirrä se nuolen avulla Row(s): -laatikkoon.

Etsi poliittista kiinnostusta tiedusteleva muuttuja q29 ja siirrä se Column(s): -laatikkoon.

Etsi ikäluokkamuuttuja ikaLK, ja siirrä se Layer 1 of 1 -laatikkoon.

Crosstabs-ikkuna

Kuten kahteen ensimmäiseenkin laatikkoon, myös Layer-laatikkoon voidaan siirtää useita muuttujia, jolloin ohjelma muodostaa kaikki mahdolliset annettujen muuttujien väliset ristiintaulukkokombinaatiot.

Layer-otsikon alta voi myös klikata Next-kohtaa, jolloin pääsee määrittämään uuden/uusia rivimuuttujia, jotka ryhmittelevät havaintoja. Tämän käyttöä ei kuitenkaan suositella, sillä jo kolmiulotteinen ristiintaulukko on usein raskas tulkittava ja solufrekvenssit saattavat jäädä liian alhaisiksi.

Määrittele ristiintaulukkoon riviprosentit vielä ennen OK:ta ja khii toiseen -testin määritystä:

Klikkaa hiirellä Cells... -painiketta, jolloin ristiintaulukon soluihin viittaavat määritykset avautuvat:

Crosstabs: Cell Display-ikkuna

Kuten aikaisemmassa harjoituksessa, valitaan näytettäväksi havaitut solufrekvenssit (Counts - Observed). Koska tällä kertaa halutaan prosentit riveillä olevien syymuuttujien eli sukupuolen ja ikäluokan mukaan, Percentages-laatikosta valitaan Row.

Muut mahdolliset solumääritykset on esitelty edellisessä tehtävässä (harjoitus 1).

Hyväksy valitsemasi solumääritykset Continue-painikkeella.


Siirry seuraavaksi määrittämään khiin neliön testi ( chi2 \( x^2 \) -testi ) valitsemalla Statistics... -painike.

Valitse Crosstabs: Statistics -näkymän vasemmasta yläreunasta Chi-square.

Crosstabs: Statistics-ikkuna

Siirry Continue-painikkeella takaisin Crosstabs-tauluun, ja valitse lopuksi OK.


Tutki ensin ristiintaulukkoa. Saitko samanlaisen?

Esimerkin mukainen ristiintaulukko

Elleivät lukuarvot ole samoja, tarkista, onko sarakemuuttuja oikein määritelty muuttujan q29 pohjalta. Mieti myös, oletko käyttänyt edellä esim. Select Cases tai Split file -toimintoa, joka olisi jäänyt päälle.

Solujen koot ovat todennäköisesti erilaiset omassa taulukossasi, sillä näitä muokattiin malliesimerkkiä tehdessä tilan säästämiseksi.


Huomaa, että käsittelyssä on kaksi itsenäistä ristiintaulukkoa, jotka on saatu jakamalla aineisto vastaajan ikäluokan mukaan. Tämän tarkastelun pohjalta ei siis voi tarkastella kaikkien vastaajien poliittista kiinnostusta.

Muuten taulukon tulkinta on hyvin samankaltaista kuin normaalin ristiintaulukon. Taulukosta voi tehdä esimerkiksi seuraavat päätelmät:

Reunajakaumat:

  • Aineistossa 229 vastaajaa kuuluu alle 35-vuotiaiden ryhmään, 35–59-vuotiaiden ryhmässä on 393 vastaajaa ja 60-vuotiaita tai vanhempia on 538.
  • Kaikkien vastaajien sukupuolijakaumaa ei voi lukea suoraan taulukosta; naisten ja miesten lukumäärät voi kylläkin katsoa Total-sarakkeesta (607 ja 553).
  • Alle 35-vuotiaista 94 (= 41 %) on erittäin tai melko kiinnostuneita politiikasta, 35–59-vuotiaista 188 (= 47,9 %) ja 60 vuotta täyttäneistä 296 (55 %)

Ehdolliset jakaumat eli naisten ja miesten jakaumat:

  • Alle 35-vuotiaista naisista 65,9 % ei ole kovin tai ollenkaan kiinnostunut politiikasta, kun taas miehistä 51 % on tätä mieltä.
  • 35–59-vuotiaiden kohdalla sukupuolten välillä eivät ole aivan yhtä suuret; tässä joukossa naisista 58,7 % ja miehistä 45 % ei ole kovin tai lainkaan kiinnostunut politiikasta.
  • 60 vuotta täyttäneiden osalta vastaavat luvut ovat naisilla 51 % ja miehillä 38,4 %.

Kuten harjoituksen alussa mainittiin, tiedettiin jo, että miehet ovat naisia kiinnostuneempia politiikasta. Tulkinnan kannalta mielenkiinnon kohteena ovat nyt "uloimman tason" eli tässä ikäluokan osoittamat erot ehdollisiin jakaumiin.

Tiivistetty tulkinta ristiintaulukosta: Poliittinen kiinnostus on kaikissa ikäryhmissä vähäisempää naisilla kuin miehillä. Nuorimpien naisten joukossa poliittinen kiinnostus on kaikkein vähäisintä. Vanhemmissa ikäryhmissä erot poliittisessa kiinnostuksessa eivät ole aivan yhtä suuria. Mikä voisi selittää tätä?


Kun olet perehtynyt ristiintaulukkoon, siirry khiin neliön testituloksiin (Khii toiseen \( x^2 \)-testiin ).

Esimerkin mukainen khii neliön testi

Kuten aina khiin neliön testin ( Khii toiseen \( x^2 \) -testin) kohdalla, tulee ensimmäisenä tarkistaa, että testin oletukset ovat kunnossa. Erityisesti moniluokkaisten ristiintaulukoiden kohdalla odotetut solufrekvenssit jäävät helposti liian pieniksi.

Ovatko Khii toiseen \( x^2 \)-testin oletukset kunnossa?

Taulukossa yhdenkään solun odotettu frekvenssi ei ole alle viiden (sallittu maksimi 20 % kaikista soluista), ja myös pienimmät odotetut frekvenssit ovat monikymmenkertaisesti yli sallitun minimiarvon 1. Testin esittämä tulos on siis validi.

Pearsonin khiin neliön testiin (Khii toiseen \( x^2 \)-testiin) liittyvä p-arvo on alle 35-vuotiaiden kohdalla 0,069, 35–59-vuotiaiden kohdalla 0,007 ja 60 vuotta täyttäneiden kohdalla 0,011. Tämä tukee osaltaan päätelmää siitä, naisten ja miesten välillä on eroja poliittisen kiinnostuksen suhteen, mutta nämä erot ovat tilastollisesti merkitseviä vain 35–59-vuotiaiden ja 60 vuotta täyttäneiden osalta.

Alle 35-vuotiaiden naisten ja miesten välillä oli selviä eroja poliittisessa kiinnostuksessa, mutta jos eroja pidettäisiin merkitsevinä, olisi kuitenkin 6,9 % (=100*0,069) todennäköisyys, että päätelmä olisi väärä. Tämä ylittää minimiriskitasona pidetyn 5 %.


Nyt voit tehdä toisenlaisen, itse valitsemasi ristiintaulukon ja kerrata oppimaasi:

Valitse Analyze - Descriptive Statistics - Crosstabs... tai voit käyttää Dialog Recall -pikakuvaketta Dialog Recall-pikakuvake klikkaamalla sitä kerran ja valitsemalla ylimmäisenä olevan Crosstabs-toiminnon.

Crosstabs-toiminnon avauduttua voit tyhjentää kaikki aiemmin annetut määritykset painamalla Reset.