Laatikko-jana - SPSS-harjoitus 1

Jos olet ensimmäistä kertaa aloittamassa SPSS-harjoitusta, on ennen varsinaisen harjoituksen tekemistä syytä tutustua opiskeluohjeisiin.

Esimerkkiaineistona on osa Suomessa vuonna 2017 kerätystä International Social Survey Programme -aineistosta, osaISSP. Harjoitus tehdään painotettua aineistoa käyttäen (painomuuttuja bv5, ks. aineiston painottaminen).

Havaintoaineiston hakemisesta SPSS-ohjelmaan on erilliset ohjeet.

Monen muuttujan vierekkäiset laatikko-jana -kuviot eli box plot -kuviot Ankkurilinkki ikoni

Verrataan tässä harjoituksessa laatikko-jana -esityksen avulla vastaajien kuukausituloja heidän kotitalouksiensa kuukausituloihin. Tällaisen laatikko-jana -kuvion laatiminen onnistuu Legacy Dialogs -valikosta Chart Builder -työkalua helpommin.

Valitse Graphs - Legacy Dialogs - Boxplot.... Nyt tehdään "yksinkertaiset" (Simple) laatikko-jana -kuviot kahdelle eri muuttujalle. Valitse siis Summaries of Separate variables. Hyväksy valintasi Define-painikkeella.

Boxplot-valikko

Siirrä Boxes Represent -laatikkoon muuttujaluettelosta muuttujat:

k54 'Kuinka suuret keskimäärin ovat omat kuukausitulosi veroja vähentämättä (=bruttotulot) mukaan lukien pääomatulot ja kaikki sosiaalietuudet? (euroa kuukaudessa)' ja
k55 'Kuinka suuret ovat keskimäärin kotitaloutesi yhteenlasketut kuukausitulot veroja vähentämättä (=bruttotulot) mukaan lukien pääomatulot ja kaikki sosiaalietuudet? (euroa kuukaudessa)'
Boxes Represent-laatikko

Options-määrityksissä ei tarvitse käydä, sillä puuttuvalla tiedolla ei ole merkitystä kahden erillisen muuttujan laatikko-jana -kuvioita tarkasteltaessa.

Hyväksy valinnat OK-painikkeella.

Saitko tämänkaltaisen kuvion? Miten tulkitset sitä?

Muokkaamaton laatikko-jana -kuvio
  • Kuvioista voi odotetusti nähdä, että kotitalouksien kuukausitulot ovat suurempia kuin vastaajien henkilökohtaiset tulot. Henkilökohtaisten tulojen mediaani on 2400 ja kotitalouksien 5000 euroa. Kotitalouksien tulojen vaihteluväli on selvästi suurempi ja jakaumassa enemmän hajontaa kuin henkilökohtaisten tulojen kohdalla.
  • Tämän kuvion avulla ei voi tarkastella näiden muuttujien välistä riippuvuutta, vaan tarkoituksena on vertailla niiden jakaumia.

Poikkeavat havainnot (ympyrät ja tähdet)

Poikkeava havainto (outlier) on sellainen muuttujan arvo, joka poikkeaa suuresti havaittujen arvojen valtaenemmistöstä. Poikkeavilla arvoilla voi olla merkittävästi vääristävä vaikutus käytettyihin tilastollisiin tunnuslukuihin. Keskiarvo on erityisen herkkä poikkeaville havainnoille. Jos poikkeavia havaintoja on paljon, kannattaa varmistaa, että ne eivät johdu esimerkiksi mittausvirheestä. Ohjelma merkitsee poikkeavia havaintoja (outlier) eri merkeillä (tässä ympyrä ja tähti). Merkki muuttuu sen mukaan, mitä suurempi poikkeama on. Tähdet merkitsevät huomattavia ja ympyrät vähemmän huomattavia poikkeamia. Luvut poikkeavien havaintojen vieressä ovat niiden rivien numeroita, joilla kyseiset havainnot ovat matriisissa. Niillä ei ole mitään informaatioarvoa, joten ne kannattaa poistaa.

Kaksoisklikkaa kuviota, jolloin pääset SPSS Chart Editor -ikkunaan muokkaamaan sitä.

Voit tehdä kuviosta vaikkapa tällaisen:

Muokattu laatikko-jana -kuvio

Laatikko-jana -kuvioiden tulkinnasta on kirjoitettu menetelmäosion kuvioita käsittelevässä tekstissä.