KvantiMOTV SPSS-opas

Ajankohtaista | MOTV-lista | Palaute

Menetelmäopetuksen tietovaranto - SPSS-opas
!

KvantiMOTV on päivitetty Kvantitatiivisen tutkimuksen verkkokäsikirjaksi.Katso päivitetyt SPSS-harjoitukset.

Frekvenssijakauma, keski- ja hajontaluvut - SPSS-harjoitukset 2 (tehtävät 1-3)

Jos olet ensimmäistä kertaa aloittamassa SPSS-harjoitusta MOTV-ympäristössä, on ennen varsinaisen harjoituksen tekemistä syytä tutustua opiskeluohjeisiin.

Näissä kolmessa harjoituksissa tarkastellaan eri mittaustason muuttujien jakaumia ja näiden kohdalla huomioonotettavia erityispiirteitä. Huomaa, että esimerkit on tehty toisiaan tukemaan; tehtävät kannattaa tehdä annetussa järjestyksessä, jottei mikään tärkeä seikka jäisi huomioimatta. Turhaa toistoa on pyritty välttämään niin ohjeistuksessa kuin tulkinnassakin. [ tehtävä 1 | tehtävä 2 | tehtävä 3 ]

Tässä harjoituksessa käytetään havaintoaineistona vuoden 2004 ISSP-tutkimuksen Suomen aineistoa, daF2039.
Havaintoaineiston hakemisesta SPSS-ohjelmaan on erilliset ohjeet.

Frekvenssijakauma, keski- ja hajontaluvut

» daF2039-aineisto | Harjoitusaineistot

Tehtävä 1

Tutkitaan vastaajien äänestysinnokkuutta kyselyhetkeä edeltäneissä vuoden 2003 eduskuntavaaleissa.

Tarkastellaan seuraavaa muuttujaa:

k21 Kävittekö äänestämässä viimeksi toimitetuissa eduskuntavaaleissa vuonna 2003?

Vastausvaihtoehtoina on 1=Kyllä, 2=Ei ja 3=Minulla ei ollut äänioikeutta.


Mikä on muuttujan mittaustaso?

Mittaustaso määrittää sen, millaisia ominaisuuksia (frekvenssit, keski- ja hajontaluvut) muuttujasta on mielekästä tutkia ja raportoida.

Tutkittavaksi valittu muuttuja k21 on luokitteluasteikollinen eli nominaalinen. Millaisia keski- ja hajontalukuja tällaisesta muuttujasta kannattaa tutkia?


Avaa SPSS:stä ikkuna, jonka avulla pääset katsomaan perustunnuslukuja komennolla Analyze - Descriptive Statistics - Frequencies...

Frequences-ylävalikko

Aluksi kannattaa klikata Reset -painiketta, jotta mahdolliset aikaisemmin tehdyt määritykset nollauntuvat.

Etsi sitten vasemmanpuoleisesta valikosta muuttuja k21, ja siirrä se nuolen avulla Variable(s)-laatikkoon.

Frequences-valikko

Klikkaa hiirellä Statistics-kohtaa. Täältä voit määrittää aikaisemmin miettimäsi keski- ja hajontaluvut.

Koska kyseessä on nominaalinen muuttuja, ainoa mielekäs keskiluku on moodi (Central Tendency - Mode), joten valitaan tämä. Hajontaluvuista ainut mahdollinen olisi variaatiosuhde, mutta tämä täytyy jättää käsin laskettavaksi.

Frekvenssit-statistics

Paina sitten Continue palataksesi päävalikkoon.


Valikossa on oletusarvoisesti valittuna Display frequency tables. Tämä kannattaa klikata pois vain siinä tapauksessa, että tarkastelun alla on sellainen jatkuva muuttuja, joka saa niin paljon eri arvoja, että jokaisen yksittäisen luvun esittäminen taulukossa ei ole enää mielekästä.

Charts-kohtaa painamalla pääset halutessasi valitsemaan muuttujan arvoja havainnollistavan graafisen esityksen.


Klikkaa sitten OK, ja siirry Outputiin tarkastelemaan tuloksia.

Ensin tutkitaan Statistics-taulukkoa. Saitko samanlaisen?

Statistics-taulukko

Tästä nähdään seuraavat asiat:

  • 1342 henkilöä vastasi kysymykseen, ja puuttuvia vastauksia on 12
  • Moodi eli tyyppiarvo on 1. Tämä tarkoittaa siis sitä, että suurin osa vastaajista äänesti edellisissä eduskuntavaaleissa

Puuttuvien vastausten määrä kannattaa aina tarkistaa jokaisesta muuttujasta; suuri vastauskato voi esimerkiksi kertoa tutkittavan asian epäonnistuneesta operationalisoinnista. Tällöin saatua tulosta ei voi pitää luotettavana.

Seuraavana näytöllä on frekvenssitaulukko.

Frekvenssi-taulukko

Tästä näemme esim. seuraavat asiat:

  • 991 henkilöä eli 73,2 % kaikista havainnoista tai 73,8 % kaikista kysymykseen vastanneista äänesti vuoden 2003 eduskuntavaaleissa
  • 94,6 % vastanneista oli tuolloin äänioikeutettuja

Kyseisissä vaaleissa Suomessa asuvien osalta äänestysprosentti oli Tilastokeskuksen mukaan 69,7 %. Jos ilman äänioikeutta olleet jätetään pois laskuista, on käsiteltävän aineiston vastaajien joukossa äänestysprosentti huomattavasti tätä korkeampi, 78,0 % (=100*(991/(991+279))). Mistä ero aineiston ja perusjoukon välillä voisi johtua?



Tehtävä 2

Tutkitaan vastaajien käsitystä siitä, onko heidän politiikan tietämyksensä keskimääräistä parempi vai huonompi.

Tarkastellaan seuraavaa muuttujaa:

k36d Mielestäni useimmat suomalaiset ovat minua paremmin perillä politiikasta ja hallituksen toiminnasta

Vastausvaihtoehtoina on 1=Täysin samaa mieltä, 2=Samaa mieltä, 3=En samaa enkä eri mieltä, 4= Eri mieltä, 5= Täysin eri mieltä ja 8=En osaa sanoa.


Mikä on tällä kertaa muuttujan mittaustaso?

Tutkittavaksi valittu muuttuja on nyt järjestys- eli ordinaaliasteikollinen, joten siitä voi tutkia useampia tilastollisia tunnuslukuja kuin tehtävän 1 tapauksessa. Mitä nämä ovat?


Yleensä mielipidemuuttujia tutkittaessa "en osaa sanoa" -vaihtoehto asetetaan puuttuvaksi tiedoksi, jotta vältettäisiin tunnuslukujen vääristyminen.

Aseta vastausvaihtoehto 8 puuttuvaksi klikkaamalla SPSS:n Variable View -välilehden Missing-sarakkeeen oikea puolta muuttujan k36d kohdalla.

Puuttuvien arvojen määrittäminen

Valitse uudesta ikkunasta Discrete missing values ja kirjoita luku 8 tämän alla olevaan kenttään. Paina lopuksi OK.

Puuttuvat arvot

Mene valikkoon Analyze - Descriptive Statistics - Frequencies..., ja klikkaa Reset -painiketta.

Etsi sitten vasemmanpuoleisesta valikosta muuttuja k36d, ja siirrä se nuolen avulla Variable(s)-laatikkoon.

Mene seuraavaksi määrittämään tarvittavat keski- ja hajontaluvut Statistics-valikosta.

Koska kyseessä on ordinaalinen muuttuja, voidaan keskilukuina tutkia sekä moodia että mediaania (Median). Vaihteluväli voidaan tarkastaa katsomalla muuttujan saamaa pienintä ja suurinta arvoa (Dispersion - Minimum ja Maximum).

Frekvenssit-statistics

Paina sitten Continue palataksesi päävalikkoon.


Voit myös käydä valitsemassa esimerkiksi pylväskuvion Charts-valikosta.

Klikkaa sitten OK, ja siirry Outputiin tarkastelemaan tuloksia.

Ensin tutkitaan Statistics-taulukkoa. Saitko samanlaisen?

Statistics-taulukko

Tästä nähdään mm. seuraavat asiat:

  • Mediaani on 3, joten näkemykset omasta politiikan tuntemuksesta verrattuna suomalaisten tietämykseen yleensä näyttäisivät olevan jokseenkin tasapainossa
  • Yleisin yksittäinen vastausvaihtoehto on 4, ja jokainen arvo välillä 1-5 on saanut havaintoja tuekseen

Seuraavaksi siirrytään katsomaan frekvenssitaulukkoa.

Frekvenssi-taulukko

  • 99 vastaajaa eli 7,3 % kaikista havainnoista tai 8,0 % kaikista mielipiteensä arvoilla 1-5 ilmaisseista on täysin eri mieltä esitetyn väitteen kanssa
  • 31,7 % vastanneista pitää omaa poliittista tietämystään huonompana kuin muut

Voimme nyt verrata keskenään niitä, jotka pitävät tietämystään parempana (vaihtoehdot 4 ja 5) ja niitä, jotka ovat mielestään keskimääräistä huonommin perillä politiikasta (1 ja 2). Vastaavat yhteenlasketut osuudet ovat 40,4 % (=32,3 + 8,0) ja 31,7 %. Mistä voisi johtua se, että itseään keskimääräistä valveutuneempana pitäviä on lähes kymmenen prosenttiyksikköä enemmän?



Tehtävä 3

Viimeisessä harjoituksessa tutkitaan vastaajien ilmoittamia bruttokuukausituloja, joita kysyttiin muuttujassa

k26 Kuinka suuret ovat keskimääräiset omat kuukausitulonne veroja vähentämättä ( = bruttotulot)?

Kyseessä on numeerinen muuttuja, mutta onko se välimatka- vai suhdeasteikollinen?

Käytännön kannalta ei ole juurikaan väliä, kumpaa tyyppiä muuttuja on, sillä yleisimmin käytetyt tunnusluvut voidaan laskea millaiselle tahansa numeeriselle muuttujalle. Kuitenkin erot näiden välillä on hyvä tuntea, jos suorittaa esimerkiksi vaativampia tilastollisia tarkasteluja.


Pääset nopeasti oikeaan valikkoon myös Dialog Recall -pikakuvakkeen Dialog Recall-pikakuvake kautta klikkaamalla sitä kerran ja valitsemalla ylimmäisenä olevan Frequencies-toiminnon.

Nollaa aikaisemmin tehdyt määritykset ja valitse muuttuja k26 tarkastelun alle, ja siirry sitten Statistics-kohtaan.

Tutkittavana on siis suhdeasteikollinen muuttuja, joten olisi periaatteessa mahdollista valita kaikki ikkunan esittämät tunnusluvut. Valitaan kuitenkin nyt näistä käytetyimmät ja jätetään loppujen käyttö ja tulkinta vapaaehtoiseksi tehtäväksi.

Valitaan kvartiilit (Percintile Values - Quartiles). Halutessasi voit myös määrittää vaihtoehtoisia prosenttiosuuksia näytettäväksi Percentile(s)-kohdassa tai jakaa aineiston tiettyyn määrään havainnoiltaan yhtä suureen osaan Cut points for: _ equal groups -kohdassa. Keskilukuihin valitaan edellisten lisäksi keskiarvo (Mean). Hajontalukuihin otetaan mukaan keskihajonta (Std. deviation). Varianssi (Variance) kertoo samasta asiasta, mutta keskihajonta on helpompi tulkita. Range eli vaihteluväli on pienimmän ja suurimman arvon erotus, ja tämä voi olla hyödyllinen tuloerojen havainnollistamisessa.

Distribution-otsikon alla olevat tunnusluvut mittaavat jakauman vinoutta sekä huipukkuutta. Näitä voisi olla tarpeen katsoa, jos haluttaisiin esim. tutkia jakauman normaalijakautuneisuutta.

Frekvenssit-statistics

Palaa sitten päävalikkoon, paina OK ja siirry Outputiin tulosten pariin.

Ensisijaisena mielenkiinnon kohteena on nyt Statistics-taulukko. Kuten tehtävässä 1 mainittiin, jatkuvien ja lukuisia eri arvoja saavien muuttujien kohdalla frekvenssitaulukot eivät ole kovin mielekkäitä tutkittavia. Ehkä eniten näissä taulukoissa hyötyä on kumulatiivisista prosenteista (Cumulative Percent). Esimerkiksi tässä tapauksessa voimme sanoa, että 29,9 % vastaajista ilmoittaa kuukausituloikseen tuhat euroa tai alle.

Statistics-taulukko

Taulukosta nähdään muun muassa seuraavat asiat:

  • Keskiarvo on 1986 €, ja keskihajonta 3066 €. Vastaukset poikkeavat keskiarvosta siis keskimäärin 3066 € verran. Käytännössä tulot eivät tässä voi alittaa nollaa, joten näin suuri keskihajonta tarkoittaa tässä sitä, että aineistossa on hyvin suuria arvoja, jotka kasvattavat hajontaa voimakkaasti.
  • Mediaani, 1676, on alle keskiarvon, joten suuret arvot ovat vaikuttaneet myös keskiarvoon suhteessa enemmän kuin pienet. Jakauma on näiden tietojen valossa epäilemättä jonkin verran oikealle vino.
  • 75 % havainnoista kuukausittaiset tulot ovat 2300 € tai alle
  • Huomaa, että mediaani ja 50 % persintiili ovat sama asia: taulukoita muotoillessa kannattaa jättää vain toinen näkyviin (suosituksena mediaani) turhan toiston välttämiseksi
  • Ero pienimmän ja suurimman kuukausitulon välillä on 79 990 €. Muista, että huomiota herättäviin ääriarvoihin on syytä suhtautua aina varauksella. Joskus selvästi poikkeavan havainnon voi sulkea tarkastelujen ulkopuolelle, jos vastauksen "oikeellisuutta" on syytä epäillä. Toisaalta taas poikkeavat havainnot voivat edustaa tärkeitä, valtavirrasta poikkeavia yksilöitä, ja näiden sisällyttäminen tutkimukseen voi antaa arvokasta uutta tietoa mitattavasta asiasta tai ilmiöstä.

Jos haluttaisiin tutkia suomalaisten keskituloja, olisi syytä jättää tarkastelujen ulkopuolelle alle 18-vuotiaat tai perus- ja toisen asteen kouluja käyvät, jotteivät nuorimpien oletettavasti pienet tulot vääristä tuloksia.

Tällaisiin toimenpiteisiin voit käydä tutustumassa sivuilla iän laskeminen syntymävuosimuuttujasta. Voit myös itsenäisesti kokeilla datan rajaamista Data - Select Cases -toiminnolla.


viimeksi päivitetty 2014-04-07

Yhteiskuntatieteellinen tietoarkisto Menetelmäopetuksen tietovaranto - SPSS-opas
FSD