Frekvenssijakauma, keski- ja hajontaluvut - SPSS-harjoitus 1

Jos olet ensimmäistä kertaa aloittamassa SPSS-harjoitusta, on ennen varsinaisen harjoituksen tekemistä syytä tutustua opiskeluohjeisiin.

Oheisten videoiden avulla voit katsoa, kuinka ottaa muuttujasta frekvenssijakauma, verrata muuttujan jakaumaa normaalijakaumaan ja laskea keski- ja hajontaluvut SPSS:llä. Videoissa käytetään esimerkkinä European Social Survey 2012 -kyselyn Suomen aineistoa.

Voit myös seurata alla olevia ohjeita, joissa käytetään havaintoaineistona osaa European Values Study 2017 -tutkimuksen Suomen aineistosta, osaEVS.

Havaintoaineiston hakemisesta SPSS-ohjelmaan on erilliset ohjeet.

Frekvenssijakauma, keski- ja hajontaluvut Ankkurilinkki ikoni

Frekvenssijakauma eli suora jakauma on yleensä ensimmäinen muuttujan jakauman esittämistapa. Frekvenssi on havaintojen lukumäärä muuttujan luokassa. Jakauma muodostuu muuttujan eri arvoista ja niihin liittyvistä frekvensseistä. Frekvenssitaulukossa esitetään usein myös summafrekvenssit, prosenttifrekvenssit ja summaprosentit. Summajakaumia kutsutaan myös kumulatiivisiksi jakaumiksi.

Muuttujan frekvenssijakauman sisältämä informaatio voidaan ilmaista taulukoiden ja kuvioiden lisäksi muutamalla muuttujaa kuvaavalla tilastollisella tunnusluvulla. Tässä harjoituksessa tutustumme miten SPSS:n Frequencies-toiminnolla saadaan tulostettua muuttujan frekvenssijakauma sekä laskettua yleisimmät keski- ja hajontaluvut käyttäen esimerkkinä havaintoaineistoon laskettua ikämuuttujaa (ika).

Aloita valitsemalla valikosta Analyze - Descriptive Statistics - Frequencies.... Voit myös valita haluamasi tunnusluvut saman valikon kautta.

Frekvenssit, keski- ja hajontaluvut

Frequencies-ikkuna avautuu. Vasemmassa laatikossa näkyvät kaikki aineiston muuttujat. Valitse ikämuuttuja hiirellä klikkaamalla ja siirrä se oikeanpuoleiseen laatikkoon keskellä olevaa nuolinäppäintä painamalla. Voit valita ja siirtää myös useita muuttujia kerralla. Jos et halua tulostaa frekvenssitaulukkoa, voit poistaa väkäsen Display frequency tables -valintalaatikosta.

Muuttujien valinta

Jos haluat muuttujan jakaumasta pylväs-, piirakka- tai histogrammikuvaajan, voit valita sen Charts... -painiketta painamalla avautuvasta ikkunasta.
Painamalla Statistics... -painiketta saat eteesi uuden ikkunan, josta voit valita haluamasi tunnusluvut.

Tunnuslukujen valinta

Tunnusluvut on jaettu neljään eri kokonaisuuteen.

  • Percentile Values — prosenttipisteet
  • Central Tendency — keskiluvut
  • Dispersion — hajontaluvut
  • Characterize Posterior Distribution — jakauman vinous ja huipukkuus

Valitse tunnusluvut tarkasteltavan muuttujan mittaustasoon sopiviksi. Koska valitsimme esimerkkimuuttujaksi suhdeasteikollisen ikä-muuttujan, voimme valita kaikki ohjelman tarjoamat keski- ja hajontaluvut sekä muut jakaumaa kuvailevat tunnusluvut. Painamalla Continue- ja OK-näppäimiä, saamme tulosikkunaan frekvenssijakaumataulukon (Avautuu uuteen välilehteen) sekä taulukon valitsemistamme tunnusluvuista.

Tulostaulukko

Keskiluvut Ankkurilinkki ikoni

Tunnuslukutaulukosta näemme, että aineistossa on 1199 havaintoa, joista puuttuvia on 35. Kaikki vastaajat eivät ole jostain syystä ilmoittaneet ikäänsä. Tunnusluvut perustuvat siis 1164 validiin havaintoon. Ikämuuttujan keskiarvo on 53,86 vuotta ja keskiarvon keskivirhe on 0,539 vuotta. Vastaavasti mediaani on 57 vuotta ja moodi (tyyppiarvo) eli vastaajien yleisin ikä on 67 vuotta.

Hajontaluvut Ankkurilinkki ikoni

Ikämuuttujan keskihajonta on 18,38 eli muuttujan arvot poikkeavat keskimäärin 18,38 vuotta keskiarvosta (53,86). Keskihajonta saadaan ottamalla varianssista neliöjuuri: √337,916 = 18,38. Toisin sanoen, varianssi on keskihajonnan neliö. Minimi on 18 ja maksimi on 96 eli vaihteluvälin pituus on 96 - 18 = 78. Variaatiokerrointa SPSS ei laske suoraan, mutta se on helppo laskea jakamalla keskihajonta keskiarvolla. (18,38 / 53,86 = 0,34)

Jakaumaa kuvailevat tunnusluvut Ankkurilinkki ikoni

Täysin symmetrisen jakauman (normaalijakauma) vinous (skewness) saa arvon nolla. Vinous poikkeaa ikämuuttujan kohdalla hieman nollasta, joten jakauma on epäsymmetrinen. Koska vinouskerroin on negatiivinen, jakauma on vasemmalle vino. Normaalijakauman huipukkuus (kurtosis) on myös nolla. Ikämuuttujan huipukkuuden arvoksi saamme -0.939 ja kuten oheisesta histogrammista näemme, havaintoaineiston ikäjakaumalla on useampia huippuja. Lisäksi tulostaulukkoon tulevat ikäjakauman 25-, 50- sekä 75-prosenttipisteet eli ala-, keski- ja yläkvartiilit. Mikäli haluat testata noudattaako tarkastelemasi muuttujan jakauma tasa-, Poisson-, ekspontentiaali- tai normaalijakaumaa, voit kokeilla Kolmogorov-Smirnov -testiä valikosta Analyze - Nonparametric Tests - Legacy Dialogs - 1-Sample K-S.

Histogrammi