Data-analyysi, kevät 2012

Last modified by kvehkala@helsinki_fi on 2024/03/27 10:34

Data-analyysi, kevät 2012

Tilastotieteen sivuaineopiskelijoista etusijalla ovat valtiotieteellisen tiedekunnan opiskelijat.

Luennoitsija ja harjoitusten ohjaajat

Kimmo Vehkalahti, VTT, dosentti
 Jadwiga Buchwald, valtiot.yo
 Otso Peräkylä, fil.yo

Laajuus

78116 Data-analyysi (osa 1), 5 op

78132 Data-analyysi (osa 2), 5 op

Tyyppi

Perusopintoja. Katso tutkintovaatimukset (2011-2012) tilastotieteen sivuaineopiskelijalle tai tilastotieteen pääaineopiskelijalle.

Tavoitteet

Tavoitteena on oppia data-analyysin perusteet ja jonkin tilastollisen tietojenkäsittelyjärjestelmän itsenäinen käyttötaito.

Ohjelmistot

Tällä kurssilla käytössä ovat lähinnä Survo (tai Muste) ja SPSS. Periaatteessa myös R tai SAS käyvät, mutta ne edellyttävät tässä yhteydessä huomattavasti enemmän omatoimisuutta. Huomaa, että tarjolla on myös kurssi Data-analyysi R-ohjelmistolla.

Aineistot

Kurssilla analysoidaan mm. yhteiskuntatieteellisen tietoarkiston aineistoja.

Toteutustapa

Kurssi koostuu kahdesta osasta. Halutessaan voi osallistua vain osaan 1. Periodilla IV järjestettävä osa 2 on verkkokurssi, joka perustuu enimmäkseen itsenäiseen työskentelyyn. Tarkemmat tiedot molemmista osista alempana.


(Oheis)kirjallisuutta (soveltuvin osin kurssin molempiin osiin)

  • Alkula, Tapani & Pöntinen, Seppo & Ylöstalo, Pekka (1994). Sosiaalitutkimuksen kvantitatiiviset menetelmät. WSOY.
  • Boslaugh, Sarah (2005). An Intermediate Guide to SPSS Programming: Using Syntax for Data Management. Sage.
  • Kuusela, Vesa (2000). Tilastografiikan perusteet. Edita.
  • Marsh, Catherine & Elliott, Jane (2008). Exploring Data: An Introduction to Data Analysis for Social Scientists, Second Edition. Polity Press.
  • Mustonen, Seppo (1992). Survo, An Integrated Environment for Statistical Computing and Related Areas. Survo Systems.
  • Mustonen, Seppo (1996). Survo ja minä. Survo Systems.
  • Robbins, Naomi B. (2005). Creating More Effective Graphs. Wiley.
  • Valtari, Maarit (2006). SPSS-perusteet, SPSS:n versio 14. Helsingin yliopisto, Valtiotieteellinen tiedekunta, Tieto- ja viestintätekniikka.
  • Vehkalahti, Kimmo (2008). Kyselytutkimuksen mittarit ja menetelmät. Tammi.
  • Wild, Christopher J. & Seber, George A. F. (2000). Chance Encounters: a First Course in Data Analysis and Inference. Wiley.

78116 Data-analyysi (osa 1), 5 op

Kurssin osa 1 järjestetään periodilla III.

Esitietovaatimukset

Tilastotieteen johdantokurssi tai vastaavat tiedot (ks. Teemat 1-10).

Aikataulu

Viikkoaikataulussa pysyminen on välttämätöntä. Kaiken A ja O on Aktiivinen Osallistuminen opetustilaisuuksiin, mutta myös omatoimiseen työskentelyyn ja raportointiin on varattava riittävästi aikaa. (Mikä on "riittävästi"? Joillekin 2-4h/viikko, toisille enemmän.) Lisäksi aikaa on viikoittain varattava työraporttien itse- ja vertaisarviointeihin.

Ensimmäisellä luennolla (17.1.2012 klo 8:15) selostetaan kaikki kurssin käytännöt:

  • luennot, harjoitukset ja harjoitusryhmät
  • ohjelmistot ja aineistot
  • viikkoaikataulu
  • verkkoalue (ohjeet)
  • itse- ja vertaisarviointi

Sisältö

  • Ohjelmistot ja dokumentointi
    • dokumentoiva työskentelytapa (ei pelkät valikot)
  • Aineiston perustaminen
    • oman harjoitusaineiston perustaminen
    • aineiston hallinta ja dokumentointi
    • aineistoon tutustuminen
  • Aineiston esikäsittely
    • yhden muuttujan jakaumat, tunnusluvut ja kuvat
    • muunnokset, luokittelut ja muokkaukset
    • kahden muuttujan taulukot ja kuvat
  • Analysointi ja testaus
    • riippuvuuksien tutkiminen ristiintaulukosta
    • hajontakuva, korrelaatio ja regressiosuora
    • regressioanalyysi ja t-testi

Suoritus

  • viikoittaiset, hyvin dokumentoidut ja ajallaan tehdyt työraportit
  • viikoittaiset itse- ja vertaisarvioinnit sanallisesti ja asteikolla 0-5

Ilmoittaudu osaan 1 (erikseen luentokurssille JA yhteen harjoitusryhmään)

Ilmoittautumisaika on päättynyt ja kurssi on täynnä. Ilmoittautuneet ovat saaneet sähköpostitse kutsun verkkoalueelle (BSCW), joka on avattu jo ennakkoon 13.1.2012.


78132 Data-analyysi (osa 2), 5 op

Kurssin osa 2 järjestetään periodilla IV. Kyseessä on verkkokurssi, joka perustuu enimmäkseen itsenäiseen työskentelyyn.

Esitietovaatimukset

Esitietovaatimuksena on kurssin osa 1 (ks. edellä). Suosituksena on vähintään hyvä arvosana (3) osasta 1.

Aikataulu

Tarkemmat tiedot ja aikataulu tulevat osan 2 BSCW-alueelle, joka avataan IV periodin alussa.

Sisältö

  • Osassa 1 opitun itsenäinen soveltaminen uusien aineistojen analysointiin.

Suoritus

  • itsenäisesti tehty harjoitustyö, joka arvioidaan asteikolla 0-5

Ilmoittaudu osaan 2

(Osan 2 ilmoittautuminen tapahtuu vasta lähempänä periodia IV.)