Data-analyysi, kevät 2011

Last modified by morlanes@helsinki_fi on 2024/03/27 10:10

Data-analyysi, kevät 2011

Huom! Mikäli osallistujamäärää joudutaan rajoittamaan, niin valtiotieteellisen tiedekunnan opiskelijat ovat etusijalla (tilastotieteen pääaineopiskelijoiden ohella).

Luennoitsija ja harjoitusten ohjaajat

Kimmo Vehkalahti, VTT, dosentti
Tara Junes, VTK
 Annu Nissinen, LuK

Laajuus

Osa 1: 5 op

Osa 2: 5 op

Tyyppi

Perusopintoja. Katso tutkintovaatimukset (2010-2012) tilastotieteen sivuaineopiskelijalle tai tilastotieteen pääaineopiskelijalle.

Esitietovaatimukset

Osa 1

Tilastotieteen johdantokurssi 10 (4+6) op laajuisena tai vastaavat perustiedot seuraavista aiheista:

Kyselytutkimus ja mittaus

  • Tilastotiede ja kyselytutkimus
  • Mittaus yhteiskuntatieteissä

Tiedonkeruu, tilastoaineiston kuvailu ja analysointi

  • Tiedonkeruu, kuvat ja tunnusluvut
  • Vaihtelu ja riippuvuus
  • Ristiintaulukointi

Todennäköisyyslaskennan perusteet

  • Todennäköisyyskäsite ja sen tulkinnat
  • Tavallisimmat päättelysäännöt
  • Ehdollinen todennäköisyys ja riippumattomuus
  • Binomijakauma ja normaalijakauma

Tilastollisen päättelyn perusteet

  • Parametrien estimointi ja luottamusvälit
  • Tilastollinen merkitsevyystestaus
  • Khi-toiseen -yhteensopivuustesti
  • Riippumattomien otosten t-testi
  • Regressio- ja varianssianalyysin perusteet
  • Khi-toiseen -riippumattomuustesti

Monia yllä luetelluista aiheista käsitellään tällä kurssilla itse tekemällä.

Osa 2

Osan 2 esitietovaatimuksena on osa 1.

Aikataulu

Viikkoaikataulussa pysyminen on välttämätöntä. Kaiken A ja O on Aktiivinen Osallistuminen opetustilaisuuksiin, mutta myös omatoimiseen työskentelyyn on varattava riittävästi aikaa. (Mikä on "riittävästi"? Joillekin 2h/viikko, toisille enemmän.)

Osa 1

Ensimmäisellä luennolla (18.1.2011 klo 8:15) selostetaan kurssin käytännöt: harjoitusryhmät, ohjelmistot, BSCW- oppimisympäristö, viikkoaikataulu sekä itse- ja vertaisarviointikäytännöt.

Osa 2

  • periodi IV
    • pääosin itsenäistä työskentelyä (tarkemmat tiedot ja aikataulu osan 2 BSCW-alueella, joka avataan IV periodin alussa)

Tavoitteet

Data-analyysin perusteet ja jonkin tilastollisen tietojenkäsittelyjärjestelmän itsenäinen käyttötaito.

Sisältö

Osa 1

  • Ohjelmistot ja dokumentointi
    • dokumentoiva työskentelytapa (ei pelkät valikot)
    • käytössä ovat tällä kurssilla lähinnä Survo ja SPSS
      (esim. R tai SAS käyvät myös, mutta edellyttävät enemmän omatoimisuutta) - huomaa, että tarjolla on myös (englanninkielinen) kurssi Data-analyysi R-ohjelmistolla
  • Aineiston perustaminen
    • oman harjoitusaineiston perustaminen
    • aineiston hallinta ja dokumentointi
    • aineistoon tutustuminen
  • Aineiston esikäsittely
    • yhden muuttujan jakaumat, tunnusluvut ja kuvat
    • muunnokset, luokittelut ja muokkaukset
    • kahden muuttujan taulukot ja kuvat
  • Analysointi ja testaus
    • riippuvuuksien tutkiminen ristiintaulukosta
    • hajontakuva, korrelaatio ja regressiosuora
    • regressioanalyysi ja t-testi

Osa 2

  • Osassa 1 opitun soveltaminen uuteen aineistoon.

Suoritus

Osa 1

  • viikottaiset, dokumentoidut työraportit
    • itse- ja vertaisarviointi asteikolla 0-5 sekä sanallisesti

Osa 2

  • itsenäisesti tehty harjoitustyö
    • arviointi asteikolla 0-5

Aineistot

Kurssilla analysoidaan mm. yhteiskuntatieteellisen tietoarkiston aineistoja.

Ilmoittaudu osaan 1

Unohditko ilmoittautua? Mitä tehdä.

Ilmoittaudu ajoissa, jotta a) mahdut mukaan, b) pääset kurssin verkkoalueelle (BSCW) heti kun se avataan.

Ilmoittaudu osaan 2

(Osan 2 ilmoittautuminen tapahtuu vasta lähempänä periodia IV.)
 Unohditko ilmoittautua? Mitä tehdä.

(Oheis)kirjallisuutta

  • Alkula, Tapani & Pöntinen, Seppo & Ylöstalo, Pekka (1994). Sosiaalitutkimuksen kvantitatiiviset menetelmät. WSOY.
  • Boslaugh, Sarah (2005). An Intermediate Guide to SPSS Programming: Using Syntax for Data Management. Sage.
  • Kuusela, Vesa (2000). Tilastografiikan perusteet. Edita.
  • Mustonen, Seppo (1992). Survo, An Integrated Environment for Statistical Computing and Related Areas. Survo Systems.
  • Mustonen, Seppo (1996). Survo ja minä. Survo Systems.
  • Robbins, Naomi B. (2005). Creating More Effective Graphs. Wiley.
  • Valtari, Maarit (2006). SPSS-perusteet, SPSS:n versio 14. Helsingin yliopisto, Valtiotieteellinen tiedekunta, Tieto- ja viestintätekniikka.
  • Vehkalahti, Kimmo (2008). Kyselytutkimuksen mittarit ja menetelmät. Tammi.
  • Wild, Christopher J. & Seber, George A. F. (2000). Chance Encounters: a First Course in Data Analysis and Inference. Wiley.