Data-analyysi, kevät 2011
Data-analyysi, kevät 2011
Huom! Mikäli osallistujamäärää joudutaan rajoittamaan, niin valtiotieteellisen tiedekunnan opiskelijat ovat etusijalla (tilastotieteen pääaineopiskelijoiden ohella).
Luennoitsija ja harjoitusten ohjaajat
Kimmo Vehkalahti, VTT, dosentti
Tara Junes, VTK
Annu Nissinen, LuK
Laajuus
Osa 1: 5 op
Osa 2: 5 op
Tyyppi
Perusopintoja. Katso tutkintovaatimukset (2010-2012) tilastotieteen sivuaineopiskelijalle tai tilastotieteen pääaineopiskelijalle.
Esitietovaatimukset
Osa 1
Tilastotieteen johdantokurssi 10 (4+6) op laajuisena tai vastaavat perustiedot seuraavista aiheista:
Kyselytutkimus ja mittaus
- Tilastotiede ja kyselytutkimus
- Mittaus yhteiskuntatieteissä
Tiedonkeruu, tilastoaineiston kuvailu ja analysointi
- Tiedonkeruu, kuvat ja tunnusluvut
- Vaihtelu ja riippuvuus
- Ristiintaulukointi
Todennäköisyyslaskennan perusteet
- Todennäköisyyskäsite ja sen tulkinnat
- Tavallisimmat päättelysäännöt
- Ehdollinen todennäköisyys ja riippumattomuus
- Binomijakauma ja normaalijakauma
Tilastollisen päättelyn perusteet
- Parametrien estimointi ja luottamusvälit
- Tilastollinen merkitsevyystestaus
- Khi-toiseen -yhteensopivuustesti
- Riippumattomien otosten t-testi
- Regressio- ja varianssianalyysin perusteet
- Khi-toiseen -riippumattomuustesti
Monia yllä luetelluista aiheista käsitellään tällä kurssilla itse tekemällä.
Osa 2
Osan 2 esitietovaatimuksena on osa 1.
Aikataulu
Viikkoaikataulussa pysyminen on välttämätöntä. Kaiken A ja O on Aktiivinen Osallistuminen opetustilaisuuksiin, mutta myös omatoimiseen työskentelyyn on varattava riittävästi aikaa. (Mikä on "riittävästi"? Joillekin 2h/viikko, toisille enemmän.)
Osa 1
- periodi III (viikot 3-9):
- luento ti 8-10 (Unioninkatu 37, luentosali)
- huom! 8.2 EI luentoa (itsenäinen työskentely, ohjeet BSCW:ssä)
- harjoitus ti 10-12 tai ti 12-14 tai ke 8-10 (Siltavuorenpenger 1 A, K134)
- huom! ke 16.2 harjoitus: Siltavuorenpenger 10, luokka 122)
Ensimmäisellä luennolla (18.1.2011 klo 8:15) selostetaan kurssin käytännöt: harjoitusryhmät, ohjelmistot, BSCW- oppimisympäristö, viikkoaikataulu sekä itse- ja vertaisarviointikäytännöt.
Osa 2
- periodi IV
- pääosin itsenäistä työskentelyä (tarkemmat tiedot ja aikataulu osan 2 BSCW-alueella, joka avataan IV periodin alussa)
Tavoitteet
Data-analyysin perusteet ja jonkin tilastollisen tietojenkäsittelyjärjestelmän itsenäinen käyttötaito.
Sisältö
Osa 1
- Ohjelmistot ja dokumentointi
- dokumentoiva työskentelytapa (ei pelkät valikot)
- käytössä ovat tällä kurssilla lähinnä Survo ja SPSS
(esim. R tai SAS käyvät myös, mutta edellyttävät enemmän omatoimisuutta) - huomaa, että tarjolla on myös (englanninkielinen) kurssi Data-analyysi R-ohjelmistolla
- Aineiston perustaminen
- oman harjoitusaineiston perustaminen
- aineiston hallinta ja dokumentointi
- aineistoon tutustuminen
- Aineiston esikäsittely
- yhden muuttujan jakaumat, tunnusluvut ja kuvat
- muunnokset, luokittelut ja muokkaukset
- kahden muuttujan taulukot ja kuvat
- Analysointi ja testaus
- riippuvuuksien tutkiminen ristiintaulukosta
- hajontakuva, korrelaatio ja regressiosuora
- regressioanalyysi ja t-testi
Osa 2
- Osassa 1 opitun soveltaminen uuteen aineistoon.
Suoritus
Osa 1
- viikottaiset, dokumentoidut työraportit
- itse- ja vertaisarviointi asteikolla 0-5 sekä sanallisesti
Osa 2
- itsenäisesti tehty harjoitustyö
- arviointi asteikolla 0-5
Aineistot
Kurssilla analysoidaan mm. yhteiskuntatieteellisen tietoarkiston aineistoja.
Ilmoittaudu osaan 1
Unohditko ilmoittautua? Mitä tehdä.
Ilmoittaudu ajoissa, jotta a) mahdut mukaan, b) pääset kurssin verkkoalueelle (BSCW) heti kun se avataan.
Ilmoittaudu osaan 2
(Osan 2 ilmoittautuminen tapahtuu vasta lähempänä periodia IV.)
Unohditko ilmoittautua? Mitä tehdä.
(Oheis)kirjallisuutta
- Alkula, Tapani & Pöntinen, Seppo & Ylöstalo, Pekka (1994). Sosiaalitutkimuksen kvantitatiiviset menetelmät. WSOY.
- Boslaugh, Sarah (2005). An Intermediate Guide to SPSS Programming: Using Syntax for Data Management. Sage.
- Kuusela, Vesa (2000). Tilastografiikan perusteet. Edita.
- Mustonen, Seppo (1992). Survo, An Integrated Environment for Statistical Computing and Related Areas. Survo Systems.
- Mustonen, Seppo (1996). Survo ja minä. Survo Systems.
- Robbins, Naomi B. (2005). Creating More Effective Graphs. Wiley.
- Valtari, Maarit (2006). SPSS-perusteet, SPSS:n versio 14. Helsingin yliopisto, Valtiotieteellinen tiedekunta, Tieto- ja viestintätekniikka.
- Vehkalahti, Kimmo (2008). Kyselytutkimuksen mittarit ja menetelmät. Tammi.
- Wild, Christopher J. & Seber, George A. F. (2000). Chance Encounters: a First Course in Data Analysis and Inference. Wiley.