Data-analyysi (osa 1 ja osa 2), kevät 2013
Data-analyysi (osa 1 ja osa 2), kevät 2013
Tilastotieteen sivuaineopiskelijoista etusijalla ovat valtiotieteellisen tiedekunnan opiskelijat.
Luennoitsija ja harjoitusten ohjaajat
Kimmo Vehkalahti
Jadwiga Buchwald
Otso Peräkylä
Laajuus
78116 Data-analyysi (osa 1), 5 op
78132 Data-analyysi (osa 2), 5 op
Tyyppi
Perusopintoja. Katso tutkintovaatimukset (2012-2014) tilastotieteen pääaineopiskelijalle tai tilastotieteen sivuaineopiskelijalle.
Tavoitteet
Tavoitteena on oppia data-analyysin perusteet ja jonkin tilastollisen tietojenkäsittelyjärjestelmän itsenäinen käyttötaito.
Ohjelmistot
Tällä kurssilla käytössä ovat lähinnä Survo (tai Muste) ja SPSS. Periaatteessa myös R tai SAS käyvät, mutta ne edellyttävät tässä yhteydessä huomattavasti enemmän omatoimisuutta. Huomaa, että tarjolla on myös kurssi Data-analyysi R-ohjelmistolla.
Aineistot
Kurssilla analysoidaan mm. yhteiskuntatieteellisen tietoarkiston aineistoja.
Toteutustapa
Kurssi koostuu kahdesta osasta. Halutessaan voi osallistua vain osaan 1. Periodilla IV järjestettävä osa 2 on verkkokurssi, joka perustuu enimmäkseen itsenäiseen työskentelyyn. Tarkemmat tiedot molemmista osista alempana.
(Oheis)kirjallisuutta (soveltuvin osin kurssin molempiin osiin)
- Alkula, Tapani & Pöntinen, Seppo & Ylöstalo, Pekka (1994). Sosiaalitutkimuksen kvantitatiiviset menetelmät. WSOY.
- Boslaugh, Sarah (2005). An Intermediate Guide to SPSS Programming: Using Syntax for Data Management. Sage.
- Kuusela, Vesa (2000). Tilastografiikan perusteet. Edita.
- Marsh, Catherine & Elliott, Jane (2008). Exploring Data: An Introduction to Data Analysis for Social Scientists, Second Edition. Polity Press.
- Mustonen, Seppo (1992). Survo, An Integrated Environment for Statistical Computing and Related Areas. Survo Systems.
- Mustonen, Seppo (1996). Survo ja minä. Survo Systems.
- Robbins, Naomi B. (2005). Creating More Effective Graphs. Wiley.
- Sund, Reijo (2011). Muste: Survomainen editoriaalinen käyttöympäristö R:lle. Tyyppiarvo 1/2012.
- Valtari, Maarit (2006). SPSS-perusteet, SPSS:n versio 14. Helsingin yliopisto, Valtiotieteellinen tiedekunta, Tieto- ja viestintätekniikka.
- Vehkalahti, Kimmo (2008). Kyselytutkimuksen mittarit ja menetelmät. Tammi.
- Vehkalahti, Kimmo (2012). Pääsiäinen on aina sunnuntaina. Matematiikkalehti Solmu 2/2012.
- Wild, Christopher J. & Seber, George A. F. (2000). Chance Encounters: a First Course in Data Analysis and Inference. Wiley.
78116 Data-analyysi (osa 1), 5 op
Kurssin osa 1 järjestetään periodilla III.
Esitietovaatimukset
Tilastotieteen johdantokurssi tai vastaavat tiedot (ks. Teemat 1-10).
Aikataulu
Viikkoaikataulussa pysyminen on välttämätöntä. Kaiken A ja O on Aktiivinen Osallistuminen opetustilaisuuksiin, mutta myös omatoimiseen työskentelyyn ja raportointiin on varattava riittävästi aikaa. (Mikä on "riittävästi"? Joillekin 2-4h/viikko, toisille enemmän.) Lisäksi aikaa on varattava työraporttien itsearviointeihin ja vertaisarviointeihin.
- periodi III (viikot 3-9):
- luento ti 8-10 (Unioninkatu 37, luentosali)
- harjoitus ti 10-12 tai ti 12-14 tai ke 8-10 (Aleksandria, K130) - poikkeus: ke 23.1.2013 luokassa K131
Ensimmäisellä luennolla (15.1.2013 klo 8:15) selostetaan kaikki kurssin käytännöt:
- luennot, harjoitukset ja harjoitusryhmät
- ohjelmistot ja aineistot
- viikkoaikataulu
- verkkoalue
- itse- ja vertaisarviointi
Sisältö
- Ohjelmistot ja dokumentointi
- dokumentoiva työskentelytapa (ei pelkät valikot)
- Aineiston perustaminen
- oman harjoitusaineiston perustaminen
- aineiston hallinta ja dokumentointi
- aineistoon tutustuminen
- Aineiston esikäsittely
- yhden muuttujan jakaumat, tunnusluvut ja kuvat
- muunnokset, luokittelut ja muokkaukset
- kahden muuttujan taulukot ja kuvat
- Analysointi ja testaus
- riippuvuuksien tutkiminen ristiintaulukosta
- hajontakuva, korrelaatio ja regressiosuora
- regressioanalyysi ja t-testi
Suoritus
- hyvin dokumentoidut ja ajallaan tehdyt työraportit
- itsearvioinnit ja vertaisarvioinnit
Ilmoittaudu osaan 1 (erikseen luentokurssille JA yhteen harjoitusryhmään)
78132 Data-analyysi (osa 2), 5 op
Kurssin osa 2 järjestetään periodilla IV. Kyseessä on verkkokurssi, joka perustuu pääosin itsenäiseen työskentelyyn.
Esitietovaatimukset
Esitietovaatimuksena on kurssin menestyksellisesti suoritettu osa 1 (ks. edellä).
Aikataulu
Tarkemmat tiedot ja aikataulu tulevat osan 2 verkkoalueelle, joka avataan IV periodin alussa.
Sisältö
- Osassa 1 opitun itsenäinen soveltaminen uusien aineistojen analysointiin.
Suoritus
- itsenäisesti, annetussa aikataulussa tehty harjoitustyö
Ilmoittaudu osaan 2
(Osan 2 ilmoittautuminen tapahtuu vasta lähempänä periodia IV.)