Child pages
  • Data-analyysi, kevät 2012
Skip to end of metadata
Go to start of metadata

You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 8 Next »

Data-analyysi, kevät 2012

Järjestävä yksikkö: Sosiaalitieteiden laitos, Tilastotiede - osa Helsingin yliopiston laajuista Tilastotieteen verkostoa, jota koordinoi Matematiikan ja tilastotieteen laitos.

(warning) Tilastotieteen sivuaineopiskelijoista etusijalla ovat valtiotieteellisen tiedekunnan opiskelijat.

Luennoitsija ja harjoitusten ohjaajat

Kimmo Vehkalahti, VTT, dosentti
Jadwiga Buchwald, valtiot.yo
Otso Peräkylä, fil.yo

Laajuus

78116 Data-analyysi (osa 1), 5 op

78132 Data-analyysi (osa 2), 5 op

Tyyppi

Perusopintoja. Katso tutkintovaatimukset (2011-2012) tilastotieteen sivuaineopiskelijalle tai tilastotieteen pääaineopiskelijalle.

Tavoitteet

Tavoitteena on oppia data-analyysin perusteet ja jonkin tilastollisen tietojenkäsittelyjärjestelmän itsenäinen käyttötaito.

Ohjelmistot

Tällä kurssilla käytössä ovat lähinnä Survo (tai Muste) ja SPSS. Periaatteessa myös R tai SAS käyvät, mutta ne edellyttävät tässä yhteydessä huomattavasti enemmän omatoimisuutta. Huomaa, että tarjolla on myös kurssi Data-analyysi R-ohjelmistolla.

Aineistot

Kurssilla analysoidaan mm. yhteiskuntatieteellisen tietoarkiston aineistoja.

Toteutustapa

Kurssi koostuu kahdesta osasta. Halutessaan voi osallistua vain osaan 1. Periodilla IV järjestettävä osa 2 on verkkokurssi, joka perustuu enimmäkseen itsenäiseen työskentelyyn. Tarkemmat tiedot molemmista osista alempana.

(Oheis)kirjallisuutta

  • Alkula, Tapani & Pöntinen, Seppo & Ylöstalo, Pekka (1994). Sosiaalitutkimuksen kvantitatiiviset menetelmät. WSOY.
  • Boslaugh, Sarah (2005). An Intermediate Guide to SPSS Programming: Using Syntax for Data Management. Sage.
  • Kuusela, Vesa (2000). Tilastografiikan perusteet. Edita.
  • Marsh, Catherine & Elliott, Jane (2008). Exploring Data: An Introduction to Data Analysis for Social Scientists, Second Edition. Polity Press.
  • Mustonen, Seppo (1992). Survo, An Integrated Environment for Statistical Computing and Related Areas. Survo Systems.
  • Mustonen, Seppo (1996). Survo ja minä. Survo Systems.
  • Robbins, Naomi B. (2005). Creating More Effective Graphs. Wiley.
  • Valtari, Maarit (2006). SPSS-perusteet, SPSS:n versio 14. Helsingin yliopisto, Valtiotieteellinen tiedekunta, Tieto- ja viestintätekniikka.
  • Vehkalahti, Kimmo (2008). Kyselytutkimuksen mittarit ja menetelmät. Tammi.
  • Wild, Christopher J. & Seber, George A. F. (2000). Chance Encounters: a First Course in Data Analysis and Inference. Wiley.

78116 Data-analyysi (osa 1), 5 op

Kurssin osa 1 järjestetään periodilla III.

Esitietovaatimukset

Tilastotieteen johdantokurssi 10 (4+6) op laajuisena tai vastaavat perustiedot seuraavista aiheista:

Kyselytutkimus ja mittaus

  • Tilastotiede ja kyselytutkimus
  • Mittaus yhteiskuntatieteissä

Tiedonkeruu, tilastoaineiston kuvailu ja analysointi

  • Tiedonkeruu, kuvat ja tunnusluvut
  • Vaihtelu ja riippuvuus
  • Ristiintaulukointi

Todennäköisyyslaskennan perusteet

  • Todennäköisyyskäsite ja sen tulkinnat
  • Tavallisimmat päättelysäännöt
  • Ehdollinen todennäköisyys ja riippumattomuus
  • Binomijakauma ja normaalijakauma

Tilastollisen päättelyn perusteet

  • Parametrien estimointi ja luottamusvälit
  • Tilastollinen hypoteesin testaus
  • Khi-toiseen -yhteensopivuustesti
  • Riippumattomien otosten t-testi
  • Regressio- ja varianssianalyysin perusteet
  • Khi-toiseen -riippumattomuustesti

Monia yllä luetelluista aiheista käsitellään tällä kurssilla itse tekemällä.

Aikataulu

Viikkoaikataulussa pysyminen on välttämätöntä. Kaiken A ja O on Aktiivinen Osallistuminen opetustilaisuuksiin, mutta myös omatoimiseen työskentelyyn on varattava riittävästi aikaa. (Mikä on "riittävästi"? Joillekin 2h/viikko, toisille enemmän.)

Ensimmäisellä luennolla (17.1.2011 klo 8:15) selostetaan kurssin käytännöt: harjoitusryhmät, ohjelmistot, BSCW- oppimisympäristö, viikkoaikataulu sekä itse- ja vertaisarviointikäytännöt.

Sisältö

  • Ohjelmistot ja dokumentointi
    • dokumentoiva työskentelytapa (ei pelkät valikot)
  • Aineiston perustaminen
    • oman harjoitusaineiston perustaminen
    • aineiston hallinta ja dokumentointi
    • aineistoon tutustuminen
  • Aineiston esikäsittely
    • yhden muuttujan jakaumat, tunnusluvut ja kuvat
    • muunnokset, luokittelut ja muokkaukset
    • kahden muuttujan taulukot ja kuvat
  • Analysointi ja testaus
    • riippuvuuksien tutkiminen ristiintaulukosta
    • hajontakuva, korrelaatio ja regressiosuora
    • regressioanalyysi ja t-testi

Suoritus

  • viikoittaiset, hyvin dokumentoidut ja ajallaan tehdyt työraportit
  • viikoittaiset itse- ja vertaisarvioinnit sanallisesti ja asteikolla 0-5

Ilmoittaudu osaan 1

(warning) Ilmoittaudu ajoissa, jotta pääset a) mukaan, b) verkkoalueelle (BSCW), kun se kurssin alkaessa avataan.

78132 Data-analyysi (osa 2), 5 op

Kurssin osa 2 järjestetään periodilla IV. Kyseessä on verkkokurssi, joka perustuu enimmäkseen itsenäiseen työskentelyyn.

Esitietovaatimukset

Esitietovaatimuksena on kurssin osa 1 (ks. edellä). Suosituksena on vähintään hyvä arvosana (3) osasta 1.

Aikataulu

Tarkemmat tiedot ja aikataulu tulevat osan 2 BSCW-alueelle, joka avataan IV periodin alussa.

Sisältö

  • Osassa 1 opitun itsenäinen soveltaminen uusien aineistojen analysointiin.

Suoritus

  • itsenäisesti tehty harjoitustyö, joka arvioidaan asteikolla 0-5

Ilmoittaudu osaan 2

(Osan 2 ilmoittautuminen tapahtuu vasta lähempänä periodia IV.)

  • No labels