Monimuuttujamenetelmät, syksy 2009

Last modified by matl_www@helsinki_fi on 2024/03/27 10:02

Monimuuttujamenetelmät, syksy 2009

Luennoitsija

Kimmo Vehkalahti

Laajuus

6/8 op

Tyyppi

(Sivu)aineopintoja

Kohderyhmä

Kurssilla on kaksi kohderyhmää, jotka vastaavat suorituslaajuuksia (6/8 op):

6 op: Erityisesti yhteiskunta- ja käyttäytymistieteiden opiskelijat ja tutkijat, jotka tarvitsevat menetelmiä opinnäytetöissään tai muissa tutkimuksissa. (Myös muiden alojen edustajat ovat tervetulleita!)

8 op: Tilastotieteen aineopintovaiheen pääaine- tai sivuaineopiskelijat.

Tavoitteet

Tavoitteena on perehtyä sovelluspainotteisesti usean muuttujan data-analyysiin ja moniulotteiseen tilastolliseen mallintamiseen erityisesti yhteiskunta- ja käyttäytymistieteellisissä tutkimusasetelmissa.

Lisäksi (8 op) tavoitteena on tutustua eräiden keskeisten monimuuttujamenetelmien taustalla olevaan teoriaan.

Esitietovaatimukset

Välttämätön vaatimus on jonkin monimuuttujamenetelmiin soveltuvan tilastollisen ohjelmiston (Survo, SPSS, R, SAS tms.) itsenäinen käyttötaito. Muut esitietovaatimukset riippuvat kohderyhmästä, ts. suorituslaajuudesta (vrt. edellä):

6 op: Tilastotieteen perusopinnot (tai vastaavat tiedot), esimerkiksi Tilastotieteen johdantokurssi ja Data-analyysi.

8 op: Tilastotieteen aineopintojen pakolliset kurssit Tilastollinen päättely ja Lineaariset mallit (tai vastaavat tiedot) mukaan lukien ko. kurssien vaatimat tilastotieteen ja matematiikan (erityisesti matriisilaskennan) kurssit.

Luentoajat

Viikot 45-51 ti 8-10 Unioninkatu 35, ls ja ke 10-12 Unioninkatu 37, ls.

Harjoitukset

Kurssilla ei ole ohjattuja harjoituksia. Tehtäviä työstetään itsenäisesti ja ratkaisuja talletetaan kurssin BSCW-alueelle. Määräaikoihin mennessä palautetut ratkaisut muodostavat yhden kurssin osasuorituksista (ks. Suoritus). Ratkaisuja tarkastellaan yhdessä kurssin luentojakson lopulla.

Viikkoaikataulu

Viikko

Aiheet

Huom!

1 (45)

yleiset asiat, ohjelmat, aineistot, tehtävät, BSCW

2 (46)

faktorianalyysi mittauskehikossa

H0:ratkaisut ke

3 (47)

ryhmittelymenetelmät, erotteluanalyysi

H1:ratkaisut su

4 (48)

moniulotteinen skaalaus, korrespondenssianalyysi

H2:ratkaisut su

5 (49)

H1:tarkastelu, H2:tarkastelu

H3:ratkaisut su

6 (50)

H3:tarkastelu, verkkoposterien ohjeistus

7 (51)

kurssikoe

Ilmoittaudu

Unohditko ilmoittautua? Mitä tehdä.

Suoritus

Kurssin voi suorittaa kahdella vaihtoehtoisella tavalla:

Vaihtoehto 1 on luentokurssi, johon kuuluu 3 osasuoritusta:

  • Harjoitustehtävien ratkaisuja talletettuna määräaikoina BSCW-alueelle
  • Kurssikoe tiistaina 15.12. klo 8-10 (Unioninkatu 35, ls)
  • Verkkoposteri ryhmätyönä luentojakson jälkeen

Vaihtoehto 2 on itsenäinen suoritus, johon kuuluu 2 osasuoritusta:

  • Erilliskoe laitoksen yleistentissä luentokurssin jälkeen
  • Harjoitustyö (tarkemmat tiedot tenttiin ilmoittautumisen jälkeen)

Kurssin arvosana (1-5) muodostuu osasuoritusten arvosanojen yhdistelmästä ja edellyttää kaikkien osien hyväksyttyä suoritusta. Kurssikokeen voi tarvittaessa korvata tai uusia erilliskokeella kurssin jälkeen.

Kirjallisuus

Kurssin aiheita käsitellään luennoitsijan oppikirjassa Kyselytutkimuksen mittarit ja menetelmät (Tammi, 2008). Kirjan voi lainata mm. opiskelijakirjastosta tai kaupunginkirjastoista.

Aihepiiriltään kurssi kattaa melko tarkkaan yllä mainitun kirjan luvut 4-7 (ks. sisällysluettelo). Lukujen 2-3 sisällöt kuuluvat Tilastotieteen johdantokurssin ja Data-analyysin puolelle; kohtia 5.2-5.3 käsittelee mm. Lineaaristen mallien sovellukset. Kirjan johdannossa (s.15-16) on mainittu joukko muita suositeltavia suomenkielisiä menetelmäkirjoja. Kirjaa edeltäneestä kurssimonisteesta saattaa myös edelleen olla jotain hyötyä. Aihetta käsittelevistä verkkosivuista ainakin Yhteiskuntatieteellisen tietoarkiston ylläpitämä Menetelmäopetuksen tietovaranto on tutustumisen arvoinen.

Monimuuttujamenetelmien teoriaa (8 op) käsitteleviä kirjoja on erittäin paljon, etenkin englanniksi. Perusteellisin suomenkielinen teos on prof. Seppo Mustosen Tilastolliset monimuuttujamenetelmät, joka on luettavissa verkosta. Myös Mustosen Survo ja minä -kirja (esim. sivut 139-171) sisältää tämän kurssin asioita. Molempia teoksia löytyy kirjastoistakin.

Useimmat englanninkieliset kirjat menevät aineopintotasoa pidemmälle. Seuraavassa on joitakin oheislukemistoksi (8 op) soveltuvia yleisteoksia (osasta on uudempiakin painoksia kuin tässä mainitut, jotka ovat luennoitsijan kirjahyllystä).

  • Chatfield, Christopher & Collins, Alexander J. (1980). Introduction to Multivariate Statistics. Chapman & Hall.
  • Everitt, Brian (2005). An R and S-PLUS Companion to Multivariate Analysis. Springer.
  • Hair Jr, Joseph F.; Anderson, Rolph E.; Tatham, Ronald L. & Black, William C. (1998). Multivariate Data Analysis. Fifth Edition, Prentice Hall.
  • Johnson, Richard A. & Wichern, Dean W. (2002). Applied Multivariate Statistical Analysis, Fifth Edition, Prentice Hall.
  • Krzanowski, W. J. (2000). Principles of Multivariate Analysis. Revised Edition, Oxford University Press.
  • Raykov, Tenko & Marcoulides, George A. (2008). An Introduction to Applied Multivariate Analysis. Routledge.
  • Seber, George A. F. (2004). Multivariate Observations. Reprint of First Edition (1984). Wiley.
  • Stevens, James P. (2002). Applied Multivariate Statistics for the Social Sciences. Fourth Edition, Lawrence Erlbaum Associates, Mahwah, New Jersey.
  • Tabachnick, Barbara G. & Fidell, Linda S. (1996). Using Multivariate Statistics. Third Edition, HarperCollins.

Seuraavat ovat esimerkkejä teoksista, jotka keskittyvät vain tiettyihin menetelmiin tai tekniikoihin:

  • Cudeck, Robert & MacCallum, Robert C., eds. (2007). Factor Analysis at 100: Historical Developments and Future. Lawrence Erlbaum.
  • Greenacre, Michael (2007). Correspondence Analysis in Practice, Second Edition, Chapman & Hall/CRC.
  • Greenacre, Michael & Blasius, Jörg, eds. (2006). Multiple Correspondence Analysis and Related Methods. Chapman & Hall/CRC.
  • Gower, J. C. & Hand, D. J. (1996). Biplots. Chapman & Hall.
  • Heck, Ronald H. & Thomas, Scott L. (2009). An Introduction to Multilevel Modeling Techniques, Second Edition. Routledge.
  • Seber, George A. F. (2008). A Matrix Handbook for Statisticians. Wiley.

Aineistot

Kurssilla analysoidaan erilaisia, pääosin yhteiskunta- tai käyttäytymistieteellisiä aineistoja. Seuraavat aineistot tulevat olemaan osallistujien käytettävissä:

Myös omia tutkimusaineistoja voi hyödyntää, mikäli sellaisia on.