Survey-metodiikka, syksy 2010

Last modified by selaakso@helsinki_fi on 2024/03/27 10:10

Surveymetodiikka, syksy 2010

Luennoitsija

Seppo Laaksonen

Laajuus

Kurssin perussuoritus (tentti, osallistuminen harjoituksiin) tuottaa 8 op. Osittainen suorittaminen (siis jättämällä joitain osioita väliin) on mahdollista, minimissään 4 op:n puitteissa. Hyvällä kirjallisella lisätyöllä opintopistemäärää voi nostaa yli 8:n. Surveymetodiikka vähintään 8 op:n laajuisena on pakollinen tilastotieteen yhteiskuntatilastotieteen linjalla.

Tyyppi ja itse aihe

Aine tai syventävä opinto perustutkinnossa, mutta osallistuminen on järkevää myös täydennys- tai jatko-opintomielessä, tutkimusten laadun parantamiseksi sekä itsensä yleissivistämiseksi. Olisi hyödyllinen kaikille jotka ovat tai tulevat olemaan tekemisissä surveyaineistojen kanssa. Kukaan ei ole alalla riittävän hyvä. Tämänkin kurssin opettajana uskon oppivani kurssin aikana uusia asioita. Sehän on välttämätöntä myös siksi että kyselyjen keruutavat muuttuvat koko ajan ja aineistojen laadun kanssa on yhä enemmän ongelmia. Suurin näistä on vastauskato, joka ei joskus 30 vuotta sitten ollut paha Suomessa eikä ole tänäkään päivänä (vielä) paha esimerkiksi Etiopiassa jossa muun muassa olen ollut konsultoimassa.  

Surveymetodiikka on kurssilla laajasti määritelty. Kysymys on metodiikasta jonka avulla kerätään hyvää dataa ihmisten tai ihmisten järjestämien mekanismien avulla koskien itse ihmisiä, heidän talouksiaan, yrityksiä ja muita yhteisöjä sekä myös vaikkapa tieliikennettä, lintuja, luonnonilmiöitä. Dataa kerätään usein otoksilla mutta myös kokonaisaineistoa koskéva tieto vaikkapa rekistereistä käytetään hyväksi. Erilaisten operaatioiden jälkeen eri lähteistä kerätty raakadata puhdistetaan ja täydennetään sellaiseksi että sitä on hyvä käsitellä eli estimoida siitä kiinnostavia tuloksia. Ala on hyvin kansainvälinen ja kovassa muutosvaiheessa erityisesti siksi että netti (web, verkko) on yhä enemmän hyödynnetty tiedonkeruussa. Kurssi päättyy perusanalyysiin josta on hyvä jatkaa analyysimenetelmien oppimista muilla kursseilla. On hyvä huomata että kurssin aiheet ja esimerkkitilanteet sopivat myös muun kuin perinteisen surveydatan käsittelyyn. Kyse on siis mikrodatasta joka luodaan mutta tästä sitten toki muodostetaan aggregaattitason dataa mitä on esimerkiksi aikasarja kuluttajahinnoille tai köyhyydelle.  

Esitietovaatimukset

Tilastotieteen perusteiden hallinta on välttämätöntä. Muuten kurssi pyritään pitämään metodisesti kohtuullisena jotta eri alojen surveystä kiinnostuneet opiskelijat ja tutkijat saavat siitä hyödyllistä tietoa.
 Vaativasta metodiikasta kiinnostuneellekin on kurssilla aineksia, mutta tässä mielessä suositellaan muita syventäviä kursseja tai opetusaineistoja. Esimerkkejä viime ajoilta ovat: Otantamenetelmät, Otanta-aineistojen analyysi, Painotusmenetelmät, Imputointimenetelmät, Symbolinen data-analyysi, Tilastolliset tietosuojamenetelmät ja Pienalue-estimointi. Tulevaisuudessa on suunniteilla kursseja Tilastollisesta editoinnista, Aineistojen yhdistämismenetelmistä, Surveyalan vaatimasta tietotekniikasta  ja Lomakesuunnittelusta. Tämä surveymetodiikan kurssi sisältää aineksia näistä kaikista eli kurssin avulla saa kokonaiskuvan koko surveyn metodiikasta. Käsitteiden määrittely ja konkreettinen datan avulla havainnollistaminen ovat tässä mielessä hyvin tärkeitä. Onhan huomattava että aloitteleva tutkija sotkee usein asioita jos ryhtyy työhön ilman perusteiden hallintaa. Ikävää on että alkuvaiheissa tehdyt virheet kostautuvat eikä myöhemmin enää kyetä kunnollisiin korjaaviin toimenpiteisiin. Kurssin perusteiden hallinta on siten kaikille surveyn tekijöille välttämätöntä. Myös omasta mielestään asiat jo osaava tarvitsee tietojensa vankistamista. Kukaan ei hallitse näin monitieteistä alaa hyvin. 

Hyödyksi on jos on SAS ja/tai SPSS hallinnassa mutta näitä myös opetetaan. Lisäksi on mahdollista osallistua johdatuskurssille Tilastotieteilijän SAS-työkalut viikolla 36.

Kysy opettajalta mistä vaan kurssiin liittyen ja koska vain sähköpostilla

Luentoajat

Luennot joihin sisältyy myös keskusteluja pidetään I opintojaksolla keskustakampuksella seuraavasti:

MA 13.09.2010 16:00-19:00 PÄÄRAKENNUS AUD IX

KE 15.09.2010 16:00-19:00 PÄÄRAKENNUS AUD IX

MA 20.09.2010 16:00-19:00 PÄÄRAKENNUS AUD XVI

KE 22.09.2010 16:00-19:00 PÄÄRAKENNUS AUD IX

MA 27.09.2010 16:00-19:00 PÄÄRAKENNUS AUD XI

KE 29.09.2010 16:00-19:00 PÄÄRAKENNUS SALI 15

MA 11.10.2010 16:00-19:00 PÄÄRAKENNUS AUD III

KE 13.10.2010 16:00-19:00 PÄÄRAKENNUS AUD III

Kuten havaitset kolmen viikon jälkeen on tauko jona aikana on mahdollisuus omakohtaiseen harjoitteluun annettujen tehtävien puitteissa. On mahdollista että koko luentoaika-arsenaalia ei ihan tarvita mutta se riippuu siitä miten asioissa edetään. Huom. Kaksi viimeistä luentoaikaa ovat siirtyneet aikaisemmiksi 2.9.

Houkuttelen muutaman vierailijan esittämään keskeisiä asioita omasta surveytutkimukseen liittyvästä alastaan. Yksi vierailija on Liisa Korkalo on luvannut kertoa Mosambikin terveys- ja elinolotutkimuksesta 15-18 -vuotiaille tytöille. Aineisto on kerätty kahteen otteeseen vuonna 2010; mukana lähes 10 suomalaista tutkijaa (ml. graduntekijää) Viikistä.  Keruu on monipuolisin mitä olen nähnyt. Otantakin on ollut omanlaisensa, ei ollenkaan helppo käytännössä vaikka teoria on olemassa. Esityksen sovittu ajankohta on ke 29.9. klo 16.15. Kestää keskusteluineen noin tunnin.

Lokakuun 11. päivänä on taas Antti Pelanterin esitys haastattelijavaikutuksesta. Siksi luennoilla nämä kohdat jätetään väliin.  Viimeisellä kerralla 13.10. Marjukka Vartiainen kertoo aineiston edustavuudesta. Kumpikin näistä erityisesityksistä alkaa aika alussa eli viimeistään 16.30. Kesto on noin puoli tuntia.

Olen varannut harjoitteluaikoja tiistaiksi klo 12-14 ja 16-18 Exactumista C128; nämä jatkuvat siten että viimeinen päivä on 12.10. Jompaan kumpaan osallistuminen kohtuullisesti on hyödyllistä. Ensimmäiseen harjoitukseen ei ole erityistä syytä tulla jos hallitsee joko SAS:ia tai SPSS:ää kohtuullisesti, koska tällöin on näiden ohjelmistojen perusharjoittelua.  Harjoituksissa ei mennä ohjelmointiteknisesti pitkälle. Pääpaino on saada aito käsitys aidosta surveydatasta, sen ominaisuuksista ja siitä miten sieltä saa tuloksia irti. Ainakin European Social Survey (ESS) datoja (maksimissaan vuosilta 2002-2009) on käytössä mukaan lukien sen otantatiedostoja (vuosilta 2008-2010) muutamasta maasta. Lisäksi tulee esille eurooppalaisen uhritutkimuksen Suomen aineisto joka on vuosina 2009-2010 koottu kolmella eri keruutavalla eli käyntihaastatteluin, puhelimitse ja verkoitse. Esimerkkejä otetaan myös OECD:n PISA-aineistosta. Myös yritysaineistosta annetaan kuva.

Ensimmäiseen harjoitukseen on ohesta imuroitavissa oleva ESS-datan supistelma. Tätä käytetään myös ohjelmistoon perehtymisessä. Se on SAS-muodossa mutta SPSS lukee sen ilman vaikeuksia.

https://wiki.helsinki.fi/download/attachments/59060315/HY_SMT_2010.zip

Tuota käytetään myös toisessa harjoittelussa, mutta sen lopussa aloitetaan seuraavan datan katselu mitä täydennetään kolmannessa harjoittelussa. Tämä on vaihteeksi SPSS-muodossa mutta voit avata sen SAS-muodossa. Kyseessä on osa PISA_2006 -aineistosta.

https://wiki.helsinki.fi/download/attachments/59060315/HY_2010.zip

Kokeet

Ensimmäinen tilaisuus

MA 18.10.2010 16:00-19:00 PORTHANIA P674

Kirjallisuus

TÄSSÄ ON LUKEMISTA JOSTA OSA ON HYÖDYLLISTÄ ORIENTOINNIN KANNALTA JA OSIN TUTTUA. Osa vaatii kurssin osioita.

https://wiki.helsinki.fi/download/attachments/59060315/SMT+Liite.pdf

Tässä on kurssilla käytettävistä surveystä yleiskuvaus. Yksityiskohtia tulee esille siellä täällä:

https://wiki.helsinki.fi/download/attachments/59060315/EsimerkkiSURVEYT.pdf

Molempia yllä olevista liitteistä käsitellään heti ensimmäisellä tapaamisella 13.9. 

Ohessa on kurssin termejä suomeksi ja englanniksi, ei pdf:nä. Voi lajitella termit myös englanninkieliseen järjestykseen. Terms in Finnish and English, sorted by Finnish but you can change the order.

https://wiki.helsinki.fi/download/attachments/59060315/Sanastoliite.docx

Ilmoittaudu

Unohditko ilmoittautua? Mitä tehdä.