Surveymetodiikka (Survey methodology), syksy 2012

Last modified by selaakso@helsinki_fi on 2024/02/07 06:41

Surveymetodiikka (Survey methodology), syksy 2012

Luennoitsija

Seppo Laaksonen

Laajuus

Kurssin perussuoritus (tentti, osallistuminen harjoituksiin joissa tulee tehtyä keskeiset tehtävät jotka pääosin ehditään tekemään harjoituksissa) tuottaa 8 op. Osittainen suorittaminen (siis jättämällä joitain osioita väliin) on mahdollista, minimissään 4 op:n puitteissa. Hyvällä kirjallisella lisätyöllä opintopistemäärää voi nostaa yli 8:n. Surveymetodiikka vähintään 8 op:n laajuisena on pakollinen tilastotieteen yhteiskuntatilastotieteen linjalla. Pelkän tentin arvo on 5 op. Pelkkää tenttiä ei oikeastaan kannata tehdä mutta mieluummin jokin sovittava osa kurssin aineksista ja vastaavat harjoitukset. Siten voi sopimuksen mukaan saada aikaan minkä tahansa opintopistemäärän väliltä 4-8, ja siis jos tekee vielä enemmän, niin enimmillään 10.

Look at the English text below.

Tyyppi ja itse aihe

Aine tai syventävä opinto perustutkinnossa, mutta osallistuminen on järkevää myös täydennys- tai jatko-opintomielessä, tutkimusten laadun parantamiseksi sekä itsensä yleissivistämiseksi. Olisi hyödyllinen kaikille jotka ovat tai tulevat olemaan tekemisissä surveyaineistojen kanssa. Kukaan ei ole alalla riittävän hyvä. Tämänkin kurssin opettajana uskon oppivani kurssin aikana uusia asioita. Sehän on välttämätöntä myös siksi että kyselyjen keruutavat muuttuvat koko ajan ja aineistojen laadun kanssa on yhä enemmän ongelmia. Suurin näistä on vastauskato, joka ei joskus 30 vuotta sitten ollut paha Suomessa eikä ole tänäkään päivänä (vielä) paha esimerkiksi Etiopiassa jossa muun muassa olen ollut konsultoimassa.

Surveymetodiikka on kurssilla laajasti määritelty. Kysymys on metodiikasta jonka avulla kerätään hyvää dataa ihmisten tai ihmisten järjestämien mekanismien avulla koskien itse ihmisiä, heidän talouksiaan, yrityksiä ja muita yhteisöjä sekä myös vaikkapa tieliikennettä, lintuja, luonnonilmiöitä. Dataa kerätään usein otoksilla mutta myös kokonaisaineistoa koskeva tieto vaikkapa rekistereistä käytetään hyväksi. Erilaisten operaatioiden jälkeen eri lähteistä kerätty raakadata puhdistetaan ja täydennetään sellaiseksi että sitä on hyvä käsitellä sekä laskea (estimoida) siitä kiinnostavia tuloksia. Ala on hyvin kansainvälinen ja kovassa muutosvaiheessa erityisesti siksi että netti (web, verkko) on yhä enemmän hyödynnetty tiedonkeruussa. Kurssi päättyy surveydatan perusanalyysiin josta on hyvä jatkaa analyysimenetelmien oppimista muilla kursseilla. _On hyvä huomata että kurssin aiheet ja esimerkkitilanteet sopivat myös muun kuin perinteisen surveydatan käsittelyyn. Kyse on siis mikrodatasta joka luodaan mutta tästä sitten toki muodostetaan aggregaattitason dataa mitä ovat esimerkiksi aikasarja kuluttajahinnoille tai köyhyydelle. _

Esitietovaatimukset

Tilastotieteen perusteiden hallinta on välttämätöntä. Muuten kurssi pyritään pitämään metodisesti kohtuullisena jotta eri alojen surveystä kiinnostuneet opiskelijat ja tutkijat saavat siitä hyödyllistä tietoa.
Vaativasta metodiikasta kiinnostuneellekin on kurssilla aineksia, mutta tässä mielessä suositellaan muita syventäviä kursseja tai opetusaineistoja. Esimerkkejä viime ajoilta ovat: Otantamenetelmät, Otanta-aineistojen analyysi, Painotusmenetelmät surveyssä, Imputointimenetelmät, Symbolinen data-analyysi, Tilastolliset tietosuojamenetelmät ja Pienalue-estimointi. Tulevaisuudessa on ehkä kursseja Tilastollisesta editoinnista, Aineistojen yhdistämismenetelmistä, Surveyalan vaatimasta tietotekniikasta ja Lomakesuunnittelusta; jollei kurssia ole, on mahdollista tenttiä sopiva kirjallisuus josta voi sopia myös tämän kurssin puitteissa. Tämä surveymetodiikan kurssi sisältää aineksia näistä kaikista eli kurssin avulla saa kokonaiskuvan koko surveyn metodiikasta. Käsitteiden määrittely ja konkreettinen datan avulla havainnollistaminen ovat tässä mielessä hyvin tärkeitä. Onhan huomattava että aloitteleva tutkija sotkee usein asioita jos ryhtyy työhön ilman perusteiden hallintaa. Ikävää on että alkuvaiheissa tehdyt virheet kostautuvat eikä myöhemmin enää kyetä kunnollisiin korjaaviin toimenpiteisiin. Kurssin perusteiden hallinta on siten kaikille surveyn tekijöille välttämätöntä. Myös omasta mielestään asiat jo osaava tarvitsee tietojensa vankistamista. Kukaan ei hallitse näin monitieteistä alaa hyvin.

Hyödyksi on jos on SAS ja/tai SPSS hallinnassa mutta näitä myös opetetaan. Lisäksi on mahdollista osallistua johdatuskurssille Tilastotieteilijän SAS-työkalut. Katso erillinen opetusohjelman kohta.

Kysy opettajalta mistä vaan kurssiin liittyen ja koska vain sähköpostilla

Luentoajat

Luennot joihin sisältyy myös keskusteluja pidetään I. opintojaksolla, ja keskustakampuksella, keskiviikkoisin klo 16-19 alkaen 12.9. ja jatkuen 17.10 asti. Paikka on P673 (Porthanian kuudes kerros). 

Vastaavasti harjoitukset pidetään torstaisin joko klo 12-14 tai 16-18 kunkin halun mukaan; eikä ole kiellettyä osallistua vaikkapa molempiin. Näyttää siltä että ilmoittautumisia on paljon, mistä syystä voi harjoitustiloissa olla tungosta. Yritetään sovitella ne parhain päin.

Keskipäivän harjoituspaikka on  Aleksandria K131, mutta viimeisellä kerralla eli 18.10. klo 12-14 SSKH, IT-sal. Klo 16 alkavat harjoitukset ovat sen sijaan Kumpulan Exactumisssa mikroluokassa C128. Harjoitukset alkavat 13.9. Poikkeus on ensimmäinen Kumpula-harjoitus joka on vasta maanantaina klo 16-18. Alussa keskitytään tarkistamaan se, että kukin onnistuu selviämään jollain tavalla joko SAS:lla tai SPSS:llä tai molemmilla. Muiden ohjelmistojen käytön tukea ei ole varsinaisesti mutta toki niitä voi käyttää, joskin muutamat rajoitteet niissä ovat ilmeisiä. Exceliä toki voi olla hyvä käyttää tilasto-ohjelmistojen ohessa muuntamalla vaikkapa SAS-tiedosto Exceliksi.

Pidän erityistilaisuuden kokeisiin valmistautumisesta jossa voi kysyä kaikesta kurssiin ja kokeisiin liittyen ja toki kerron perusasioista itsekin. Myös harjoituksiin liittyviä aiheita voidaan ottaa esille. TILAISUUS on samassa paikassa Porthaniassa kuin luennotkin ja aika on maanantai 29.10. klo 16-18. TERVETULOA leppoisaan tilaisuuteen.

Kokeet

Kurssikoe pidetään keskiviikkona 31.10 klo 16-19, paikkana  PR, AUD XII.

Ilmoittaudu tenttiin 29.10. mennessä.

Myöhemmin voi tenttiä yleistenteissä.

Kirjallisuus

Kirjoittamani nettikirja Surveymetodiikka on oleva perusaineisto. Sen saa imuroitua pari tietoa itsestään ilmoittamalla Bookboonin sivustolta. Katso kotisivultani klikkaamalla nimeäni. Kirja on hyvin laaja enkä jokaista yksityiskohtaa käsittele kurssilla. Jokaisesta luvusta (10 kpl) plus liitteistä jotkin ydinasiat sisältyvät kurssiin ja/tai harjoituksiin. Toisaalta on huomattava että esimerkit elävät (maailman)tilanteen mukaan. Eli etukäteen en itsekään tarkasti tiedä mitä uusia ja kiinnostavai esimerkkejä tulee mukaan. Kaksi laajempaa esimerkkiä tulee melko varmasti mukaan: information Etiopian (kehitysmaan) otanta-asetelma ja käytännön tiedonkeruu, (ii) puoluekannatusgalluppien metodiikka, käyttäen myös TNS Gallupin dataa ennen viime eduskuntavaaleja. Uutena isompana esimerkkinä on myös ruutuaineiston käyttö otannassa. Tästä löydät Etiopian tarinan:

https://wiki.helsinki.fi/download/attachments/87963523/Ethiopia_hy_2012.pdf

Vastaavasti tässä on konkreettinen tarina puoluekannatuksen mittaamisesta 2011.

https://wiki.helsinki.fi/download/attachments/87963523/TNS_Gallup_SMT_2012.pdf

Tässä ensimmäisen kerran materiaali jossa mainitaan myös kirjani olevan materiaalina. Niin on jatkossakin.

https://wiki.helsinki.fi/download/attachments/87963523/SMT_2012_A.pdf

Toinen osio on tässä. Mukana on paljon kirjan aineksia mutta myös hieman uusia asioita. Tämän jälkeen taas käytetään enemmän kirjaa.

https://wiki.helsinki.fi/download/attachments/87963523/SMT_2012_B.pdf

Harjoituksissa käytämme varmasti kahta laajaa kansainvälistä netistä saatavaa aineistoa eli ESS:ää (Europeansocialsurvey.org) ja Pisaa eli OECD:n kansainvälistä koulusaavutustutkimusta jossa on sekä tuloksia oppilaiden koulusaavutuksista että kiintoisia surveykysymysvastauksia. Tässä on siis kahdenlaisen survey-aineiston kombinaatio, mikä on yleistä myös muun muassa terveystutkimuksissa joissa on haastatteluja erilaisten kliinisten tutkimusten ohella. PISA datan olen valmiiksi kasannut käyttöön, tietysti alkuperäisestä paljon supistettuna. Avaa tästä: http://wiki.helsinki.fi/download/attachments/87963523/Pisa_2009.zip

E English

This course is the substantially extended version of Part I of the course 'Topics in Social Statistics'. Since the basic course material is available in Finnish (look at my website where you will find the link to my survey methodology book = Surveymetodiikka written in Finnish but the last annex gives the vocabulary from Finnish into English. So, it is possible to present something in English, and of course training can be given in English when discussing mutually. So, do not hesitate to registrate yourself if you are not good in Finnish. Examples are almost all based on international survey data and meta data are there in English.

There are currently some reasonable English textbooks on survey methodology. The coverage of my course is broader. Here are some textbooks which you can use in the exam but note that how much and which chapters, this should be agreed in a mutual discussion enough before the exam time:

- International Handbook of Survey Methodology by Edith D. de Leeuw (Editor), Joop Hox (Editor), Don Dillman (Editor): This book is focused on questionnaire designing and survey modes but there are basics on sampling, handling missingness, a little bit imputation etc. For example editing is missing and principles of survey data analysis. Nonresponse adjustments are poor. Sampling designing is not either rich. Also transformations etc. basics on survey data handling are about missing. It is not very pedagogical, that is, not easy for a beginners.

- Applied survey methods: a statistical perspective by Jelke G. Bethlehem. John Wiley and Sons, 2009 - 375 pages.

A complete, hands-on guide to the use of statistical methods for obtaining reliable and practical survey research. Applied Survey Methods provides a comprehensive outline of the complete survey process, from design to publication. Filling a gap in the current literature, this one-of-a-kind book describes both the theory and practical applications of survey research with an emphasis on the statistical aspects of survey methods. This is more pedagogica than the two former ones. Still some basics like editing is missing, imputation is old-fashioned.

In general, as far as an exam is concerned, the first two ones are too large to replace my course material. Hence, some chapters can be excluded but with the agreement with me (Seppo). The third one can about be included in the exam. Note however, that the content is not exactly the same in any case with my course. Most important is to understand survey methodology issues enough well and this requirement will be satisfied with each of these three books.