Surveymetodiikka, syksy 2013

Last modified by selaakso@helsinki_fi on 2024/02/07 06:41

Surveymetodiikka, syksy 2013

 

Luennoitsija

Seppo Laaksonen

Laajuus

Kurssin perussuoritus (tentti, osallistuminen harjoituksiin joissa tulee tehtyä keskeiset tehtävät jotka pääosin ehditään tekemään harjoitusten aikana) tuottaa 8 op. Osittainen suorittaminen (siis jättämällä joitain osioita väliin) on mahdollista, minimissään 4 op:n puitteissa. Tällöin tentittävän luentoihin liittyvän osuuden ja harjoitusosuuden on oltava sopivasti 'balanssissa.'

Hyvällä kirjallisella lisätyöllä opintopistemäärää voi nostaa yli 8:n; tästä sovitaan kahdenkeskisesti harjoitusten yhteydessä. Surveymetodiikka vähintään 8 op:n laajuisena on pakollinen tilastotieteen yhteiskuntatilastotieteen linjalla. Pelkän tentin arvo on 5 op. Pelkkää tenttiä ei oikeastaan kannata tehdä mutta mieluummin jokin sovittava osa kurssin aineksista ja vastaavat harjoitukset. Siten voi sopimuksen mukaan saada aikaan minkä tahansa opintopistemäärän väliltä 4-8, ja siis jos tekee vielä enemmän, niin enimmillään 10. Käytännössä on siis osallistuttava harjoituksiin vastaavan määrän kuin tenttiin. Tai oikeammin: on tehtävä tietyt harjoitukset ja niistä asianmukainen raportti, johon annetaan malli heti ensimmäisellä harjoituskerralla. Jos on paikalla, harjoitukset tulee tehtyä ja raportoitua helposti.

Look at the English text below.

Tyyppi ja itse aihe

Aine tai syventävä opinto perustutkinnossa, mutta osallistuminen on järkevää myös täydennys- tai jatko-opintomielessä, tutkimusten laadun parantamiseksi sekä itsensä yleissivistämiseksi. Olisi hyödyllinen kaikille jotka ovat tai tulevat olemaan tekemisissä surveyaineistojen kanssa. Kukaan ei ole alalla riittävän hyvä. Tämänkin kurssin opettajana uskon oppivani kurssin aikana uusia asioita. Sehän on välttämätöntä myös siksi että kyselyjen keruutavat ja muu metodiikka muuttuvat koko ajan ja aineistojen laadun kanssa on yhä enemmän ongelmia. Suurin näistä on vastauskato, joka ei joskus 30 vuotta sitten ollut paha Suomessa eikä ole tänäkään päivänä (vielä) paha esimerkiksi Etiopiassa jossa muun muassa olen ollut konsultoimassa. Uutta on tulossa myös nettikyselyjen kautta. Näitä käsitellään luonnollisestikin paljon mutta vähemmän perinteistä paperipohjaista postikyselyä. Toki kaikissa kyselytavoissa on yhteisiä piirteitä. Laatuvaatimusten tulisi olla sama keruutavasta riippumatta mutta monasti saatetaan laadusta luistaa kun käytetään keruutapaa joka ei hevin tuota hyvää laatua. 

Surveymetodiikka on kurssilla laajasti määritelty. Kysymys on metodiikasta jonka avulla kerätään hyvää dataa ihmisten tai ihmisten järjestämien mekanismien avulla koskien itse ihmisiä, heidän talouksiaan, yrityksiä ja muita yhteisöjä sekä myös vaikkapa tieliikennettä, lintuja ja luonnonilmiöitä. Dataa kerätään usein otoksilla mutta myös kokonaisaineistoa koskeva tieto vaikkapa rekistereistä käytetään hyväksi. Erilaisten operaatioiden jälkeen eri lähteistä kerätty raakadata puhdistetaan ja täydennetään sellaiseksi että sitä on hyvä käsitellä sekä laskea (estimoida) siitä kiinnostavia tuloksia. Ala on hyvin kansainvälinen ja kovassa muutosvaiheessa erityisesti siksi että netti (web, verkko) on yhä enemmän hyödynnetty tiedonkeruussa. Kurssi päättyy surveydatan perusanalyysiin josta on hyvä jatkaa analyysimenetelmien oppimista muilla kursseilla.

On hyvä huomata että kurssin aiheet ja esimerkkitilanteet sopivat myös muun kuin perinteisen surveydatan käsittelyyn. Kyse on siis mikrodatasta joka luodaan mutta tästä sitten toki muodostetaan aggregaattitason dataa mitä ovat esimerkiksi aikasarja kuluttajahinnoille tai köyhyydelle.

Esitietovaatimukset

Tilastotieteen perusteiden hallinta on välttämätöntä. Muuten kurssi pyritään pitämään metodisesti kohtuullisena jotta eri alojen surveystä kiinnostuneet opiskelijat ja tutkijat saavat siitä hyödyllistä tietoa.
Vaativasta metodiikasta kiinnostuneellekin on kurssilla aineksia, mutta tässä mielessä suositellaan muita syventäviä kursseja tai opetusaineistoja. Esimerkkejä viime ajoilta ovat: Otantamenetelmät, Otanta-aineistojen analyysi, Painotusmenetelmät surveyssä, Imputointimenetelmät, Symbolinen data-analyysi, Tilastolliset tietosuojamenetelmät ja Pienalue-estimointi. Tulevaisuudessa on ehkä kursseja Tilastollisesta editoinnista, Aineistojen yhdistämismenetelmistä, Surveyalan vaatimasta tietotekniikasta ja Lomakesuunnittelusta; jollei kurssia ole, on mahdollista tenttiä sopiva kirjallisuus josta voi sopia myös tämän kurssin puitteissa. Tämä surveymetodiikan kurssi sisältää aineksia näistä kaikista eli kurssin avulla saa kokonaiskuvan koko surveyn metodiikasta. Käsitteiden määrittely ja konkreettinen datan avulla havainnollistaminen ovat tässä mielessä hyvin tärkeitä. Onhan huomattava että aloitteleva tutkija sotkee usein asioita jos ryhtyy työhön ilman perusteiden hallintaa. Ikävää on että alkuvaiheissa tehdyt virheet kostautuvat eikä myöhemmin enää kyetä kunnollisiin korjaaviin toimenpiteisiin. Kurssin perusteiden hallinta on siten kaikille surveyn tekijöille välttämätöntä. Myös omasta mielestään asiat jo osaava tarvitsee tietojensa vankistamista. Kukaan ei hallitse näin monitieteistä alaa hyvin.

Kysy opettajalta mistä vaan kurssiin liittyen ja koska vain sähköpostilla

Luentoajat

Luennot joihin sisältyy myös keskusteluja pidetään I. opintojaksolla, ja keskustakampuksen P673:ssä (Porthania), keskiviikkoisin klo 16-19 alkaen 4.9. ja jatkuen 9.10 asti.  

Harjoitukset: Voit valita jomman kumman tai molemmat seuraavista kahdesta: ( i) Torstaisin klo 12-14 Keskustakampuksen Aleksandrian luokassa K130 tai (ii) Maanantaisin klo 16-18 Kumpulan Exactumissa C128. Molemmat alkavat luentojen alkamisen jälkeisinä torstaina ja maanantaina, ja jatkuvat niin kauan kuin on luentoja.

Harjoituksia konkretisoidaan tilastollisilla ohjelmistoilla.  Koska näitä on paljon, ei kaikkia voida harjoituksissa tukea, mutta kahta ohjelmistoa tuetaan, eli SPSS (tai sen erilaiset muut nimikkeet) ja  SAS. Opiskelija voi valita kumpaa haluaa käyttää, mutta toki molempiakin saa käyttää. Yleensä SPSS on ollut yleisin. Olisi hyvä, jos mukana olijalla olisi siis jonkinlainen perustuntuma jomman kumman ta molempien käytöstä. Lisää opitaan sitten harjoituksissa, joissa aluksi käytetään ESS-aineistoa (ESS = European Social Survey) ja myöhemmin OECD:n koulusaavutus- ja asennetutkimusta PISAa. Joissain kohdin voidaan käyttää myös EXCELiä. Lähetäm rekisteröityneille sähköpostilla harjoitustehtävät ennen harjoituksia. Ekadatan kukin on kerännyt itse ESS-sivulta mutta toinen data toisen harjoituksen lopuksi saadaan tästä. Se on sekä SPSS että SAS muodossa ja zipattuna mutta se aukeaa vain klikkaamalla.

PISA_data Zipattuna SAS ja SPSS jossa kaksi vaihtoehtoa

Asetan tänne materiaalia mutta iso osa on kirjastani jonka imurointiosoitteen saat klikkaamalla kotisivuani tämän sivun yläosasta. Olisi mukava jos ainakin päällisin puolin lukisit etukäteen kaksi ensimmäistä liitettä. Niitä toki käsitellään myös luennoilla, osaa jo heti enimmäisellä. Ne sisältävät perustietoa tilastotieteestä ja kurssin esimerkkiaineistoista. Ensimmäisellä kerralla käydään läpi myös surveyn peruskäsitteitä joiden ymmärtäminen varmennetaan harjoituksissa.

Tässä on johdanto-osa. Tämän jälkeen käytämme paljon kirjaani. Toki muutakin materiaalia tulee tilanteen mukaan:

https://wiki.helsinki.fi/download/attachments/114918239/Surveymetodiikka_johdanto_2013.pdf?api=v2

Karkea aikataulu viikottain:

  1. Johdanto, peruskäsitteet ja asteikko- ja muunnosliite
  2. Lomakesuunnittelu ja keruuvälineet, otannan perusperiaatteet
  3. Otannan keskeisiä laskentasääntöjä, asetelmapainot ja peruspainot
  4. Ryvästyminen, puuttuneisuus ja otoskoko, Puolan otantaesimerkki
  5. Perusperiaatteet surveyanalyysista, Vierailijana Teemu Kemppainen: 'innovatiivinen otantaesimerkki.'
  6. Tilastollinen editointi, uudelleen painotus ja imputointi. Tässä on pieni johdanto imputointiin mutta kirjassa on kaikki tarkemmin kuten muistakin osan 6 asioista.

 

Ohessa on kalvopaketti jossa on esimerkki otantatiedostosta ja sen käytöstä otospainon muodostamiseksi. Sitä katsotaan ainakin kahdella eri kerralla koska liittyy sekä otantaan että painotukseen. Esimerkki on Puolan ESS:n kuudennelta kierrokselta eli vuodelta 2013.

Avaa tästä

Keskiviikkona 2.10. katsomme kahta asiaa toisaalta kirjan Analyysiluvun ja toisaalta oheisen liitteen kautta.  Tämä kannattaa katsoa myös viimeisten harjoitusten ymmärtämisen takia.

 

English

This course is the substantially extended version of Part I of the course 'Topics in Social Statistics'. Since the basic course material is available in Finnish (look at my website where you will find the link to my survey methodology book = Surveymetodiikka written in Finnish but the last annex gives the vocabulary from Finnish into English. I do not know how much can be presented in English, but course training can be given in English when discussing mutually. So, do not hesitate to registrate yourself if you are not good in Finnish. Examples are almost all based on international survey data and meta data are there in English.

There are currently some reasonable English textbooks on survey methodology. The coverage of my course is broader. Here are some textbooks which you can use in the exam but note that how much and which chapters, this should be agreed in a mutual discussion enough before the exam time:

- International Handbook of Survey Methodology by Edith D. de Leeuw (Editor), Joop Hox (Editor), Don Dillman (Editor): This book is focused on questionnaire designing and survey modes but there are basics on sampling, handling missingness, a little bit imputation etc. For example editing is missing and principles of survey data analysis. Nonresponse adjustments are poor. Sampling designing is not either rich. Also transformations etc. basics on survey data handling are about missing. It is not very pedagogical, that is, not easy for a beginners.

- Applied survey methods: a statistical perspective by Jelke G. Bethlehem. John Wiley and Sons, 2009 - 375 pages.

A complete, hands-on guide to the use of statistical methods for obtaining reliable and practical survey research. Applied Survey Methods provides a comprehensive outline of the complete survey process, from design to publication. Filling a gap in the current literature, this one-of-a-kind book describes both the theory and practical applications of survey research with an emphasis on the statistical aspects of survey methods. This is more pedagogica than the two former ones. Still some basics like editing is missing, imputation is old-fashioned.

In general, as far as an exam is concerned, the first two ones are too large to replace my course material. Hence, some chapters can be excluded but with the agreement with me (Seppo). The third one can about be included in the exam. Note however, that the content is not exactly the same in any case with my course. Most important is to understand survey methodology issues enough well and this requirement will be satisfied with each of these three books.

 Ilmoittaudu

Unohditko ilmoittautua? Lähetä meilillä nimesi, opiskelijanumerosi ja mille kurssille haluaisit päästä osoitteeseen johanna.hyytiainen(a)helsinki.fi.

Did you forget to register? Send your name, student number and the course you wish to participate in  to the address johanna.hyytiainen(a)helsinki.fi.

Koe

Pidetään viikon kuluttua viimeisestä luennosta eli keskiviikkona 16.10. klo 16-19, paikka PR sl 5.

Kokeeseen tulee ilmoittautua viimeistään 12.10. Jos olet myöhässä laita viesti: jaana.lehtinen@helsinki.fi

Myöhemmin tenttiä voi yleistenteissä.