Painotusmenetelmät surveyssä/Weighting Methods in Surveys), kevät 2016

Last modified by selaakso@helsinki_fi on 2024/02/07 06:39

Painotusmenetelmät surveyssä (Weighting Methods in Surveys), kevät 2016

Luennoitsija

Seppo Laaksonen

Laajuus

4-6 op. Tentin suoritus ja kaikkien harjoitusten perustekeminen tuottaa 5 op; suppeampi harjoitusmäärä 4 op ja isompi 6 op.

 

Tyyppi

Tämä on perusluonteeltaan syventävä kurssi mutta voidaan käyttää myös aineopinnoissa. Kurssi on hyödyllinen myös jatko-opiskelijoille ja tutkijoille ml. professoreille eli kaikille jotka tuottavat tai käsittelevät surveyaineistoja. Valitettavan usein painotus laiminlyödään surveyssä, tai sitten tehdään huonosti. Siis kurssin tarkoitus on oppia miten painot tehdään hyvin ja miten painoja käytetään erilaisissa tilanteissa.

Sisällöstä

Aloitamme otannan peruskäsitteiden kertauksella, Tällöin tulee esille tärkeä käsite sisältymistodennäköisyys, josta painottaminen alkaa. Harjoittelemme yksinkertaisten ja hankalampien sisältymistodennäköisyyksien kanssa. Nämä tehdään brutto-otokselle. Jatkossa brutto-otokselle ei kuitenkaan saada havaintoja koska vastauskatoa on ja ylipeittokin vaikuttaa. Tarvitsemme siis varsinaiset painot vastaajille ja tähän sitten ryhdymme. Aluksi yksinkertaisten, myöhemmin monimutkaisempien painojen kanssa. Kaikkea harjoitellaan mahdollisimman oikeilla datoilla. Pääosa painoista tehdään poikkileikkausdatalle, mutta niiden muunnelmilla päästään myös pitkittäispainoihin. Painoja voi olla myös muita kuin otospohjaisia jolloin esimerkiksi tilastoyksikön merkittävyys on painossa mukana. Näitä tilanteita käsitellään hieman. Kiinnostava lisäpiirre on myös se, että aineisto on kaksitasoinen, kuten sisältäen yksilöitä ja kotitalouksia. Ei ole aina itsestään selvää, mikä on oikeanlainen paino tällaisessa tilanteessa. On otettava huomioon myös miten otos on poimittu. Totean heti tässä myös, että vaikka aineisto ei olisi otos vaan kokonaistutkimus, ja vastauskatoa esiintyy, niin painotus on tarpeen jos tuloksia halutaan yleistää tavoiteperusjoukon tasolle. Toisaalta kaikkea voi laskeskella ilman painoja ellei ole mitään yleistystavoitetta.

Ajoitus

Kurssi pidetään Kumpulan Exactumin mikroluokassa C128 keskiviikkoisin klo 16-19 jossa voidaan myös harjoitella kaikkea. Aloitus on 22.1. ja siitä jatketaan viitenä peräkkäisenä keskiviikkona eteenpäin. Viimeinen kerta on siis 26.2.

Koska tilaisuudet ovat mikroluokassa, on helppo harjoitella oppiainesta saman tien. Pääohjelma on SAS jota käytämme yhdessä osassa varmasti, koska kalibroinnin pohjamakro on tehty SAS:lla. Alkuvaiheen harjoittelua voidaan tehdä myös SPSS:llä. Perustuntuma SAS:n käyttöön olisi hyvä joka tapauksessa. Siis esimerkiksi SAS-tiedoston olemus, miten voidaan tehdä datakäskyllä vaikkapa uusia muuttujia ja joidenkin yksinkertaisten tulosteiden tekeminen. Mallit pidemmälle meneviin koodeihin annetaan. Eli sinun ei tarvitse muuta kuin laittaa ohjelmaan omat muuttujasi ja uusille muuttujille ja tiedostoille sopivat nimet ja muuta vastaavaa, ja laittaa loppuun 'run;' mikä hoitaa pyytämäsi asiat. Perus-SAS tulee tutuksi jo sisältymistodennköisyyksien käytössä. Käytettävät aineistot ovat niin todellisia kuin mahdollista eli muodostettu todellisista. Aluksi kaikilla on samat datat, kun tehdään yksinkertaiset painot ja sitten hieman hankalammat. Loppuosa harjoituksista tehdään kullekin räätälöidyllä datalla; rakenteeltaan datat ovat samanlaisia mutteivat sisällöltään. 

English

This course is on weighting methods in surveys. Basic material will be available in English but also in Finnish. Mutual discussion in training may be in English as well. The course will be in a computer class of Exactum. This means that there will be some computer training in each course event. I would prefer to use SAS but something can be made via SPSS too. I will give the key SAS codes for everyone. Hence you do not need to be any SAS expert in advance. But the SAS basics are good to understand, such as the file format, the data creation, the data transformation idea, the basics of the SAS procedures. It is good tell in advance if you do not understand well Finnish.  

The agenda includes

  • Inclusion probabilities
  • Sampling design
  • Sampling data file
  • Simple weights with simple data
  • More demanding weights with more complex data
  • From design weights through basic weights toward more advanced weights
  • Including post-stratified weights, response propensity weights, calibration weights and the combination of the last two ones; training using an own data file (structure is equal to all)
  • Some examples of using weights for estimation

Materiaalia Course material

Pdf slides:

The complete English version here:

Below you will find the SAS codes for the data1_a. The second data codes are first tried to do following the first model.This code Word includes also the instruction for the training reporting.

Tässä on ekadataan sopivat SAS_koodit. Toisen datan koodeja yritetään ensin tehdä ekadatan pohjalta. Tuossa kooditiedostossa on lopussa myös raportoinnin malli. Kannattaa katsoa ja luoda pohja vaikka heti.

Tässä ovat data1_b:n SAS-koodit. Here are the SAS codes of data1_b. The SAS data1_b is basically the same as data1_c but this includes the two additional variables. Siis tuota data1_c:tä voi käyttää myös data1_b:n harjoituksessa. Laitan tähän kuitenkin suppeamman version eli data1_b:n.

kolme astetta (three stages)

data2   

This data are considered after data1_a and data1_b. Next we will have data1_c that is from the same basis as the other data1's. Data1_c tässä.

Now you can find this data set for post-stratification trainingSAS_Codes_1c.docx

 

As soon as we have prepared the weights for these data sets, everyone will get her/his own data set to prepare the last weights. 

Kunhan kolmesta data1'sta ja yhdestä data2'sta on tehty otospainot, vastaan tulee kullekin oma data johon tehdään loput painot. Sitten voimme olla tyytyväisiä. Toki nämä omat data ovat samanlaisia kaikilla rakenteeltaan. 

SAS-koodit data2:lle SAS Codes for the DATA2

tässä

Viimeisen kurssidatan kuvaus on lähetty spostitse rekistreröityneille. Pyydä oma datasi Sepolta. Sen lisäksi käymme Kalibrointipainotuksen CALMAR 2:lla. Jos joku haluaa perehtyä sen taustamateriaaliin, niin ohessa on selostus.

  CALMAR 2 Description in English is here. This will not be considerded in the course in details.

Ilmoittaudu täällä.https://weboodi.helsinki.fi/hy/opettaptied.jsp?html=1&OpetTap=&Kieli=1

Myöhästyitkö ilmoittautumisesta? Kirjoita sähköpostia osoitteeseen saija.pyhaniemi[at]helsinki.fi.