Imputointimenetelmät (Imputation methods), kevät 2013

Last modified by matl_www@helsinki_fi on 2024/02/13 07:32

Imputointimenetelmät (Imputation methods), kevät 2013

Luennoitsija

Seppo Laaksonen

Laajuus

4-6 op.

Jos suorittaa tentin ja tekee kurssin aikaiset harjoitukset, niin ansaitsee 4 op. Ylimääräisistä suorituksista lisää maksimissaan 2 op.

Pure exam and the basic computer class training: 4 points

Additional imputation tasks, maximally 2 more points. . 

Tyyppi

On perusluonteeltaan syventävä opintojakso koskien sekä maisteriopintoja että jatko-opintoja, mutta esteitä ei ole käyttää sitä aineopinnoissa tai survey- tms. alaa koskevan tutkimuksen edistämisessä. Toki kurssilla on myös yleissivistävä luonne. Rohkeasti mukaan vaan.

Kysehän on puuttuvan tai muuten viallisen tiedon paikkaamisesta mahdollisimman hyvillä korvikearvoilla. Puuttuvuutta esiintyy kaikissa aineistoissa, joko koko yksikön tasolla tai muuttujakohtaisesti. Imputoinnilla voi kaikkia paikata mutta pääosin menetelmää käytetään muuttujakohtaisessa puuttuvuudessa eli erävastauskadossa. Tämä vastauskato voi vaivata paljonkin analyysiä, mutta jos määrä on suhteellisesti mitätön eikä koske merkittäviä tilastoyksiköitä, voidaan olla aika huolettomia. 

Imputation is to replace missing values of the data with more or less fabricated values so that the estimates after imputation will be better than without imputation. A problem is thus if missing values will be lost in estimation, some drawbacks are definite. On the other hand, if imputation are not of good quality, the estimates will still be biased and inaccurate.

Esitietovaatimukset

Surveymetodiikan kurssin perusteet ovat hyödyllisiä sekä muu tilastotieteellinen perustaito. Harjoituksissa käytämme lähinnä SAS:ia, mutta valmiit ohjelmapohjat annetaan. Jos sinulla on puutteita SAS:n teknisessä käyttämisessä, kerro. Järjestän mielelläni ylimääräistä ohjausta. Siis perusasiat tehdään ohjelmoimalla SAS:lla, mutta kun ne olemme oppineet, kokeilemme kahta valmista ohjelmistoa: information SAS:n PROC MI, ja (ii) SPSS:n Missing Value Analysis and Multiple Imputation. Tässä vaiheessa toivon mukaan osaamme olla kriittisiä siihen mitä nämä 'mustalaatikkomaiset' ohjelmat tuottavat. Esittelen myös melko helppokäyttöisen Solas-ohjelmiston mutta emme tee analyysejä sillä. Tarvittaisiin lisenssi siihen. MInulla oli viime keväänä määräaikinen testilisenssi jolla kokeilin yhtä ja toista. Luulen että Solas on tavalliselle käyttäjälle teknisesti paras mutta itse metodien hyvyyteen en ota kantaa. Ongelmahan on, että omia ratkaisuja on valmisohjelmistolla vaikeampi tehdä.

Opetusaineistoja

Surveymetodiikan kirjani perusteet on hyvä katsoa läpi, erityisesti imputoinnin osalta. Kirjan 'löytymistiedot' saat kotisivultani eli klikkaamalla ensin nimeäni yllä. 

Introduction to imputation Johdatus imputointiin ja opettajan lähestymistapaan. Kurssin alku perustuu paljon tähän. The first session follows much this material.

https://wiki.helsinki.fi/download/attachments/93739485/Imputation_2013_Seppo.pdf?api=v2

Tässä on pääosin suomenkielinen osio josta löytyvät myös ohjeet ensimmäisen menetelmän harjoitteluun.

The attached document is mainly in Finnish. It includes some similar points as the previous one but it is mainly to concretise some introductory points. It also gives instructions to the first training, i.e., to deterministic model-donor imputation.

https://wiki.helsinki.fi/download/attachments/93739485/Imputointi_harjoitus1.pdf?api=v2

Tässä on lopputarina kurssin aineistosta ml. harjoitusohjeet eli SAS- ym koodit. This is the last material of the imputation course, mainly in Finnish. SAS codes should be understandable by everyone.

https://wiki.helsinki.fi/download/attachments/93739485/Imputointi%202013%20_harjoitusosio2.pdf?api=v2

 

Harjoitusten perusaineisto (data for training of imputation methods is attached; there are two variables being to imputed step by step during some weeks) on ohessa. Se sisältää useita apumuuttujia ja vain kaksi muuttujaa joissa on melko paljon puuttuvaa tietoa. Niiden imputoimiseen siis käytetään kurssin harjoituksissa paljonkin aikaa.

https://wiki.helsinki.fi/download/attachments/93739485/Imputation_hy.zip?api=v2

Imputointuloksia voisi raportoida oheisen Excel-mallin mukaan (Excel template for reporting your imputation results). Listassa ovat mainitut metodit jotka riittävät perusharjoitusten suoritukseen ja tentin kanssa 5 op:een. Jos tekee tätä enemmän, on mahdollista nostaa määrää 1 op:llä. Kaikissa tapauksissa on oltava selostus eli yhteenveto metodien hyvyydestä/huonoudesta. Tästä keskustellaan myös viimeisellä kerralla. Huomaa että erityislisäop:n (max 2) hankkiminen olisi hyvä tehdä jostain muusta aineistosta tai olennaisesti erilaisella tavalla tästä. Näistä on siis syytä keskustella erikseen. On myös mahdollista tehdä helppokäyttöinen imputointiohjelma tai sen osa.  

https://wiki.helsinki.fi/download/attachments/93739485/Impu_results_template.xlsx?api=v2

Tässä on Solas-ohjelman perusmanuaali. Sitä käsitellään 13.3.2013

Attached you find the Solas manual:

https://wiki.helsinki.fi/download/attachments/93739485/SOLAS%20Imputation%20Manual_A.pdf?api=v2

Tässä kaksi muuta tarinaa englanniksi

https://wiki.helsinki.fi/download/attachments/93739485/Weighting_2013.pptx?api=v2

https://wiki.helsinki.fi/download/attachments/93739485/Imputation_2013.pptx?api=v2

Opetusrupeamat ja Kokeet

Kurssi pidetään kuutena kolmen tunnin istuntona 3. ja 4. periodilla, alkaen klo 16.15. Aloitus on keskiviikkona 23.1. ja paikkana Exactumin it-sali C128. Luennot ja harjoitukset lomittuvat toisiinsa. Alussa on enemmän luentoja, myöhemmin harjoitusta ja niiden tukea. Muut varatut opetuskerrat: 30.1., 6.2., 13.2., 27.2. ja 13.3.. Lisäksi on varattu keskiviikko 20.3. jolloin pidämme pienimuotoisen kokeen. Ennen koetta katsomme mikä on saldo harjoituksista: kukin pyrkii tekemään omat johtopäätöksensä tuloksistaan ja sitten vedämme ne yhteen. Tavoitteena yhteenvedossa on katsoa mikä imputointimalli ja imputointitapa on paras tai ainakin kelvollinen eri näkökannoilta. Tavallaan saanemme kasaan yhteisen tutkimuksen. 

 

Ilmoittaudu kurssille