Alueittaisten aineistojen spatiaalinen analyysi, kevät 2007
Alueittaisten aineistojen spatiaalinen analyysi, kevät 2007
Luennoitsija
FT Juha Heikkinen
Laajuus
5 op + vapaaehtoinen 3 op harjoitustyö
Tyyppi
Syventävä opinto.
Esitietovaatimukset
Kurssin seuraamisen kannalta olennaisinta on todennäköisyys- ja matriisilaskennan (erityisesti moniulotteinen normaalijakauma sekä siihen liittyvät matriisit ja ehdolliset jakaumat) sekä tilastollisen päättelyn ja lineaarisen regressiomallinnuksen perusteiden hallinta.
Niiden kurssille aikovien, jotka eivät ole aiemmin perehtyneet moniulotteiseen normaalijakaumaan (esim. Todennäköisyyslaskennan kurssilla), kannattaa ottaa yhteyttä luennoijaan ennen kurssin alkua lähtötietoihin sopivan taustamateriaalin löytämiseksi.
Tarvittavat esitiedot Bayes-päättelystä voi opiskella esim. kurssikirjan Banerjee et al. (2003) kappaleista 4.1-4.2 tai (suositeltavammin) samanaikaisesti järjestettävällä kurssilla Bayes-päättely.
Luentoajat
IV periodi (12.3-3.5.) ma ja to 10-12 Exactum (Kumpula, Gustaf Hällströmin katu 2b) sali B120. Luentoja ei pidetä to 22.3 (matka) eikä pääsiäislomalla 5.-11.4..
Kurssikuvaus
Tällä kurssilla käsitellään alueittaisten keskiarvojen, lukumäärien ja suhteellisten osuuksien tilastolliseen analyysiin soveltuvia malleja ja menetelmiä, joissa otetaan huomioon alueiden sijainnit, erityisesti niiden naapuruussuhteet. 'Alueet' voivat olla epäsäännöllisen muotoisia tyypillisesti hallinnollisia yksiköitä tai suorakulmion (neliön) muotoisia koealoja tai kuvapikseleitä.
Alueittaisen aineiston regressioanalyysissä on tärkeää ottaa huomioon jäännösten spatiaalinen autokorrelaatio, naapurialueiden samankaltaisuus, jolla on usein vahva vaikutus sovitetun mallin epävarmuuteen. Mutta spatiaalista autokorrelaatiota voidaan myös hyödyntää: alueittaisten aineistojen karttaesityksistä saadaan usein selkeämpiä ja informatiivisempia spatiaalisen tasoituksen avulla. Spatiaaliseen autokorrelaatioon perustuvaa tasoitusta käytetään usein myös alueittaista vaihtelua selittävien hierarkkisten mallien osana.
Kurssin ydinainesta ovat Markovin satunnaiskenttiä sisältävät hierarkkiset Bayes-mallit ja niiden sovittamiseen tarvittavat työkalut, lähinnä Markovin ketjujen simulointiin perustuvat iteratiiviset menetelmät (MCMC).
Kurssilla esiteltävät mallit ja menetelmät ovat yleisessä käytössä mm. tautikartoituksessa ja erityyppisten pikselikuvien analyysissä. Myös pitkittäisaineistojen ja aikasarjojen analyysissä käytetään usein samantyyppisiä lähestymistapoja korrelaation mallintamiseen.
Kokeet
Viimeisellä luennolla 3.5. kello 10.00-12.00.
Kurssimateriaali
Asema opetuksessa
Tilastotieteen valinnainen syventävä opintojakso. Soveltuu myös muiden aineiden opiskelijoille, joilla on riittävät esitiedot todennäköisyys- ja matriisilaskennasta ja tilastollisesta päättelystä (ks. Esitiedot)
Palaute
Otan mielelläni vastaan kaikenlaista kurssiin liittyvää palautetta koska tahansa kurssin aikana sekä toiveita kurssin valmistelua varten jo ennen sen alkua, mieluimmin sähköpostitse tai luentojen yhteydessä. Anonyymisti tämä onnistuu seuraamalla tätä linkkiä. Kurssin jälkeen järjestetään yksityiskohtaisempi palautekysely.