Tilastollinen koneoppiminen

Last modified by Xwiki VePa on 2025/01/08 07:28

Tilastollinen koneoppiminen

Tilastollinen koneoppiminen (engl. statistical machine learning) edustaa poikkitieteellistä tietojenkäsittelyn, tilastotieteen ja sovelletun matematiikan yhteisaluetta, missä luodaan havaintoaineistosta itsenäisesti päätelmiä tekeviä menetelmiä yhdistämällä algoritmit ja satunnaismallit. Datan määrän voimakas kasvu lähes kaikilla sovellusaloilla lääketieteestä insinööritieteisiin on nostanut koneoppimisen keskeiseksi tavaksi prosessoida monenlaisia havaintoja ja signaaleja, missä epäinformatiivisen satunnaisvaihtelun poissuodattaminen on tärkeää. Esimerkkeinä sovelluksista voidaan mainita syöpäkasvaimien profilointi, geenien toiminnallisten erojen paljastaminen ja adaptiiviset hakukoneet.

Tilastollisen koneoppimisen linjan toiminta on läheisessä yhteydessä tutkimuslaitos HIITiin ja laskennallisen päättelyn huippuyksikköön COINiin. Linjan opiskelijat osallistuvat pääsääntöisesti HIITin ja COINin tutkimushankkeisiin pro gradu -tutkielmaa tehdessään.

Linjan keskeiset syventävät erikoiskurssit:

  • (Bayesian theory with applications, ei ohjelmassa toistaiseksi)
  • Computational statistics, 5-10 op
  • (Markovian modeling and Bayesian learning, ei ohjelmassa toistaiseksi)
  • Introduction to machine learning (tietojenkäsittelytiede)
  • Unsupervised machine learning (tietojenkäsittelytiede). Tämä kurssi on poistunut opetusohjelmasta ja tilalle suositellaan TKTL:n kurssi 582744 Advanced course in machine learning, 5 op.
  •  uusia kursseja tulossa opetusohjelmaan:
    • ..
    • ..
    • ..

Tietojenkäsittelytieteestä on suositeltavaa suorittaa laaja sivuainekokonaisuus, mutta vähintään lyhyt sivuaine kuuluu linjan tutkintovaatimuksiin. Lisätietoja linjalla opiskelusta saa apulaisprofessori Antti Honkelalta, apulaisprofessori Jarno Vanhatalolta (sekä professori Jukka Coranderilta).