Tilastollinen päättely R-ohjelmistolla

Last modified by varvio@helsinki_fi on 2024/03/27 10:31

Tilastollinen päättely https://www.r-project.org/logo/Rlogo.png-ohjelmistollakevät 2017

Vastuu kurssista: Sirkka-Liisa Varvio

Kurssin ohjaajat: Toni Lehtonen, Aku Leivonen, Joonas Nuutinen, Nea Rantanen, Daniel Kari

Laajuus: 5 op

Tyyppi ja kohderyhmät:

  • Pakollinen perusopintojakso Matemaattis-luonnontieteellisen tiedekunnan tilastotieteen pääaineopiskelijoille, pakollinen aineopintojakso Valtiotieteellisen tiedekunnan tilastotieteen pääaineopiskelijoille
  • Pakollinen opintojakso taloustieteen opiskelijoille
  • Suositeltava opintojakso kaikille niille sivuaineopiskelijoille, jotka suorittavat tilastotieteestä myös aineopintotason kursseja, koska R:n osaaminen on tarpeellinen valmius useilla kursseilla.
  • Kurssi on osa tilastotieteen 25 op perusopintokokonaisuutta, jonka opetus on tarjolla myös Avoimen yliopiston kautta.

Esitietovaatimukset:

  •  Kurssi on tarkoitettu suoritettavaksi samanaikaisesti kurssin 57046 Tilastollinen päättely I kanssa, jonka sisältö (katso täältä päättelyn kurssin Oppimistavoitematriisi) muodostaa kurssin tilastotieteellisen käsitteistön esitietovaatimukset.
  • Kurssia ei ole tarkoitettu yleiseksi R-kurssiksi. Netistä löytyy lukuisia R:n itseopiskelumateriaaleja, verkkokursseja, oppaita ja mikäli haluat yleisesti oppia R:n käyttöä, googlaamalla löytyy apua.
  • Lukuvuonna 2016-2017 R:n alkeita opetettiin kurssilla 57703 Tilastotiede tutuksi ja R-ohjelmisto. Koska tämä kurssi ei ole vielä pakollinen esitietovaatimus, R-alkeita opetaan myös kurssilla jonka kurssisivua luet nyt tässä, eli riippumatta siitä että osa kurssilaisista jo hieman osaa alkeita!

Sisältö:

  • Kurssi etenee rinnakkain kurssin 57046 Tilastollinen päättely I kanssa. Tavoitteena on antaa riittävät tiedot ryhtyä soveltamaan päättelyn teoriaa käytäntöön itsenäisesti.
  • Kurssin aikana käydään läpi R-ohjelmiston avulla seuraavia aiheita:  R:n peruskäyttö ja funktiot, matriisit ja tietorankenteet, datan visuaalinen esittäminen, testaaminen ja luottamusvälit, lineaarinen regressio, (lisäpakettien asentaminen ja käyttö).

Kurssin työskentelyalue Moodle

Toisen viikon tehtävien palautuksessa siirrytään normaaliin aikatauluun: palautus perjantaina klo 23:55.

Opetus ja suoritustapa

  • IV opetusperiodi

  • Kurssilla annetaan viikottain tehtäviä, jotka palautetaan Moodle-oppimisympäristöön ja arvioidaan. Prosessi on selitetty Moodlessa, Lopuksi tehdään kotitenttinä laajempi harjoitustyö.

  • Kurssi on mahdollista suorittaa täysin digitaalisesti.

  • Kurssilla ei ole luentoja.

  • Ohjausta annetaan digitaalisesti Moodlen kautta sekä vapaaehtoisissa ohjaustilanteissa tietokoneluokassa C128, Kumpulan kampus, Exactum rakennus, 1. kerros. 

    Ohjausajat


    viikolla torstaina 16.3 klo 10-14 ja 16-18 sekä perjantaina 17.3  klo 10-12.


    viikosta kurssin loppuun torstaisin klo 12-18 ja perjantaisin klo 10-12

  • Tärkeää on myös opiskelijoiden keskinäinen ohjaus sekä atk-luokassa että Moodle-keskusteluissa. Viikoittaisia harjoitustöitä kannustetaan tekemään yhdessä. Lopputyötä ei saa tehdä yhdessä eikä siihen saa ohjausta. 

  • R:ää voi käyttää joko suoraan konsolista tai jonkin graafisen käyttöliittymän kautta. https://www.r-project.org/logo/Rlogo.pngja ohjelmointiympäristö https://www.rstudio.com/wp-content/uploads/2016/09/RStudio-Logo-Blue-Gray-125.pngovat valmiiksi asennettuina Exactumin tietokoneluokissa sekä käytännöllisesti katsoen kaikissa muissakin yliopiston atk-luokissa.

    Omalle koneelle https://www.r-project.org/logo/Rlogo.png:n voi ladata osoitteesta  http://www.r-project.org/.

    https://www.rstudio.com/wp-content/uploads/2016/09/RStudio-Logo-Blue-Gray-125.pnglöytyy osoitteesta http://www.rstudio.com/

Suositeltavaa oheislukemistoa

    • Peter Dalgaard: Introductory Statistics with R (Springer, 2002, e-kirja Yliopiston kirjastossa ja 2008, myös e-kirja mutta käytössä rajoitteita) 
    • Ville Hyvönen, Henri Karttunen, Toni Lehtonen: R_kurssimoniste_2016.pdf (monistetta päivitetään viikoittain ja sitä julkaistaan viikoittaisten tehtävien ohella)

 

Ison Pyörän uuteen koulutusrakenteeseen liittyvää

  • Lukuvuonna 2017-2018 ei enää järjestetä kurssia tätä kurssia jonka kurssisivulla nyt olet. Tilastollinen päättely R-ohjelmistolla on ohjelmassa nyt keväällä 2017 viimeistä kertaa.

      • Kurssin tilalle tilastotieteen perusopintokokonaisuuteen tulee opintojakso MAT12005 Data-analyysin projekti, 5 op, joka suoritetaan itsenäisesti R:n ollessa keskeinen työväline avointen vaihtoehtoisten datojen analyysissä. R edellytetään osattavaksi näiden opintojaksojen perusteella (syksyllä 2017):  MAT12001 Tilastotiede tutuksi ja R-ohjelmisto I, 5 op ja MAT12002 Tilastotiede tutuksi ja R-ohjelmisto II, 5 op. MAT12001 tulee olemaan uudistettu versio kurssista 57703 Tilastotiede tutuksi ja R-ohjelmisto (R:n alkeita tullaan opettamaan enemmän) ja MAT12002 on uusi kurssi jolla tullaan opettamaan R:n perusteet vastaavassa laajuudessa kuin tällä kurssilla jonka kotisivua nyt luet. Eli kokonaisuudessaan R:n alkeiden ja perusteiden opetus siirtyy varhaisempaan vaiheeseen kuin nykyisin. 
  • Jos suoritat nyt kurssin 57046 Tilastollinen päättely I, niin järkevintä on suorittaa myös kurssi Tilastollinen päättely R-ohjelmistolla samanaikaisesti. Saat R:stä vastaavan opin kuin se mikä tulee sisältymään syksyllä 2017 opintojaksoihin MAT12001 ja MAT12002.