Johdatus yhteiskuntatilastotieteeseen, syksy 2016

Last modified by kvehkala@helsinki_fi on 2024/02/07 06:37

Johdatus yhteiskuntatilastotieteeseen, syksy 2016

  • Etenkin sivuaineopiskelijoille suunnattu johdatus yhteiskuntatilastotieteen kiehtovaan maailmaan.
  • Sopii kaikkiin opintojen vaiheisiin (perus-, aine-, maisteri-, tohtori-, post doc, erillis- ja täydentävät opinnot) - huomaa kuitenkin, että kurssi on lähtökohtaisesti määritelty perusopintotasoiseksi, joten sen hyväksyttäminen muiden tasojen (esim. jatko-opintojen) suorituksena vaihtelee mm. tieteenaloittain - selvitä oma tilanteesi etukäteen, jos aiot suorittaa kurssin ja liittää sen osaksi jotain muuta kuin perusopintotasoista kokonaisuutta! (Kurssille voi myös mainiosti osallistua ilman suoritustavoitteita!)
  • Koostuu kahdesta osasta: osa 1 (78240, 5 op) ja osa 2 (78241, 5 op), jotka suoritetaan erikseen. Tarkempia tietoja alla!

Kurssi on kaikille avoin tilastotieteen MOOC (= massive open online course). Se on tarkoitettu kaikille, jotka ovat kiinnostuneita tilastotieteestä ja tarvitsevat sitä opinnoissaan, työssään tai missä tahansa muissa yhteyksissään. Kurssi järjestetään yhteistyössä Helsingin yliopiston Avoimen yliopiston kanssa. #tilastoMOOCOsaamistavoite:

Kurssin suoritettuaan opiskelija on (ehkä omaksi yllätyksekseen) innostunut yhteiskuntatilastotieteestä (Social Statistics) tai yleensä tilastotieteestä (Data Science) ja ymmärtää alan keskeisten käsitteiden (sellaisten kuten perusjoukko, satunnaisotos, mittausvirhe, vaihtelu, riippuvuus, todennäköisyys, epävarmuus, riski ja ennuste) merkityksen opintojensa, työelämänsä ja tulevaisuutensa kannalta.

Kurssin myötä opiskelija on asennoitunut positiivisesti tilastotiedettä kohtaan ja motivoitunut jatkamaan menetelmäopintojaan monipuolisesti, hahmottaen kiinnostavia mahdollisuuksia myös tilastollisten menetelmien soveltamiseen opinnäytetöissään ja muissa projekteissaan.

Syksyn 2016 uutena asiana mukaan tulee (loistava!) mahdollisuus tutustua data-analyysiin (Data Sciencetilastollisella R-ohjelmointikielellä.

(Tästä - kuten muistakin kurssin asioista - tarkemmin syyskuun alussa kurssialueelta, ks. alla!)

Statistics – it’s not what you think it is.

Rlogo.png

 

Ilmoittaudu kurssille, osa 1

Osaan 1 ilmoittautuminen alkoi elokuussa. Osa 1 alkoi torstaina 8.9.2016. Kurssialue mooc.helsinki.fi avautui muutamaa päivä aiemmin.

Ilmoittaudu kurssille, osa 2

Osaan 2 ilmoittautuminen alkaa lokakuussa. Osa 2 alkaa torstaina 3.10.2016.

Opettaja

Kimmo-FatBoy-20160901-Laura-CROP.png

Kimmo Vehkalahti, valtiot.toht., yliopistonlehtori
Soveltavan tilastotieteen dosentti, Opettajien akatemian jäsen

Ohjaajat

Liisi Hakalisto, valtiot.kand.
Emma Kämäräinen
, valtiot.yo
Marianne Laalo, valtiot.kand.
Petteri Mäntymaa, valtiot.yo
Tuomo Nieminen, valtiot.kand.
Pihla Oksanen
, valtiot.yo
Emma Peltomaa, psykol.kand.

 

Tiedote kurssista (ja sen "jatko-osasta") Flammassa (2.9.2016)

Yhteiskuntatilastotieteen kaikille avoin kurssi: R ja Data Science: #tilastoMOOC ver.2.0

Kurssin verkkoalusta löytyy siis osoitteesta http://mooc.helsinki.fi . Katso sieltä ohjeet ja rekisteröidy. Ilmoittaudu kurssille myös Oodissa!

HUOM! Tätä wikisivua EI päivitetä 14.9.2016 jälkeen. Hyppää kyytiin MOOC-alueelle ja päivitä tietosi (yhteiskunta)tilastotieteestä (Social Data Science)!

https://www.helsinki.fi/fi/uutiset/hyppaa-mukaan-avoimelle-verkkokurssille

Kohderyhmä, koodit, kurssivaihtoehdot ja kokonaisuudet

Tämä "JYT"-kurssi on suunnattu erityisesti valtiotieteellisen tiedekunnan sekä muiden keskustakampuksen tiedekuntien opiskelijoille, mutta se on avoin kaikille kiinnostuneille.

Muiden tiedekuntien opiskelijoille suositellaan (myös) heidän omien tiedekuntiensa järjestämiä tilastotieteen (biometrian, epidemiologian, psykometriikan jne.) kursseja.

JYT tunnettiin aikaisemmin (2008-2013) nimellä Tilastotieteen johdantokurssi (koodit 78200 ja 78201). Nykyinen kurssi korvaa sen (koodivastaavuudet: 78240 = 78200 ja 78241 = 78201). Osien opintopiste-eroilla (4 op/5 op tai 6 op/5 op) ei ole merkitystä. (Tiedekunnassa siirryttiin 2014 viidellä jaollisiin opintopistemääriin. Sitä ennen op:illä oli periaatteessa yhteys opiskelijan työmäärään.)

Kurssi on tarjolla myös Avoimessa yliopistossa vuoden 2017 puolella.

Tilastotieteen tutkintovaatimukset sivuaineopiskelijoille 2014-2016 kertoo muista kursseista ja kokonaisuuksista.

 Social Statistik på svenska? Se: Soc&kom (svenska social- och kommunalhögskolan)

 Social Statistics in English? NEW COURSE in 2017: Introduction to Open Data Science

Sisältö tiivistetysti

Tilastotiede on olennainen osa kaikkia aloja, joissa kerätään, mitataan ja analysoidaan tietoja. Tilastollisilla menetelmillä voidaan löytää vastauksia lukuisten eri alojen tutkimuskysymyksiin. Yhteiskuntatilastotiede tarkoittaa erityisesti yhteiskuntatieteissä (Social Sciences) sovellettavaa tilastotiedettä (Social Statistics).

Kurssilla perehdytään tilastollisen tutkimuksen perusteisiin käytännönläheisesti ja yhteiskuntatieteellisestä näkökulmasta. Tavoitteena on oppia tilastollisen tutkimuksen keskeiset käsitteet (kuten perusjoukko, satunnaisotos, mittausvirhe, vaihtelu, riippuvuus, todennäköisyys, epävarmuus, riski ja ennuste) ja niiden merkitys opintojen, työelämän ja tulevaisuuden kannalta.

  • Osassa 1 tarkastellaan, miten yhteiskuntatieteellisiä aineistoja kerätään ja mitä kaikkea kyselylomakkeen laatimisessa kannattaa huomioida. Lisäksi tutkitaan, millä tavoin tietoja tiivistetään tilastollisiksi kuviksi ja tunnusluvuiksi sekä perehdytään erilaisiin vaihtelun ja riippuvuuden kuvaustapoihin.
    • Kokoavana teemana on (laajasti käsitettynä)  tilastollinen lukutaito , jota voi pitää jokseenkin välttämättömänä taitona nyky-yhteiskunnassa ja -maailmassa.
    • Käsitteet saattavat olla monelta osin entuudestaan tuttuja, mutta niihin perehdytään syvällisemmin kuin esimerkiksi lukiossa.

 

  • Osassa 2 tutustutaan todennäköisyyslaskentaan ja tilastolliseen päättelyyn soveltaen niitä eräisiin yhteiskuntatieteissä keskeisiin ja "klassisiin" tilastollisiin menetelmiin kuten t-testiin ja regressioanalyysiin, jotka muodostavat perustan vaativammille menetelmille.
    • Kokoavana teemana on   (laajasti käsitettynä) tilastollinen päättely , jota yhä useampi eri alojen asiantuntija tarvitsee työssään.
    • Käsitteet ovat vaativampia ja edellyttävät täsmällisempää työstämistä. Lyhyt matematiikka riittää, mutta tällöin opiskeluun on varattava enemmän aikaa.

Matematiikka ja laskeminen

    • ====

Tilastotiede EI OLE ensisijaisesti matematiikkaa, vaikka sen teoreettinen perusta siihen nojaakin. Sen sijaan tilastotieteen juuret ovat syvällä eri alojen empiirisessä tutkimuksessa. Tilastollisen ajattelun omaksuminen vaatii kuitenkin jonkin verran matemaattisluontoista pähkäilyä, laskeskelua ja pohdiskelua, jota tällä kurssilla harjoitellaan.

 Verrattuna tyypillisiin tilastotieteen peruskursseihin, joita opetetaan useimmissa yliopistoissa ympäri maailmaa, tällä kurssilla on huomattavasti vähemmän laskemista. Sen sijaan keskitytään miettimään ja nostamaan esiin niitä kysymyksiä, joita tilastollisessa tutkimuksessa, erityisesti yhteiskuntatieteiden yhteydessä, kohdataan:

  • Mitä tietoja kerätään, keneltä tai mistä ja millä tavalla?
  • Miten ilmiöitä ja niiden ulottuvuuksia mitataan?
  • Miten kyselylomakkeiden validiteettia ja reliabiliteettia voidaan parantaa?
  • Mitä tarkoitetaan esim. käsitteillä keskiarvo, vaihtelu ja riippuvuus?
  • Mitä vaikutuksia tutkimukseen on sattumalla ja satunnaisuudella?
  • Millaisia menetelmiä missäkin tilanteessa voi soveltaa?
  • Mitä tietokone pitäisi laittaa laskemaan ja miten?
  • Millä tavoin kuvia, taulukoita ja tulo(stu)ksia esitetään ja tulkitaan?
  • Mitä johtopäätöksiä pitäisi tehdä ja mitä ei?

Monet kysymyksistä tulevat vastaan aivan välittömästi oman alan tutkimuskirjallisuutta lukiessa. Kurssin jälkeen tulisi osata vastata jo useimpiin kysymyksistä todellisissa tutkimusasetelmissa.

Oppimistilaisuudet ja itsenäinen työskentely

Kurssi rakentuu voimakkaasti yhteisöllisten oppimistilaisuuksien eli pajojen varaanNiiden lisäksi on varattava aikaa itsenäiseen työskentelyyn, joka tarkoittaa pohtimista ja pähkäilyä yksin tai kaveri(e)n kanssa. Mikään kurssilla ei ole pakollista, mutta pajoihin osallistuminen on suositeltavaa.  Korvaavia tehtäviä ei teetetä, koska ne eivät oikeasti korvaa yhteisöllisiä oppimistilaisuuksia (eikä yksilölliseen ohjaukseen ole kurssin koon vuoksi mahdollisuuksia).

ISO PAJA

Kurssin teemoihin perehdytään viikoittain itsenäisesti. Isossa pajassa teemoja ja harjoitustehtäviä työstetään ad  hoc -ryhmissä ohjaajien tuella sekä täydennetään esimerkeillä, ideoilla, keskustelulla, kahvilla ja kommenteilla.  

KERTAUSPAJA

Harjoitustehtävien tekeminen on oppimisen kannalta olennaista. Isojen pajojen ja videopajojen lisäksi molempien osien lopuksi järjestetään kertauspajat, joihin voi osallistua, jos tarvitsee lisäharjoittelua ennen kurssikoetta. Kertauspajoissa tehtäviä työstetään ohjaajien tuella pienryhmissä eri tavoin, osallistujien toiveita kuunnellen. Tehtäviin on tärkeää perehtyä itsenäisesti jo ennen kertauspajoja. Kertauspajat ovat vapaaehtoisia eivätkä vaadi erillistä ilmoittautumista.

Kasvokkain kohtaamisten aikataulu (pajat avoimia kaikille!)

Osa 1

  • viikko 43: (tentti- ja lukuviikko)
    • (kurssikokeen tarkastus - tulokset periodin II alussa)

Osa 2

  • viikko 51: (tentti- ja lukuviikko)
    • (kurssikokeen tarkastus - tulokset periodin III alussa)

 

Materiaali

Kurssin verkkoalueella (mooc.helsinki.fi) on (ja sinne tuotetaan kurssin aikana) oppimista tukevaa materiaalia, joka on kurssin osallistujien käytössä myös kurssin jälkeen.

Suoritustavat

Kurssin osat 1 ja 2 suoritetaan erikseen, joko kurssikokeilla tai erilliskokeilla .

Kurssikoe

Osan 1 kurssikoe järjestetään periodin I lopulla, osan 2 kurssikoe periodin II lopulla.

  • Osan 1 koealue käsittää Teemat 1-5 harjoituksineen.
  • Osan 2 koealue käsittää Teemat 6-10 harjoituksineen.

  Kurssikokeiden ajat kannattaa merkitä heti muistiin!

 Kurssikoe järjestetään kahdessa isoimmassa salissa:

  Salijako sukunimen alkukirjaimen mukaan

  • A - L: Päärakennus, sali 1 (Fabianinkatu 33)
  • M - Ö: Porthania I (Yliopistonkatu 3)

Kokeeseen voivat osallistua kurssille ilmoittautuneet.

Uusintamahdollisuuksia on tarjolla erilliskokeissa sekä verkkotenteissä.

Erilliskoe

Erilliskokeet järjestää Valtiotieteellinen tiedekunta 11.2.2017 ja 8.4.2017.

  • Osan 1 koealue käsittää Teemat 1-5 harjoituksineen.
  • Osan 2 koealue käsittää Teemat 6-10 harjoituksineen.

Tarkemmat tiedot ja ilmoittautuminen, ks. Flamma. Tässä tiivistetysti:

  • Ilmoittautuminen Oodissa viimeistään 10 pv ennen tenttiä.
  • Tiedekunta EI ota vastaan myöhästyneitä ilmoittautumisia. 
  • Yhdessä tentissä voi suorittaa joko osan 1 tai osan 2 tai molemmat osat.
  • Kuhunkin tentittävään osaan on ilmoittauduttava erikseen.
  • "Tentittävä kirjallisuus" on kurssin perusmateriaali (teemat ja harjoitukset, jotka saa MOOC-alustalta).
  • Tenttikysymykset ovat suomeksi, men du kan svara på svenska.
  • Tiedekuntatenttien kestoaika on 4h.

Mitä mukaan kurssi- ja erilliskokeisiin, mitä ei?

  • Opiskelijakortti (tai muu henkilötodistus) on oltava mukana.
  • Laskin saa olla mukana (tavallinen nelilaskin riittää, mutta funktiolaskimesta voi olla hyötyä, kunhan opettelee sen käytön jo ennen koetta).
  • Taulukkokirjaa ei saa olla, vaan tarvittavat taulukot ja kaavat annetaan kokeissa. Niiden käyttöä ei kuitenkaan enää kokeissa neuvota.

Verkkotentti

Verkkotentit järjestää Avoin yliopisto. Tarkemmat tiedot MOOC-alustalla.

Pisteet ja arvosanat

Kurssin molemmista osista saa erillisen arvosanan joko kurssikokeen tai erilliskokeen perusteella. Arvosanat määräytyvät suoraan koepisteistä:

Pisteet

0-11

12-15

16-19

20-23

24-27

28-30

Arvosana

hylätty (0)

välttävä (1)

tyydyttävä (2)

hyvä (3)

kiitettävä (4)

erinomainen (5)

 Syksyn 2016 kurssilla saa lisäpisteitä mm. DataCamp-tehtävien tekemisestä, ks. MOOC-alustan ohjeet!

Aineistot

Kurssilla tarkastellaan yhteiskuntatieteellisiä, enimmäkseen kysely- ja haastattelututkimusten aineistoja, pääasiassa kyselylomakkeiden, kuvien, tulosteiden ja tunnuslukujen avulla. Omin käsin ("hands-on") tilastolliseen data-analyysiin (Data Science) pääsee kiinni DataCamp-alustalle räätälöidyllä Helsinki Social Statistics -tehtäväkokonaisuudella (syksyllä 2016).

Tietokoneet, muut härpäkkeet ja ohjelmistot

Oman (kannettavan) tietokoneen hankkiminen on erittäin suositeltavaa.

Konetta kannattaa pitää mukana pajoissa. BYOD (Bring Your Own Device)!

Tilastollisista ohjelmistoista osan saa vapaasti verkosta, osan opiskelijalisenssillä yliopiston ohjelmistojakelusta.

  • R on (ainakin) akateemisen maailman suosituin ja tärkein tilastollinen ohjelmisto. Sen perusteet opitaan tällä(kin) kurssilla.
  • Survo R on kätevä ympäristö tilastollisiin yms. tehtäviin.
  • SPSS ja SAS ovat perinteisiä, kaupallisia tilasto-ohjelmistoja.
  • STATA, Mplus, ja monia muita tilastollisia ohjelmistoja on myös olemassa erilaisilla saatavuuksilla eri käyttötarkoituksiin.

Kurssin materiaaliin pääsee käsiksi MOOC-alustalta, ensisijaisesti VuoLearning-sovelluksella, joka toimii hyvin myös mobiililaitteilla.

Kirjallisuutta

Alla luetellut teokset soveltuvat oheislukemistoiksi kurssin molempiin osiin. Useimmat menevät kurssin sisältöjä pidemmälle. Siitä ei kannata huolestua, pikemminkin innostua. Osasta on uudempiakin painoksia, tässä luetellut löytyvät omasta kirjahyllystäni (paitsi että lahjoitin osan Porthanian valtaajille syksyllä 2015).

  • Alkula, Tapani & Pöntinen, Seppo & Ylöstalo, Pekka (1994). Sosiaalitutkimuksen kvantitatiiviset menetelmät. WSOY.
  • Bram, Uri (2011). Thinking Statistically. CreateSpace.
  • Cozby, Paul C. (2009). Methods in Behavioral Research, 10th ed., McGraw-Hill.
  • Dalgaard, Peter (2002). Introductory Statistics with R. Springer.
  • Field, Andy (2009). Discovering Statistics Using SPSS, Third Edition, Sage.
  • Field, Andy; Miles, Jeremy & Field, Zoë (2012). Discovering Statistics Using R. Sage.
  • Fowler, Jr., Floyd J. (1995). Improving Survey Questions: Design and Evaluation. Sage.
  • Freedman, David A. (2009). Statistical Models: Theory and Practice, Revised Edition. Cambridge University Press.
  • Freedman, David A. (2010). Statistical Models and Causal Inference: A Dialogue with the Social Sciences (Edited by David Collier, Jasjeet S. Sekhon and Philip B. Stark). Cambridge University Press.
  • Gelman, Andrew & Cortina, Jeronimo, eds. (2009). A Quantitative Tour of the Social Sciences. Cambridge University Press.
  • Hand, David J.; Mannila, Heikki & Smyth, Padhraic (2001). Principles of Data Mining (Adaptive Computation and Machine Learning). A Bradford Book.
  • Heikkilä, Tarja (2004). Tilastollinen tutkimus, 5. painos. Edita.
  • Holopainen, Martti & Pulkkinen, Pekka (2008). Tilastolliset menetelmät, 5.-7. painos. Sanoma Pro.
  • Howell, David C. (2002). Statistical Methods for Psychology, 5th ed., Duxbury.
  • Ketokivi, Mikko (2015).Tilastollinen päättely ja tieteellinen argumentointi, 2. painos. Gaudeamus.
  • Kuusela, Vesa (2000). Tilastografiikan perusteet. Edita.
  • Laakkonen, Pekka & Mäenpää, Merja & Kettunen, Ensio (2011). Numerotaito. Ammatillinen matematiikka. WSOYpro.
  • Magnello, Eileen & Van Loon, Borin (2009). Introducing Statistics: a Graphic Guide. Icon Books.
  • Nummenmaa, Lauri (2004). Käyttäytymistieteiden tilastolliset menetelmät. Tammi.
  • Pahkinen, Erkki (2012). Kyselytutkimusten otantamenetelmät ja aineistoanalyysi. Jyväskylä University Library Publishing Unit.
  • Paulos, J. A. (1991). Numerotaidottomuus: matemaattinen lukutaidottomuus ja sen seuraukset (suom. Klaus Vala), Art House.
  • Payne, Stanley L. (1951). The Art of Asking Questions. Princeton University Press.
  • Robbins, Naomi B. (2005). Creating More Effective Graphs. Wiley.
  • Salkind, Neil J. (2011). Statistics for People Who (Think They) Hate Statistics. 4th ed., Sage.
  • Salsburg, David (2001). The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century. Holt Paperbacks.
  • Sariola, Sakari (1956). Sosiaalitutkimuksen menetelmät. WSOY.
  • Taleb, Nassim Nicholas (2010). The Black Swan, 2nd ed., Penguin Books.
  • Taleb, Nassim Nicholas (2012). Antifragile: Things That Gain from Disorder. Random House.
  • Tufte, Edward R. (2001). The Visual Display of Quantitative Information, Second Edition. Graphics Press.
  • Vehkalahti, Kimmo (2014). Kyselytutkimuksen mittarit ja menetelmät. Finn Lectura.
  • Vehkalahti, Kimmo (2008). Kyselytutkimuksen mittarit ja menetelmät. Tammi.
  • Wild, Christopher J. & Seber, George A. F. (2000). Chance Encounters: a First Course in Data Analysis and Inference. Wiley.
  • Woolfson, Michael M. (2012). Everyday Probability and Statistic s. Imperial College Press.
  • Yau, Nathan (2013). Data Points: Visualization That Means Something. Wiley.
  • Yau, Nathan (2011). Visualize This: The FlowingData Guide to Design, Visualization, and Statistics . Wiley.
  • Ziliak, Stephen T. & McCloskey, Deirdre N. (2008). The Cult of Statistical Significance: How the Standard Error Costs Us Jobs, Justice, and Lives. University of Michigan Press.

 

Yhteiskuntatieteellisen tietoarkiston (FSD) kvantitatiivisten tutkimusmenetelmien oppimisympäristössä on esillä laaja valikoima oppikirjoja ja esimerkkejä erilaisin menetelmin tehdyistä tutkimuksista.