Miksi tiedonhallintaa ja uusiokäyttöä?
Tämä käsikirja mukailee rakenteeltaan yhteiskuntatieteellisen tietoarkiston tuottamaa Tutkimusaineistojen tiedonhallinnan käsikirjaa, mutta soveltaa tietoja lähinnä biodiversiteettiin liittyvien tutkimusaineistojen tiedonhallintaan.
Tutkimusaineistojen tiedonhallinnalla tarkoitetaan sitä, että tutkimusaineistot ja niihin liittyvä kuvaileva tieto (metatieto, metadata) on luotu, tallennettu ja järjestetty siten, että aineiston säilyy käyttökuntoisena, luotettavana sekä vertailukelpoisen ja että tietosuoja ja tietoturva on varmistettu aineiston koko elinkaaren ajan.
Jatkokäytöllä tarkoitetaan toisten kokoaman, johonkin muuhun tarkoitukseen kerätyn aineiston hyödyntämistä. Jatkokäytössä käytetään usein myös erilaisia menetelmiä kuin mitä alkuperäiset tutkijat ovat käyttäneet. Jatkokäyttöön viitataan usein myös termillä sekundaarianalyysi.
Osa hyvää tieteellistä käytäntöä
Yksi tieteellisen tutkimuksen luotettavuuden edellytys on, että tutkimus on suoritettu hyvän tieteellisen käytännön edellyttämällä tavalla. Tutkimusaineistot ovat keskeinen osa tutkimusprosessia ja tutkimushanketta.
Tutkimuseettisen neuvottelukunnan ohjeiden mukaan hyvään tieteelliseen käytäntöön kuuluu muun muassa eettisesti kestävien tiedonhankintamenetelmien käyttö. Tutkimusryhmän jäsenten asema, oikeudet, osuus tekijyydestä, vastuut ja velvollisuudet sekä tutkimustulosten omistajuutta ja aineistojen säilyttämistä koskevat kysymykset on hyvä määritellä ja kirjata kaikkien osapuolten hyväksymällä tavalla jo tutkimusprojektin alussa. Tieteellisen julkaisun tekijänoikeusasioihin liittyvää tietoa ja tukea löytyy mm. FinnOAn tai Helsingin yliopiston "Open Access Science"-sivuilta.
Suomen Akatemia puolestaan edellyttää, että rahoitushakemuksen liitteenä olevassa tutkimussuunnitelmassa kuvataan tutkimusmenetelmät ja tutkimusaineistojen aineistonhallintasuunnitelma (aiemmin tiedonhallintasuunnitelma). Suunnitelmassa kerrotaan, miten tutkimuksessa käytettävät aineistot hankitaan, miten aineistoja käytetään ja säilytetään ja miten mahdollistetaan aineistojen käyttö tutkimuksen päätyttyä.
Tutkimusaineiston elinkaari
Tutkimusaineiston elinkaari on tavallisesti pidempi kuin aineiston tuottaneen tutkimushankkeen elinkaari. Hanke päättyy, kun rahoitus loppuu, mutta aineistoa voi ja kannattaa hyödyntää myöhemminkin. Tiedon tuottaminen, muokkaaminen, versiointi, analysointi, julkaiseminen sekä arkistoiminen ovat tutkimuksen tiedonhallinnan osa-alueita. Myös immateriaalioikeudet ja digitaalisia aineistoja koskevat sopimukset kuuluvat tärkeänä osana tutkimushankkeen tiedonhallintaan.Tutkimusaineistoa käsitellään ja dokumentoidaan sekä tutkimusprojektin aikana että arkistointivaiheessa. Päällekkäiseltä työltä ja informaation katoamiselta vältytään, kun tutkimusaineiston elinkaaren eri vaiheet suunnitellaan jo tutkimussuunnitelmaa laadittaessa.
Esimerkiksi tutkimusaineistoa kuvaileva metadata on helpointa ja kustannustehokkainta tallentaa vaiheittain aineiston elinkaaren aikana. Puutteellisen metadatan täydentäminen ja korjaaminen vuosia aineistonkeruun jälkeen ei ole välttämättä edes mahdollista tai ainakin maksaa monikymmenkertaisesti sen, mitä maksaisi metadatan tuottaminen aineiston elinkaaren alkuvaiheissa.
Jatkokäytön ja avoimen saatavuuden hyödyt
Tieteen kehityksen ja tutkimuksen johtopäätösten tieteellisten luotettavuuden arvioimiseksi on välttämätöntä, että julkaisuissa käytetyt tutkimusaineistot ovat saatavilla tiedeyhteisön käyttöön. Aineistojen mahdollisimman laaja ja avoin saatavuus tukee myös tutkimuksen innovatiivisuutta ja verkostoitumista, lisää tutkimusorganisaatioiden ja tutkijoiden tunnettuutta ja mahdollistaa eri tieteenalojen tuottamien aineistojen monipuolisen käytön. OECD:n datasuosituksen mukaan julkisrahoitteisen tutkimusdatan avoin saatavuus on olennainen edellytys myös tulokselliselle kansainväliselle yhteistyölle.
Arkistoidut aineistot mahdollistavat ajalliset vertailut, ja ennen koottujen tutkimusaineistojen valossa voi tarkastella monipuolisia ja vaihtoehtoisia tutkimusongelmia. Lisäksi aineistojen saatavuus voi edistää tutkimusmenetelmien kehittämistä. Kehittyvät menetelmät, ohjelmistot ja teknologia tarjoavat puolestaan uusia mahdollisuuksia tutkimukseen. Arkistoiduista aineistoista on hyötyä myös opetuksessa ja opiskelussa.
Aineistojen jatkokäyttö on taloudellista ja säästää rajallisia resursseja. Aikaa ja rahaa ei tarvita uuden materiaalin keräämiseen, jos sopiva aineisto on jo saatavilla. Lisäksi laajat kysely- ja haastatteluaineistot sisältävät usein täysin analysoimatonta materiaalia. Jo olemassa olevien aineistojen käytöllä voidaan myös välttää päällekkäiset tiedonkeruut.
Arvokkaista tutkimusaineistoista ei ole tutkimusyhteisölle ja tulevaisuudessa tehtävälle tutkimukselle hyötyä, jos tiedot aineistoista ovat ensisijaisesti alkuperäisten tutkijoiden mielissä ja häviävät sitä mukaa, kun kyseiset henkilöt siirtyvät muihin tehtäviin tai eläkkeelle.
Aiheesta lisää:
- Suomen Akatemian hakuohjeet
- Hyvä tieteellinen käytäntö ja sen loukkausten käsitteleminen. Helsinki: Tutkimuseettinen neuvottelukunta, 2002.
- OECD Principles and Guidelines for Access to Research Data from Public Funding (2007). OECD:n datasuositus.
- Borg, Sami & Arja Kuula (2007). Julkisrahoitteisen tutkimusdatan avoin saatavuus ja elinkaari. Valmisteluraportti OECD:n datasuosituksen toimeenpanomahdollisuuksista Suomessa. Tampere: Tampereen yliopisto. Yhteiskuntatieteellisen tietoarkiston julkaisuja; 6.
- Nuorteva, Jussi (2008). Tiedonhallintasuunnitelma tehostaa tutkimusdatan käyttöä. Tieteessä tapahtuu 8/2008, 36-40.
- Beagrie Neil, Julia Chruszcz & Brian Lavoie (2008). Keeping research data safe. A cost model and guidance for UK universities.
- Ruusalepp, R. & Pryor, G. (2008). Infrastructure Planning and Data Curation. A comparative study of international approaches to enabling the sharing of research data.
- The Preservation Management of Digital Material Handbook. Digital Preservation Coalition.
- Yhteiskuntatieteellinen tietoarkisto
- Erilaisia sähköisten aineistojen elinkaarimalleja