Page tree
Skip to end of metadata
Go to start of metadata


Kootaan tähän kevään 2020 infrojen DMPol-kommentoinissa esiin nousseet huomiot ja kokemukset jatkosuunnittelua varten.


0) Yleistä infrojen tiimoilta

  • Tampere tuottanut koko organisaation tasoisen DMPolin. 
  • Tampereen DMPol täällä: https://trepo.tuni.fi/handle/10024/105878
  • Herättääkö tämä ajatuksia?
    • Miten sovelletaan yksittäisen infran suunnitelmissa? Saattaa antaa jotain suuntaviivaa mihin pitää infran DMPolissa kiinnittää huomio.
    • Voisi antaa kotiorganisaation raamia, jota voisi soveltaa


1) Kevään 2020 DMPol kommentoinnin workflow

  • Mikä onnistui? Mitä voisi kehittää esim. tulevaa SAn haun DMP-kommentointi/hyväksyntää/"dekaaneille" valmistelua varten?
  • Kommentoinnissa suunnitelmien kierrätykseen käytettävä alusta - miten Tuulia pitäisi kehittää, että kommentointi olisi jouhevampaa?
  • Miten hoidetaan tietotekniikkaosaston, lakimiesten yms. oikeuksien hallinta, mikäli heidän osaltaan joudutaan toimimaan Tuulin ulkopuolella?
  • Organisaatioiden välinen yhteinen kommentointi laajempien useampia eri organisaatioita yhdistävien DMPolien osalta!!??
    • Vastuu jossain kotiorganisaatiossa mutta konsortion muiden organisaatioiden tukipalvelut voisivat olla mukana tässä - selvitellään!!


2) Kommentoinnissa ilmeni joidenkin infrojen kohdalla kehitettävää datanhallinnan osalta, pitäisikö näille tarjota jonkinlaista jatkopalvelua?

  • palaveria (keskustellaan haasteista pyritään löytämään ratkaisuja), infotilaisuutta, kohdennettua koulutusta?
  • EHDOTUS: Keskustelllaan esim. oman organisaation infroista vastaavan kanssa (infratoimikunta, tietosuojavastaava, muita, keitä muita?), pitäisikö infroille ruveta kehittämään systemaattisempaa tukipalvelua,
    • Olisiko esim. yhteinen infrapäivä hyvä juttu? Olisi hyvä juttu! Esim. pari kolme infraa esittelevät omia työnkulkujaan, DMPolejaan etc.
    • Ens vuoden rahahaun yhteydessä voisi pitää nyt tiekartalle päässeille sparrauspäivän. Monet olivat pihalla esim. infran datoihin liittyvistä vastuista.


3) Palautetta DMPolin kysymykset ja rakenteen tuottaneelle ryhmälle sekä palautetta Suomen Akatemialle?

  • Onko kysymyksissä tai rakenteessa jotain periaatteellista ongelma?
    • Ainakin skaalautuvuutta eri infratyyppeihin ja infrojen laajuuksiin ei oltu ymärretty
    • FAIR sekoitti vastailua; tämän roolia pitäisi tarkentaa
    • Vastaavia ongelmia kuin Akatemian perusDMP-luonnostelussa
    • Miten tuetaan avoimuutta oli selkeästi vaikea ymmärtää?
    • Kenelle DMPol kirjoitetaan? Mikä on kohderyhmä?
  • Onko Suomen Akatemialle toimitettavaa palautetta?
    • Merkkimäärä/sivumäärä: hankalaa määritellä jos käytetään kuvia tai taulukoita; Eli voisi olla huomio, että voit käyttää myös taulukoita ja kuvia.
      • Monissa oli tosi hyviä kuvia; voisi kysyä saako näitä käyttää esim. opetusmielessä?
    • Johdanto/motivointiosuus alkuun? Voisi olla esim:
      • Erityisesti kenelle tätä DMPolia kirjoitetaan;
      • Maininta siitä, että jos taustalla on esim. KV-politiikka, niin maininta, että voit seurata sitä
    • Tarvitaanko DMPol ohjeita kysymyksen ja rakenteen oheen?
      • Ei tarvetta; DMPolin kirjoittajat olivat ymmärtäneet erittäin hyvin, mitä kysymyksillä ajataan takaa jo nyt!
        • Pääsynhallinta oli ehkä ainoa hankala
        • Datan määrä: arvioijat eivät ole kiinnostuneita yksityiskohtaisesti datan määrästä; ainoastaan jos aletaan puhua yli 10 tera datantuotosta vuositasolla

https://www.aalto.fi/en/otanano/otanano-open-publishing-and-data-policy

Päällekkäisyydet tukimussuunnitelman kanssa ja Akatemian sivujen ohje, joissa viitattiin hassussa kohdassa eurooppalaiseen ohjeeseen (esim. access to infra vs. DMPolicy, eli pitäisikö viitettä tarkentaa.) (Ks. 4. Principles, kohta h: Research data management, sivu 11)


4) DMPol sisältökommentointi

  • DMPolien kommentointi paljasti, että infrojen johtajilla ja suunnittelijoilla on heikot datanhallintataidot!! Oppiminen oli kuitenkin erittäin nopeaa ensimmäisen kommenttikierroksen ja zoom-palaverin jälkeen!
  • DMPolin kunkin osa-alueen kriittiset "hälytyskellot"; mitä missäkin kohdassa on syytä olla, mikä oli liikaa jne?
  • Alakysymyksiin ei tarvitse vastata erikseen, mikäli on luontevampaa niputtaa vastaus yhdeksi kokonaisuudeksi - näin voi välttää päällekkäisyyksiä. (VOIKO SIIRTÄÄ MOTIVOINTIIN?)
  • DMPolin kysymykset ja lopulta vastaukset niihin tuottavat ainakin joiltain osin infran käyttöehdot, palvelukuvauksen jne. - onko näin? Jos on näin, niin silloin DMPol-kirjoittamista voisi motivoida sillä, että tämä teidän pitää joka tapauksessa tuottaa, kun avaatte infran käyttöön jne. (DMPol ja Käyttöehdot eivät sama asia; ks. seuraava bullet point.)
  • DMPolin tarkoitus on kuvata rahoittajille infran tarjoamat palvelut esim. perustelut (kuvailut?) siitä miten tuetaan avointa tiedettä. Mihin kohtaan suunnitelmaa tämä pitäisi laitaa mielestänne? Tutkimussuunnitelmaan vai datapolitiikkaan? Vai molempiin omalla painotuksellaan? Infrastruktuuri voi tuottaa muitakin palveluita kuin datanhallintaa (ohjelmistot, koulutus, mittalaitteiden itsenäinen käyttö, mittauspalveluita). EU:n tekstistä: Access can be granted, amongst others, to machine time, computing resources, software, data, data-communication services, trust and authentication services, sample preparation, archives, collections, the set-up, execution and dismantling of experiments, education and training, expert support and analytical services. Vai ovatko nämä kaikki dataan liittyviä palveluita sitten kuitenkin?  Jos palvelut ovat maksullisia, onko se vastoin avointa tiedettä?
  • Kommentoijana on ymmärrettävä ehkä paremmin infrastruktuurin kypsyystaso (tai oikeastaan elinkaaritaso). Ollaanko vasta suunnittelemassa yhteistä infraa vai onko infralla jo vakiintuneet toimintavat (esim. kv-infraan liittyvillä voi olla). DMPolin tekeminen tavellaan käynnisti muutamassa ryhmässä tämän elintärkeän keskustelun konkreettisista toiminnoista ja prosessesista, mitä dataa kerätään, tuotetaan, kenelle, kenen käyttöön, mihin se jää ja miten se avataan tai kuka sen avaa ja miten?


OSIOErityisesti huomioitavaaTässä kohdassa pakko olla mainittunaEi kuulunut tähän kohtaan
Akatemian ohjeet www.sivuilla

Terminologiaa pitää tarkentaa  akatemian sivuilla ja linkityksissä, infrastruktuurien kohdalla käytettävä sana Data Management Policy (DMPol)





Johdantoteksti

Akatemian ohje

Data management policy -svustolla


Research infrastructures should have a research data management policy that offers guidelines and facilitates data management. This entails having clear instructions on how and where the produced data can be preserved for reasonable periods of time and on how the user should make the data available for and (re-)use [1]. Data produced by the research infrastructure should be FAIR (findable, accessible, interoperable and re-usable).

Johdantotekstin mukaan pitäisi vastata siihen, miten infran käyttäjän pitää tehdä data saataville ja uudelleen käytettäväksi → dokumentti, johon viitataan, käsittelee aihetta, miten infran pitäisi olla laajasti ja avoimesti käytettävissä, ei koske pelkkää dataa, vaan palveluja, laitteita jne. Tämä on hyvä yleisohje infralle, jossa mainitaan, että pitää olla myös datanhallintasuunnitelma. Viittaus olisi ollut parempi liittää alla olevaam kohtaan toimintasuunnitelmassa:

4.3 Tutkimusinfastruktuuritoiminnan pitkäjänteisyys ja dynaamisuus, Tutkimusinfrastruktuurin tarjoamat palvelut ja käyttö.

Seuraavassa lauseessa edellytetään, että infran tuottama data pitää olla FAIR.



Jotkut tiekartalle hakevat infrat Suomessa liittyvät kansainväliseen suurempaan tutkimusinfrastruktuuriin, jolla on jo selkeä yhtein datanhallintapolitiikka. Silloin DMPolicyn tekeminen on selkeämpää kuin se, että tehdään jotain ihan ensimmäisenä.

Infran kypsyysasteetta riippuen, voi olla ettei ole vielä mitään suuntaviivoja, miten dataa hallinnoidaan yhteisen politiikan mukaan. Infran saattaa kuulua monta osapuolta, jossa jokaisessa yksikössä on  omat systeemit datan tuottamiseen, varmuuskopiointiin, jakamiseen ja tallentamiseen.

Ensin on tiedostettava:

mitä infrassa tehdään? kuka tekee ja miten, millä välineillä, mitä infrassa tuotetaan ja kenelle? Nämä nimenomaan datan kannalta




Pitääkö infran tarjoamat avoimet palvelut kuvat DMPolissa vai Toimintasuunitelmassa? Näiden suhde on joskus hankala.
General description of data


  • What kinds of data are produced by or associated with the research infrastructure?
  • What ethical guidelines are in place regarding produced data, e.g. personal or sensitive data?
  • Give a rough estimate of the size of the data produced eg. per day, month or year.
  • What kinds of data quality control procedures are used or recommended to users?
Jos dataa tuotetaan vain tutkijan omaan käyttöön, tuotetun datan määrä arviointi voi olla hankalaa.









Agreements on rights of use and license


  • Who owns and administers the data? How are ownership and user rights agreed upon?
  • Who has the right to use the data?
  • What kind of guidelines do you give to users about licenses? What license(s) do you recommend for data sharing?

Infraan kertyneen datan käyttöoikeus ja omistajuus on sovittava. Jos tutkija mittaa tai mittauttaa infrassa omaan tutkimukseensa datan, pitäisi olla sopimus, jos data jää myös infraan, mihin sitä voidaan käyttää.








Opening or sharing data


What kind of guidelines do you give to users on the following issues:

  • what part of the data can be made openly available or published?
  • where can the data, or its metadata, be made available?
  • how should the research infrastructure be cited?
Tässä kohdassa mennään sekaisin, jos ei tiedetä, kuka omistaa infrassa tuotetun datan. Tai kuka, missä ja kuinka kauan säilytetään esim. mittalaitteella mitattu data? Jääkö data infraan vai saako tutkija sen mukaansa? Ja jos data jää infraan, kuka sen omistaa, kuka sitä voi käyttää? Kuinka kauan sitä säilytetään? Avaako tutkija itse datansa vai avataanko se infran puolesta? Vai sekä että, esim. tutkija avaa julkaisun taustadatan ja infra avaa datan muun infrassa tuotetun datan osana?









Documentation & metadata


What kind of tools and guidance do/will you provide for data documentation and metadata?

  • Does your infrastructure produce standardized metadata?
  • If the users produce metadata, how do you support standardized metadata production?
  • Do you provide a unique and persistent identifier (such as a Digital Object Identifier (DOI)) to data sets?











Storage, backup & access control to data


  • Do you provide service for data storage or backups?
  • Do you provide service for storing sensitive data?
  • How do you control access to data storage?





What kind of guidelines do/will you provide for long-term preservation of data?

Itse asiassa pitkäaikaissäilytykseen ei luokkaan a kuuluvien infrojen edes tarvitsisi vastata tähän. Infrastruktuurien elinkaarikategoriat (toiseksi viimeinen rivi taulukossa)











  • No labels