Page tree
Skip to end of metadata
Go to start of metadata


PUBLISHED VERSION:2021####

Translated, proofread and checked versions (updated 202#####):


DRAFT Updated 26.1.2021.


Section
0. Introduction / VERSIO 2020
TÄHÄN SARAKKEESEEN UUSI MUOTOILUEHDOTUS 
TÄHÄN SARAKKEESEEN VOI LAITTAA VAPAITA KOMMENTTEJA/KESKUSTELUA

13.1.2021 KOKOUKSEN MUISTIINPANOT

26.1.2021 KOKOUKSEN MUISTIINPANOT ja PÄÄTÖKSET

Motivation

Motivointiosio

Motivation

How do I write a DMP? - READ THIS FIRST!

  • Read all of the questions first!
  • Use a DMP to complement your research plan – avoid overlaps with the research plan!
  • The research plan describes the scientific, analytical and methodological processing of data.
  • The data management plan describes the technical and administrative management of data.
  • To avoid redundancy, refer to your research plan in your DMP and vice versa.
  • Use the DMP as a risk evaluation document – it shows that you can recognise, anticipate and handle the risks related to your data management workflow.
  • The DMP should be drawn from your own research project – do not copy/paste examples from somewhere else.
  • Write only sentences you yourself understand.
  • Answer the questions where applicable – if a certain question is not applicable in your case, justify why not.
  • Answer at least the main categories – each sub-question does not need to be answered separately.
  • Include background information such as the name of the applicant and the project, the project number, the funding programme and the version of the DMP.
  • Demonstrate your data management and version control skills, for example, when considering the name of the DMP file.
  • Follow the organisation’s or funder’s requirements.


Why should you manage your research data and write a data management plan (DMP)?

  • It is good research practice!
  • You will reduce the risk of losing your data.
  • You will be able to anticipate complex ownership and user rights issues in advance.
  • It helps you support open access to create productive future collaborations.
  • You will meet your funder’s requirements.
  • It helps you save time and money.
  • Your DMP reflects your managerial skills as a project leader.


In the DMP context, ‘data’ is understood as a broad term. Data covers all of the information and material your research results are based on. You can concentrate on the data, which is your responsibility.


Your DMP should describe how you will manage the data throughout the life cycle of your research. The DMP is a living document, which should be updated as the research project progresses.


Your research data management practices should aim to produce reusable data, which follows FAIR principles, that is, your data will be Findable, Accessible, Interoperable and Re-usable.


Good luck with your DMP!

Your DMP is a living document where you describe how you will manage your data throughout the research life cycle and update the plan when your project progresses. 

To avoid redundancy, refer to your research plan in your DMP and vice versa. The research plan describes the scientific, analytical and methodological processing of data, whereas the DMP describes the technical and administrative management of data.

In the DMP context, ‘data’ is understood as a broad term. Data covers all of the information and research material your results are based on.


How do I write a DMP? - READ THIS FIRST!

  • Read all of the questions first! Answer the questions where applicable and at least the main categories – if a certain question is not applicable in your case, justify why not.
  • Include background information such as the name of the applicant and the project, the project number, the funding programme and the version of the DMP. Demonstrate your data management and version control skills, for example, when considering the name of the DMP file.
  • Use the DMP as a risk evaluation document – it shows that you can recognise, anticipate and handle the risks related to your data management workflow.
  • The DMP should be drawn from your own research project – do not copy from somewhere else and write only sentences you understand.
  • Follow the organisation’s or funder’s requirements.


Why should you manage your research data and write a data management plan (DMP)?

  • It is good research practice and helps you to save time and money!
  • You will reduce the risk of losing your data.
  • You will be able to anticipate complex ownership and user rights issues in advance.
  • DMP supports making your data FAIR: Findable, Accessible, Interoperable and Re-usable. This will increase data reuse as well as visibility of your project. 
  • You will meet your funder’s requirements.
  • Your DMP reflects your researcher skills.

Motivointiosio kokonaisuudessaan on pitkä. Kannattaisin sen lyhentämistä ja tiivistämistä.  / Tiina S

Samaa mieltä, että tiivistys ja lyhentäminen voisi tehdä hyvää. Tämä palsta oli niin pieni, että kirjoittelin ehdotelman docsiin. Muutin myös järjestystä ja yritin saada pari palluraa vähemmän (smile) / Siiri F.

Siirin ehdototus on hyvä! Bullet pointsit ovat sinänsä toimivia, mutta vain jos niitä ei ole kovin montaa. Kommenttejamme miettiessämme huomasimme moneen otteeseen, että palluroita ei tule luettua järjestyksessä, jos tulee luettua lainkaan. Siiri on saanut hyvin ryhmitettyä toisiinsa liittyvät kohdat ja teksti on selkeämpi ja luettavampi. / Jari & Saila

How do I write a DMP? - READ THIS FIRST!

  • Tämä lista on melko pitkä, Voisiko mitenkään lyhentää? Poistaa mahdolliset toistot tai samaa asiaa tarkoittavat lauseet esim
    • Use a DMP to complement your research plan – avoid overlaps with the research plan! / To avoid redundancy, refer to your research plan in your DMP and vice versa.
    • Answer the questions where applicable – if a certain question is not applicable in your case, justify why not / Answer at least the main categories – each sub-question does not need to be answered separately.
    • Include background information such as the name of the applicant and the project, the project number, the funding programme and the version of the DMP / Demonstrate your data management and version control skills, for example, when considering the name of the DMP file.
    • version of the DMP => olisiko niin tärkeä kohta, että pitäisi laittaa omaksi kohdakseen? Voisiko  tähän yhteyteen liittää pienen kappaleen alempaa? : Your DMP should describe how you will manage the data throughout the life cycle of your research. The DMP is a living document, which should be updated as the research project progresses. (Tiina S) → mä en ehkä tekis omaa bullettia tästä (Siiri)
    • "Demonstrate your data management and version..." -palluran voisi jättää pois kokonaan, tai ainakin havainnollistaa, miten DMP-tiedoston nimeäminen on osoituksena aineistonhallintataidoista. / Jari & Saila

Why should you manage your research data and write a data management plan (DMP)?

  • Tätä kohtaa voisi hieman avata/selventää : It helps you support open access to create productive future collaborations
    • viittaako tuleviin tutkimusyhteistyökumppaneihin, joita mahdollinen avoin (meta)data tuottaa?
    • pelkkä fraasi "open access" mielletään helposti julkaisujen avoimuudeksi
    • productive future collaborations => onko adjektiivi productive tuossa kohtaan turhaan?  (Tiina S)

→ mä olisin ehkä muotoillut eri tavalla ja yhdistänyt fairiin: "DMP supports making your data FAIR: Findable, Accessible, Interoperable and Re-usable. This will increase data reuse as well as your visibility. " / siiri

  • Pitäisikö hyödyissä olla maininta myös siitä, että DMP on ensimmäinen askel tutkimusaineistojen hallintaa FAIR-periaatteen mukaisesti? => DMP supports principles of FAIR data management
    • Pieni kpl alempaa hyötyihin?:  Your research data management practices should aim to produce reusable data, which follows FAIR principles, that is, your data will be Findable, Accessible, Interoperable and Re-usable. (Tiina S)

Päivi 4.1.2021: Yllä oleviin Tiinan ja Siirin kommentteihin kommentti: FAIR-näkökulma tulisi tuoda tässä esiin kuitenkin niin, ettei tutkija luule, että periatteet toteutuu automaattisesti kunhan vaan on DMP tehty. 

In the DMP context, ‘data’ is understood as a broad term. Data covers all of the information and material your research results are based on. You can concentrate on the data, which is your responsibility.

  • käsitteet ovat vaikeita
  • mutta onko research material laajin, sitten data (joka aina digitaalista) ja lopulta metadata  (Tiina S)


Samaa mieltä että tätä osiota voisi lyhentää.  “Your DMP reflects your managerial skills as a project leader.” Eikös DMP osoita yleisesti tutkijan taitoja, ei vain projektin johtajan taitoja? Voisiko muotoilla ”skills as a researcher”? Olisi tällöin kaikille tutkijoille motivointia, ei vain hankkeen johtajille. (Anne)

Kati 23.12.2020: voisiko korostaa, että DMP:n päivitys ei kuulu vain tutkimuksen johtajille. Esim. "Your DMP reflects your managerial skills irrespective of your role in the project."

Kati 23.12.2020: Tässä voisi korostaa että data management plan kattaa tosiaan kaikki tutkimustuotokset, mukaanlukien koodit. Esim. näin: "Here, data covers all of the information and materials your research produces, including, but not limited to, documents and software codes". 

On ihan hyvä kehottaa välttämään DMP:n päällekkäisyydestä tutkimussuunnitelman kanssa, mutta eikö riittäisi, että tämä se on mainittu tässä. Ohjeesta saa mittaa pois jo sillä, että poistaa tämän varoituksen muiden kysymysten lopusta. Päällekkäisyys tutkimussuunnitelman kanssa ei välttämättä ole edes haitaksi varsinkin nyt, kun DMP:t tulee meidän kommentoitaviksemme. / Jari & Saila

Mitä tarkoitetaan kohdan "Data covers all of the information and material your research results are based on" material -sanalla? Vie ajatukset kohti fyysisiä näytteitä. Jari & saila

Mitä tarkoittaa "You can concentrate on the data, which is your responsibility." Eikö tutkija ole aina vastuussa siitä datasta, mitä käsittelee? Siis joko itselleen, tutkittaville tai muulle taholle. Jos taas tämä viittaa yhteistyöhankkeisiin, niin sitten selventäisin tätä hiukan. Esim. In collaborative projects, you can concentrate on the data which is your responsibility. Toisaalta yhteisprojekteissakin (yhteis)kirjoitetaan yleensä vain yksi DMP. → jättäisimme epäselvänä ohjeena pois. Jari & Saila

Data covers all of the information and research material

poistetaan: You can concentrate on the data, which is your responsibility.

Jätetään Avoid overlaps -kohdat kuten ovat olleet.


Vielä pieniä tarkennuksia KORJATTU PUNAISEEN SARAKKEESEEN:

  • --- as well as your → as well as visibility of your project
  • Your DMP reflects your managerial skills as a project leader. →
  • Your DMP reflects your researher skills.

MUILTA OSIN HYVÄKSYTTÄVISSÄ 26.1.2021 kokouksessa?


VALMIS - HYVÄKSYTÄÄN 26.1.





1. General description of the dataTÄHÄN SARAKKEESEEN UUSI MUOTOILUEHDOTUSTÄHÄN SARAKKEESEEN VOI LAITTAA VAPAITA KOMMENTTEJA/KESKUSTELUA13.1.2021 KOKOUKSEN MUISTIINPANOT26.1.2021 KOKOUKSEN MUISTIINPANOT ja PÄÄTÖKSET

1.1 What kinds of data is your research based on? What data will be collected, produced or reused? What file formats will the data be in? Additionally, give a rough estimate of the size of the data produced/collected.

1.1 Millaiseen aineistoon tutkimuksesi perustuu? Millaista aineistoa kerätään, tuotetaan tai käytetään uudelleen? Missä tiedostomuodossa aineisto on? Esitä myös karkea arvio tuotettavan/kerättävän aineiston koosta.

1.1 Vilka slags data baserar sig forskningen på? Hurdana data samlas in, produceras eller återanvänds? Vilka filformat används? Ge även en grov uppskattning av hur mycket data som kommer att produceras eller samlas in.

Briefly describe what types of data you are collecting or producing. In addition, explain what kinds of already existing data you will (re)use. List, for example, the types of texts, images, photographs, measurements, statistics, physical samples or codes.

Categorise your data in a table or with a clear list, for example:
A) data collected for this project,
B) data produced as an outcome of the process,
C) previously collected existing data which is being reused in this project,
D) managerial documents and project deliverables, and so on.

The categorisation follows the license policy of your data sets. For example, briefly describe the license according to which you are entitled to (re)use the data. The categorisation can form a general structure for the rest of the DMP.

List the file formats for each data set. In some cases, the file formats used during the research project may differ from those used in archiving the data after the project. List both. The file format is a primary factor in the accessibility and reusability of your data in the future.

In the DMP, what is important is to describe the required disk space, not how many informants participated in the project. A rough estimation of the size of the data is sufficient, for example, less than 100 GB, approx. 1 TB or several petabytes.

Tips for best practices

  • Use a table or bullet points for a concise way to present data types, file formats, the software used and the size of the data.
  • Examples of file formats are .csv, .txt, .docx, .xslx and .tif.
  • Make sure to describe any special or uncommon software necessary to view or use the data, especially if the software is coded in your project.
  • You can also estimate the increase in data production or collection during the project for a specific time period: "The project is producing/collecting approximately 100 GB of data per week."


AVOID OVERLAPS WITH THE RESEARCH PLAN! Data analysis and methodological issues related to data and materials should be described in your research plan.

Briefly describe what types of data you are collecting or producing. In addition, explain what kinds of already existing data you will (re)use. List, for example, the types of texts, images, photographs, measurements, statistics, physical samples or codes.

Categorise your data in a table or with a clear list, for example:

A) previously collected existing data which is being reused in this project,

B) data collected for this project ,

C) data produced as an outcome of the research process.

The categorisation can form a general structure for the rest of the DMP.

List the file formats for each data set. In some cases, the file formats used during the research project may differ from those used in archiving the data after the project. List both. The file format is a primary factor in the accessibility and reusability of your data in the future.

In the DMP, what is important is to describe the required disk space, not how many informants participated in the project. A rough estimation of the size of the data is sufficient, for example, less than 100 GB, approx. 1 TB or several petabytes.

Tips for best practices

  • Use a table or bullet points for a concise way to present data types, file formats, the software used and the size of the data.
  • Examples of file formats are .csv, .txt, .docx, .xslx and .tif.
  • Make sure to describe any special or uncommon software necessary to view or use the data, especially if the software is coded in your project.
  • You can also estimate the increase in data production or collection during the project for a specific time period: "The project is producing/collecting approximately 100 GB of data per week."


AVOID OVERLAPS WITH THE RESEARCH PLAN! Data analysis and methodological issues related to data and materials should be described in your research plan.


The categorisation follows the license policy of your data sets. For example, briefly describe the license according to which you are entitled to (re)use the data. The categorisation can form a general structure for the rest of the DMP.

=>  On luultavasti vaikea asia luokitella datoja käyttölisenssien mukaan. Hyvä, jos näin osataan tehdä.  Minulle ei ihan avaudu, miksi aineistotyypit pitää kategorisoida näin tässä kohdin (Tiina S)

Voi kyllä olla hankala ymmärtää tuosta oranssista lauseesta /siiri (en kyllä osaa tehdä parempaa tähän hätään)

Samaa mieltä että aineiston kategorisoiminen käyttölisenssien mukaan tässä haasteellista. Voisiko oranssista kappaleesta jättää pois kaksi ekaa lausetta ja jättää vain "The categorisation can form a general structure for the rest of the DMP."  (Anne) = TÄMÄ HYVÄ JÄTETÄÄN ÄTÄ

Onko kohta ”D) managerial documents and project deliverables, and so on.” tarpeellinen vai voisiko jättää pois? Ohjaa kuvailemaan hankkeen hallintaan liittyviä dokumentteja, jotka eivät suoraan liity aineistonhallintaan. (Anne)

Ehdottaisimme tähän kohtaan alla olevaa jaottelua / Jari & Saila

  1. Data collected or produced by you or your research group
  2. Data collected by other researchers
  3. Data which has been collected mainly for other than research such as register data, statistical data, open data etc.
  4. Other materials needed to use and understand the data, such as codes, software, lab notebooks etc.

Kati 23.12.2020: Jäin miettimään tuota "make sure to describe...". Ei liene kovin yleistä että projektissa koodattaisiin softaa, joka tuottaa erikoisia tiedostoformaatteja. Yleisempää lienee että koodataan skriptejä, joilla dataa käsitellään ja olemassaolevia softapaketteja käytetään sen lisäksi ja nämä paketit voivat tuottaa harvinaisia tiedostoformaatteja. Olisiko parempi selkeyttää sanomuotoa esim. "make sure to describe any special or uncommon software necessary to view or edit the data".


Tuo avoid overlap on kyllä hyvä lisä! /siiri


Ensimmäisenä kysymyksenä DMP:ssä pitäisi kysyä ”How will new data be collected”, kuten kysytään myös Science Europen pohjassa. Ja mielellään omana kysymyksenään. Tämä luo kontekstia DMP:lle ja helpottaa esim. DMP:n kommentointia, kun tietää edes ketä haastatellaan, tai keille kysely on lähetetty jne. Tokihan DMP:tä kommentoidessa pitäisi olla tutkimussuunnitelma mukana, mutta aina ei vain ole. Tässä ensimmäisessä kysymyksessä ei ole lainkaan haittaa siitä, että DMP menee päällekkäin tutkimussuunnitelman kanssa.

Siispä, ehdotamme, että tämän ensimmäisen kohdan kysymykset korvattaisiin Science Europen kysymyksillä

1a How will new data be collected or produced and/or how will existing data be re-used?

1 b What data (for example the kind, formats, and volumes), will be collected or produced?

Datan laatua käsittelevä kysymys sopisi vanhalle paikalleen Documentation and Quality kohtaan, kuten on myös Science Europen pohjassa. Kohdasta kolme jää vaikutelma, että siitä puuttuu jotain, kun ainoa kysymys on 3.1. Missä on 3.2?

Lisäksi jättäisimme myös kohdan "avoid overlap" pois tästä - ja muistakin kysymyksistä. Riittää, että se on mainittu motivointiosuudessa. DMP:n päällekkäisyydestä tutkimussuunnitelman kanssa ei ole juurikaan haittaa eikä sitä voi oikein edes välttää. - Jari & Saila

Lauseessa "A rough estimation of the size of the data..." olisi selkeämpi viitata suoraan tallennuskapasiteettiin, eli, "A rough estimation of the storage capasity needed is sufficient." - Jari & Saila = OTETAAN TÄMÄ KÄYTTÖÖN

Lauseen "Examples of file formats are .csv, .txt, .docx, .xslx and .tif" tiedostomuodot eivät avaudu kaikille. Tämän voisi selventää esim. ".csv or .xslx for tables, .txt and .docx for text, .tif for pictures

Kysymysten muuttaminen muuttaa työmäärää muuallakin. Nykyinen kysymys on tarkempi RDM-maailmaa ajatellen kuin Science Europen vastaava.  > säilytetään aiemmat kysymykset

Avoid overlaps > säilytetään, tämä on sanottu vielä tarkemmin motivointi-kohdassa. 

kategorisointi: tiivistys ja selkeytys

kategorioiden muutokset:
c>a, b> c, a>b  (enemmän kronologisesti)

(kategori c) outcome of the process täsmennys: research process

KATEGORIAN KOHTA D VOISI OLLA VAIN EETTISESSÄ KOHDASSA:

D) managerial documents and project deliverables, and so on.


A rough estimation of the storage capasity needed is sufficient

tiedostomuodot: esimerkit vie ajatukset konkretiaan > jätetään


Tuulitoimisto stilisoi tämän kohdan (1.1) valmiiksi.





VALMIS - HYVÄKSYTTÄVISSÄ 26.1.2021 kokouksessa?



VALMIS - HYVÄKSYTÄÄN 26.1.

1.2 How will the consistency and quality of data be controlled?

1.2 Miten aineiston yhtenäisyys ja laatu varmistetaan?

1.2 Hur kontrolleras datamaterialets enhetlighet och kvalitet?

Explain how the data collection, analysis and processing methods used may affect the quality of the data and how you will minimise the risks related to data accuracy.

Data quality control ensures that no data is accidentally changed and that the accuracy of the data is maintained over its entire life cycle. Quality problems can emerge due to the technical handling, converting or transferring of data, or during its contextual processing and analysis.

Tips for best practices

  • Transcriptions of audio or video interviews should be checked by someone other than the transcriber.
  • Analog material should be digitised in the highest resolution possible for accuracy.
  • In all conversions, maintaining the original information content should be ensured.
  • Software-producing checksums should be used.
  • Organise training sessions and set guidelines to ensure that everyone in your research group can implement quality control and anticipate the risks related to the quality of the data.

AVOID OVERLAPS WITH THE RESEARCH PLAN! Issues related to data analysis, methods and tools should be described in your research plan, that is, do not include, for example, instrument calibration descriptions here.

Explain how the data collection, analysis and processing methods used may affect the quality of the data and how you will minimise the risks related to data accuracy.

Data quality control ensures that no data is accidentally changed and that the accuracy of the data is maintained over its entire life cycle. Quality problems can emerge due to the technical handling, converting or transferring of data, or during its contextual processing and analysis.

Tips for best practices

  • Adopt and enforce formal version control processes. This can mean e.g. simply shared and documented file naming conventions, or everyone in team working in Git repositories. 
  • Transcriptions of audio or video interviews should be checked by someone other than the transcriber.
  • Analog material should be digitised in the highest resolution possible for accuracy.
  • In all conversions, maintaining the original information content should be ensured.
  • Organise training sessions and set guidelines to ensure that everyone in your research group can implement quality control and anticipate the risks related to the quality of the data.

AVOID OVERLAPS WITH THE RESEARCH PLAN! Issues related to data analysis, methods and tools should be described in your research plan, that is, do not include, for example, instrument calibration descriptions here.

Tarkistussummien käyttö on hyvän neuvo, mutta menee varmasti monelta ohi. Se kuitenkin liittyy kiinteästi edelliseen bulletpointsiin, joten yhdistmällä nämä saadaan tarkistussummille selitys - tai ainakin selvennys siitä, mihin tarkistussumma ylipäätään liitty. Ehdotamme siis seuraava yhdistetään pointsit. - Jari & Saila

  • In all conversions, maintaining the original information content should be ensured and software-producing checksums should be used.

Lisätään Jarin ja Sailan ehdotus muokattuna: OR software-producing checksums should be used. > lopulta poistettu kokonaan

checksum -onko tutkijoiden työkalu? -liian hieno työkalu?
-ei voida luetella kaikkia työkaluja > poistetaan

versionhallinta syytä mainita myös tässä kohdassa:
Adopt and enforce formal version control processes. This can mean e.g. simply shared and documented file naming conventions, or everyone in team working in Git repositories. (Janne Seppänen) > lisätty tipseihin

VALMIS - HYVÄKSYTTÄVISSÄ 26.1.2021 kokouksessa?


VALMIS - HYVÄKSYTÄÄN 26.1.


2. Ethical and legal complianceTÄHÄN SARAKKEESEEN UUSI MUOTOILUEHDOTUS TÄHÄN SARAKKEESEEN VOI LAITTAA VAPAITA KOMMENTTEJA/KESKUSTELUA13.1.2021 KOKOUKSEN MUISTIINPANOT26.1.2021 KOKOUKSEN MUISTIINPANOT ja PÄÄTÖKSET

2.1 What legal issues are related to your data management? (For example, GDPR and other legislation affecting data processing.)

2.1 Mitä juridisia seikkoja liittyy aineiston hallintaan (esim. EU:n yleinen tietosuoja-asetus ja muu aineiston käsittelyyn liittyvä lainsäädäntö)?

2.1 Vilka juridiska frågor är relevanta för datahanteringen? (Till exempel GDPR och annan lagstiftning som påverkar behandling av data.)

All types of research data involve questions of rights and legal and ethical issues. Demonstrate that you are aware of the relevant legislation related to your data processing. If you are handling personal or sensitive information, describe how you will ensure privacy protection and data anonymisation or pseudonymisation.

Tips for best practices

  • Check your institutional ethical guidelines, data privacy guidelines and data security policy, and prepare to follow the instructions that are given in these guidelines.
  • If your research is to be reviewed by an ethical committee, outline in your DMP how you will comply with the protocol (e.g., how you will remove personal or sensitive information from your data before sharing data to ensure privacy protection).
  • Will you process personal data? If you intend to do so, please detail what type of personal data you will collect.
  • All data related to an identified or identifiable person is personal data. Information such as names, telephone numbers, location data and information on the congenital diseases of the individual's grandparents is personal data.
  • Office of the Data Protection Ombudsman (https://tietosuoja.fi/en/processing-of-personal-data)


AVOID OVERLAPS WITH THE RESEARCH PLAN! Details of the ethical issues, the ethical committee statements and the use of laboratory animals should be described in the research plan.

All types of research data involve questions of rights and legal and ethical issues. If you are handling personal or sensitive information, describe how you will ensure privacy protection and data anonymisation or pseudonymisation.

Tips for best practices

  • Check your institutional ethical guidelines, data privacy guidelines and data security policy, and prepare to follow the instructions that are given in these guidelines.
  • If your research is to be reviewed by an ethical committee, outline in your DMP how you will comply with the protocol (e.g., how you will remove personal or sensitive information from your data before sharing data to ensure privacy protection).
  • Will you process personal data? If you intend to do so, please detail what type of personal data you will collect.
  • All data related to an identified or identifiable person is personal data. Information such as names, telephone numbers, location data and information on the congenital diseases of the individual's grandparents is personal data.
  • Office of the Data Protection Ombudsman (https://tietosuoja.fi/en/processing-of-personal-data)


AVOID OVERLAPS WITH THE RESEARCH PLAN! Details of the ethical issues, the ethical committee statements and the use of laboratory animals should be described in the research plan.

Kati 23.12.2020: "... personal or sensitive data..." → Henkilödata lienee sensitiivisen datan alaluokka, joten olisiko selvempää sanoa esim. "If you are handling sensitive information, such as personal data, describe..."

→ siiri: eihän kaikki personal data ole sensitive personal dataa eli en lähtis noin muuttamaan.  https://ec.europa.eu/info/law/law-topic/data-protection/reform/rules-business-and-organisations/legal-grounds-processing-data/sensitive-data/what-personal-data-considered-sensitive_en

Eettinen osuus ei tule esiin varsinaisissa kysymyksissä lainkaan. Ohjeessa kuitenkin tulee. Jos eettisiä asioita halutaan kysyä, niin ne pitäisi olla selkeästi omana kysymyksenään. Sinänsä tarvetta eettisten asioiden kysymiselle ei välttämättä ole, sillä niitä käsitellään jo tutkimussuunnitelmassa. Mallia jäsennyksestä voisi ottaa Science Europen pohjasta s. 21. Siinä tämä kohta on jaettu kolmeen kysymykseen: 

4 a) If personal data are processed, how will compliance with legislation on personal data and on security be  ensured?

4 b) How will other legal issues, such as intellectual property rights and ownership, be managed? What legislation is applicable?

4 c) What ethical issues and codes of conduct are there, and how will they be taken into account?

Tässä jaottelussa myös henkilötietojen käsittely saa oman kysymyksensä, mikä selkeyttää suunnitelmaa ja ennakoi myös koneluettavuuden tavoitetta. Eettiset asiat ja GDPR ovat isoja asiakokonaisuuksia, joiden käsittely osana lainsäädännöllisiä asioita ei anna niille sitä painoarvoa, mikä niille kuuluu. Koneluettavassa DMP-pohjassa ei voi olla tarpeettomasti polveilevia kysymyksiä.

Ehdotus: Otetaan käyttöön Science Europen kysymykset osioon 2. - Jari & Saila

3. ja 4. bullet pointsi liittyy selkeästi toisiinsa, joten ne kannattaisi yhdistää yhdeksi palluraksi. - Jari & Saila

Mitä tässä halutaan kysyä, halutaanko, että luetteloidaan lakeja?
-vaikutuksenarviointi? > ei - tavoite saada tutkijat kuvaamaan tarkemmin, miten tämä liittyy juuri heidän tutkimukseensa.

-eettiset ja juridiset vaikuttavat myös siihen, voiko aineistoa avata ja se vaikuttaa myös tutkimuksen aikaiseen tallennusratkaisuun.

> poisto (Muuten jätetään ennalleen.): Demonstrate that you are aware of the relevant legislation related to your data processing.



VALMIS - HYVÄKSYTTÄVISSÄ 26.1.2021 kokouksessa?



VALMIS - HYVÄKSYTÄÄN 26.1.

2.2 How will you manage the rights of the data you use, produce and share?

2.2 Miten hallinnoit käyttämäsi, tuottamasi ja jakamasi aineiston oikeuksia?

2.2 Hur hanteras rättigheterna till det datamaterial du använder, producerar och delar?

Describe how you will agree upon the rights of use related to your research data – including the collected, produced and (re)used data of your project. Here, you can employ your categorisation in the first question. Each of these categories involves different rights and licenses. Describe the transfer of rights procedures relevant to your project. Describe confidentiality issues if applicable in your project.

Tips for best practices

  • Check your organisational data policy for ownership, the right of use and the right to distribute.
  • Have you gained consent for data preservation and sharing?
  • Agreements on ownership and rights of use should be made as early as possible in the project life cycle.
  • Consider the funder's policy.
  • It is recommended to make all of the research data, code and software created within a research project available for reuse, e.g., under a Creative Commons (
https://creativecommons.org/choose/), GNU (https://www.gnu.org/licenses/gpl-3.0.en.html) or MIT license (https://opensource.org/licenses/MIT), or under another relevant license.

Describe how you will agree upon the rights of use related to your research data – including the collected, produced and (re)used data of your project. Here, you can employ your categorisation in the first question. Each of these categories involves different rights and licenses. Describe the transfer of rights procedures relevant to your project. Describe confidentiality issues if applicable in your project.

License your data!

Tips for best practices

  • Agreements on rights of use should be made as early as possible in the project life cycle.
  • Have you gained consent for data preservation and sharing?
  • Follow the funder's or publisher's policies.
  • It is recommended to make all of the research data, code and software created within a research project available for reuse, e.g., under a Creative Commons (
https://creativecommons.org/choose/), GNU (https://www.gnu.org/licenses/gpl-3.0.en.html) or MIT license (https://opensource.org/licenses/MIT), or under another relevant license.

Tips for best practices

  • pitäisikö tässä kohtaa olla yksi ranskalainen viiva ja siinä yksiselitteisesti: Licence your data

Minna 07.01.21: Voisiko lisensoinnin nostaa jopa tipseistä ohjetekstiin? Make your research data, code and software created within a research project available under an appropriate licence.

"Consider the funder's policy" jää irralliseksi ja epämääräiseksi lauseeksi. Mihin politiikkaan tällä viitataan? Rahoittajien vaatimuksiin viitataan jo motivoinnissakin. Jari & Saila.

Lisenssisuositus kaipaa täsmennystä siitä, mitä eri lisensseillä on tarkoitus lisensoida. Ehdotus: Use Creative Commons (https://creativecommons.org/choose/) for data, GNU (https://www.gnu.org/licenses/gpl-3.0.en.html), MIT license (https://opensource.org/licenses/MIT) or another relevant open license for softwares and codes.

"Agreements on ownership" on herättää kysymyksen valmiista sopimuspohjista tai ainakin siitä miten omistajuus määrittyy. Onko sellaisia? Minusta omistajuuden voisi epämääräisenä käsitteenä jättää tästä pois, tai laittaa lainausmerkkeihin, jos se pitää tässä välttämättä olla. Mitä lisäarvoa se tuo, jos käyttöoikeuksista (lisenssit), rekisterinpitäjyydestä, aineistonkäsittelystä ja tutkimusluvistakin on jo sovittu. Omistajuudesta sopiminen kuulostaa turhan monimutkaiselta ja herättää lähinnä ihmetystä. Lakimiehetkään eivät tässä yleensä osaa auttaa, vaan kyselevät tästä meiltä. → Ehdotus: poistetaan sana "ownership" - Jari MO KOMMENTTI: Hyvä kommentti ja huomio - poistetaanko ownership?

lisätty: Licence your data!

Tips for best practises
3. pallero ensimmäiseksi: Agreements on ownership and rights of use should be made as early as possible in the project life cycle. 
pois > ownership, the right of use and the right to distribute.

lisätty publisher's > Consider the funder's or publisher's policies. (pitäisi olla myös kohdassa 5).  Consider > Follow


muotoilu jää vielä auki:

  • Follow the funder's or publisher's policies. (vrt. motivaatio-kohtaan)


VALMIS - HYVÄKSYTTÄVISSÄ 26.1.2021 kokouksessa?





Vielä kysymys/keskustelua ownership-sanasta > poistettu



VALMIS - HYVÄKSYTÄÄN 26.1.


3. Documentation and metadataTÄHÄN SARAKKEESEEN UUSI MUOTOILUEHDOTUSTÄHÄN SARAKKEESEEN VOI LAITTAA VAPAITA KOMMENTTEJA/KESKUSTELUA13.1.2021 KOKOUKSEN MUISTIINPANOT26.1.2021 KOKOUKSEN MUISTIINPANOT ja PÄÄTÖKSET

3. How will you document your data in order to make the data findable, accessible, interoperable and re-usable for you and others?  What kind of metadata standards, README files or other documentation will you use to help others to understand and use your data?

3. Miten dokumentoit aineistosi, jotta se on löydettävissä, saavutettavissa, yhteentoimiva ja uudelleen käytettävissä sekä itseäsi että muita varten?  Mitä metatietostandardeja, README-tiedostoja ja muuta dokumentaatiota käytät, jotta muut voivat ymmärtää ja käyttää aineistoasi?

3. På vilket sätt dokumenterar du ditt datamaterial så att det är sökbart, tillgängligt, interoperabelt och återanvändbart?  Vilka metadatastandarder, README-filer eller annan dokumentation kommer att användas för att andra ska kunna förstå och återanvända datamaterialet?

Data documentation enables data sets and files to be discovered, used and properly cited by other users (human or computer). Documentation includes essential information regarding the data, for example, where, when, why and how the data were collected, processed and interpreted. Without the proper documentation, your data is useless. Describe the tool, such as Qvain, that you will use to describe your data sets. Do not mention metadata standards if you do not use them. You can anticipate the open accessibility of your data and its description already here. However, a detailed description of which part of your data can be set openly available will be included in Section 5 below.

AVOID OVERLAPS WITH THE RESEARCH PLAN! The data-level documentation (https://www.ukdataservice.ac.uk/manage-data/document/data-level.aspx) and details about experiments, analytical methods and the research context belong to the research plan. In the DMP you should concentrate on the study-level documentation (https://www.ukdataservice.ac.uk/manage-data/document/study-level.aspx).

Tips for best practices

  • Describe all the types of documentation (README files, metadata, etc.) you will provide to help secondary users to find, understand and reuse your data.
  • Following the FAIR (https://www.force11.org/group/fairgroup/fairprinciples) principles will help you ensure the Findability, Accessibility, Interoperability and Re-usability of your data.
  • Know the minimum requirements for data documentation; see, for example, Qvain Light (https://www.fairdata.fi/en/qvain/qvain-light-user-guide/).
  • Use research instruments, which create standardised metadata formats automatically.
  • Identify the types of information that should be captured to enable other researchers to discover, access, interpret, use and cite your data.

Data documentation enables data sets and files to be discovered, used and properly cited by other users (human or computer). Without sufficient documentation the data cannot be reused.

Documentation includes essential information regarding the data, for example a) core metadata (for discovery and identification) where, when, why and how the data were collected as well as b) descriptive information how the data is interpreted correctly using metadata standards, vocabularies and e.g. readme-files. 

Tips for best practices

  • Describe all the types of documentation (README files, metadata standards, vocabularies etc.) you will provide to help secondary users to understand and reuse your data. Repositories often require the use of a specific metadata standard. Check whether a discipline-specific metadata schema or standard exists that can be adopted.
  • Consider how the data will be organised during the project. Describe, for example, your file-naming conventions, version control and folder structure.
  • Use research instruments, which create standardised metadata formats automatically.
  • Identify the types of information that should be captured to enable other researchers to discover, access, interpret, use and cite your data. See for example Qvain requirements (https://www.fairdata.fi/en/user-guides/qvain-user-guide/#QvainDataset



"Describe the tool, such as Qvain, that you will use to describe your data sets." => ?

Know the minimum requirements for data documentation; see, for example, Qvain Light (https://www.fairdata.fi/en/qvain/qvain-light-user-guide/).

=>  Pitäisikö tässäkin kohtaa puhua metadatasta?


Eikö aineistojen dokumentaatio ole laajempi käsite ja metadata suppeampi käsite dokumentaation sisällä? Minusta tästä ohjeesta ei käy selvästi ilmi, kummasta puhutaan milloinkin. Kohta on ehkä hieman sekava

  • esim. QVAin liittyy vain metadatan tallentamiseen ja avaamiseen
  • aineiston dokumentaatiota tehdään eri tasoilla (projekti, tiedosto jne)
  • (Tiina S)


siiri: Huhhuh, mä oon myös sitä mieltä, että tää koko 3 pitäs selkeyttää. Kirjottelin oman ehdotuksen.


Päivi 4.1.2021: Mää tykkäsin Siirin ehdotuksesta (smile) vimpassa kohdassa voisi sanoa alussa, että datan kuvailu on olleellinen osa FAIR-periaatteita, jotka will help you ensure the Findability, Accessibility, Interoperability and Re-usability of your data.

Minna 7.1.01: Minulta myös ääni Siirin ehdotukselle uudeksi tekstiksi. Kävin tekemässä siihen pari stilisointia.

Minustakin Siirin ehdotus on hyvä. jättäisin vain "core metadata" käsitteen siitä pois, kun se ei ehkä sellaisenaan oikein avaudu ja tämä osio on muutenkin täynnä monelle vierasta käsitteistöä. -Jari

Samaa mieltä että tässä menee helposti sekaisin dokumentaation ja metadatan eri merkityksiä, ja jää epäselväksi mitä tähän kohtaan toivotaan kirjoitettavan. Termien ja eri merkitysten selkiyttämisessä riittänee työtä enemmän kuin tässä ohjeessa on mahdollista tehdä. Onko olennaista mainita metadatastandardeja tässä ollenkaan? (Anne)


Kati 23.12.2020: "... enables data sets and files to be..." → datasetit koostuvat tiedostoista. Olisiko parempi sanoa "...enables data sets to be discoverd...". Mielestäni "do not mention metadata standards..." on turha ja samoin "use research instruments...". Metadatastandardit ovat usein piilossa työkalujen sisällä siinä mielessä että ulos saa metadataa tietyillä standardeilla, mutta kohta voi olla hankala henkilöille, jotka eivät tunne tietovarastoja syvällisellä tasolla. Mielestäni on myös ok korostaa että readme-tiedostoja voi kuvata erikseen, onhan se metadataa, mutta usein eri tasolla kuin repositoryn metadata (yksi-moneen suhde). 

"You can anticipate the open accessibility of your data and its description already here" Epäselvä lause, jota ei ehkä tarvita tässä yhteydessä - ehdotamme poistamista. Jari & Saila.

Siirin ehdotus hyväksytty

pois: FAIR  (ei pystytä tässä kohtaa avaamaan tarpeeksi, ei ole konkreettinen, FAIR on ajattelumalli) (pitää päästä FAIRin taakse, prosesseihin)

-FAIR on palveluntuottajan vastuulla, dokumentointi tutkijan vastuulla; FAIR -repositorion löytäminen on tutkijan vastuulla

SIIRIN kysymys poistetaanko tämä? - Kyllä:

onko tästä hyötyä tässä? Following the FAIR principles will help you ensure the Findability, Accessibility, Interoperability and Re-usability of your data.

Muutetaan numerointi 3.1 > 3 koska vain yksi kysymys



Tätä vielä korjattu:
Without sufficient documentation the data is re-useless. → Without sufficient documentation the data cannot be reused.


VALMIS - HYVÄKSYTTÄVISSÄ 26.1.2021 kokouksessa?



VALMIS - HYVÄKSYTÄÄN 26.1.


4. Storage and backup during the research projectTÄHÄN SARAKKEESEEN UUSI MUOTOILUEHDOTUSTÄHÄN SARAKKEESEEN VOI LAITTAA VAPAITA KOMMENTTEJA/KESKUSTELUA
26.1.2021 KOKOUKSEN MUISTIINPANOT ja PÄÄTÖKSET

4.1 Where will your data be stored, and how will the data be backed up?

4.1 Minne aineistosi tallennetaan, ja miten se varmuuskopioidaan?

4.1 Var kommer datamaterialet att lagras och hur sker säkerhetskopieringen?

Describe where you will store and back up your data during your research project. Explain the methods for preserving and sharing your data after your research project has ended in more detail in Section 5.

Consider who will be responsible for backup and recovery. If there are several researchers involved, create a plan with your collaborators and ensure safe transfer between participants.

Show that you are aware of the storing solutions provided by your organisation. Do not merely refer to IT services. In the end, you are responsible for your data, not the IT department or the organisation.

Tips for best practices

  • The use of a safe and secure storage provided and maintained by your organisation’s IT support is preferable.
  • Do NOT USE external hard drives as the main storing option.

Describe where you will store and back up your data during your research project. Consider who will be responsible for backup and recovery. If there are several researchers involved, create a plan with your collaborators and ensure safe transfer between participants.

Show that you are aware of the storing solutions provided by your organisation. Do not merely refer to IT services. In the end, you are responsible for your data, not the IT department or the organisation.

Explain the methods for preserving and sharing your data after your research project has ended in more detail in Section 5.

Tips for best practices

  • The use of a safe and secure storage provided and maintained by your organisation’s IT support or other reliable IT provider such as CSC is preferable.
  • Do NOT USE external hard drives as the main storing option.
  • Follow your institution's data security requirements

siiri: vaihtaisin parin lauseen paikkaa (toka lause lopuksi, vaikka ymmärrän miksi se tavallaan on tuohon kärkeen tungettu): 

Describe where you will store and back up your data during your research project. Consider who will be responsible for backup and recovery. If there are several researchers involved, create a plan with your collaborators and ensure safe transfer between participants.

Show that you are aware of the storing solutions provided by your organisation. Do not merely refer to IT services. In the end, you are responsible for your data, not the IT department or the organisation.

Explain the methods for preserving and sharing your data after your research project has ended in more detail in Section 5.


MO KOMMENTTI: OK, muokattu vasemmalla


  • Pitäiskö ekaan tipsi bullettiin lisätä (siiri): ... by your organisation’s IT support or other reliable IT provider e.g. CSC is preferable. MO KOMMENTTI: LISÄTTY, onko OK?
  • Ehdottaisimme seuraavia palluroita mukaan: - Jari & Saila
    •  If you use commercial cloud services, read their terms and conditions, and makes sure that you are allowed to use them for your purposes. MO KOMMENTTI: KAUPALLISET/ORG. ULKOPUOLISET PILVIPALVELUT ONGELMALLISIA
    • "It's recommend to store data in at least two separate locations” Tämä on Science Europen ohjeesta’ 
      • siiri: ei HY:llä kyllä ohjattu ikinä tallentamaan kahteen, jos käyttää ensisijaisena HY:n asemia? onko tämä muutunut ja eroaako ohje muilla yliopistoilla? Anne: UEFissa ohjeistetaan huolehtimaan varmuuskopioinnista, tutkijan täytyy selvittää varmuuskopioidaanko hänen käyttämänsä palvelu automaattisesti vai tuleeko se tehdä itse, suuri osa yliopiston palvelimilla olevasta datasta varmuuskopioidaan automaattisesti Päivi: Turussakaan ei neuvota tallentamaan kahteen paikkaan, TY:n tarjoamat tallennusratkaisut hyviä, koska varmuuskopiointi tapahtuu automaattisesti. MO KOMMENTTI: EI LISÄTTY EHDOTUKSEEN
    • Follow your institution's data security requirements MO KOMMENTTI: LISÄTTY EHDOTUKSEEN
EI KÄSITELTY 13.1. KOKOUKSESSA

26.1.2021 jatketaan tästä eteenpäin


VALMIS - HYVÄKSYTÄÄN 26.1.

4.2 Who will be responsible for controlling access to your data, and how will secured access be controlled?

4.2 Kuka valvoo pääsyä aineistoon, ja miten suojattua pääsyä aineistoon valvotaan?

4.2 Vem reglerar åtkomsten till datamaterialet och hur övervakas skyddad åtkomst?

It is essential to consider data security issues, especially if your data include sensitive data, personal data, politically sensitive information or trade secrets. Describe who has access to your data, what they are authorised to do with the data, or how you will ensure the safe transfer of data to your collaborators.

Tips for best practices

  • Access controls should always be in line with the level of confidentiality involved.

It is essential to consider data security issues, especially if your data include sensitive data, personal data, politically sensitive information or trade secrets. Describe who has access to your data, what they are authorised to do with the data, or how you will ensure the safe transfer of data to your collaborators.

Tips for best practices

  • Access controls should always be in line with the level of confidentiality involved.

Tipsien bulletti on aika hankalasti ilmaistu (joutuu lukemaan pariin kertaan, että ymmärtää), mutta emme keksineet tähän parempaakaan. → MO/Tuulitoimisto kommentti: Ehdottakaa muotoiluehdotusta!!



EI KÄSITELTY 13.1. KOKOUKSESSA

VALMIS - HYVÄKSYTÄÄN 26.1. Tuulitoimisto lisää Tips-huomion


tips: access controls: vastaa tarvetta, ota huomioon arkaluonteisen aineiston erityisvaatimukset, normaali pääsynhallinta ei riitä; ota selvää tarvitaanko kaksoiskirjautuminen; usein eivät tutkijoiden valittavissa

Katso, mitä organisaatiosi ohjeistaa
Tuulitoimisto muotoilee tipsin.


5. Opening, publishing and archiving the data after the research projectTÄHÄN SARAKKEESEEN UUSI MUOTOILUEHDOTUSTÄHÄN SARAKKEESEEN VOI LAITTAA VAPAITA KOMMENTTEJA/KESKUSTELUA
26.1.2021 KOKOUKSEN MUISTIINPANOT ja PÄÄTÖKSET

5.1 What part of the data can be made openly available or published? Where and when will the data, or its metadata, be made available?

5.1 Mikä osa aineistosta voidaan asettaa avoimesti saataville tai julkaista? Missä ja milloin aineisto tai siihen liittyvät metatiedot asetetaan saataville?

5.1 Vilken del av datamaterialet kan göras öppet tillgängligt eller publiceras? Var och när kommer datamaterialet eller dess metadata att göras tillgängliga?

Describe whether you will make openly available or publish all your data or only parts of the data. If your data or parts of the data cannot be opened, explain why.

In the case of sensitive data, which cannot be opened, describe the opening of its metadata. Describe the secured preservation procedure of sensitive data in Section 5.2.

The openness of research data promotes its reuse.

Tips for best practices

  • You can publish a description (i.e., the metadata) of your data without making the data itself openly available, which enables you to restrict access to the data.
  • Publish your data in a data repository or a data journal.
  • Check re3data.org (https://www.re3data.org/) to find a repository for your data.
  • Remember to check the funder, disciplinary or national recommendations for data repositories.
  • It is recommended to make all of the research data, code and software created within a research project available for reuse, for example, under a Creative Commons (https://creativecommons.org/choose/), GNU (https://www.gnu.org/licenses/gpl-3.0.en.html) or MIT license (https://opensource.org/licenses/MIT), or under another relevant license.
  • Consider using repositories or publishers, which provide persistent identifiers (PID) to enable access to the data via a persistent link (e.g. DOI, URN).


AVOID OVERLAPS WITH THE PUBLICATION PLAN! The research article publication does not equal data publication. The data journal is a publication forum specialised in publishing research data.

Describe how you will make data available and findable for reuse. If your data or parts of the data cannot be opened, explain why you publish only metadata.

In the case of sensitive data, which cannot be opened, describe the opening of its metadata. Describe the secured preservation procedure of sensitive data in Section 5.2.

The openness of research data promotes its reuse.

Tips for best practices

  • You can publish a description (i.e., the metadata) of your data without making the data itself openly available, which enables you to restrict access to the data.
  • Publish your data in a data repository or a data journal.
  • Check re3data.org (https://www.re3data.org/) to find a repository for your data.
  • Prefer repositories or publishers, which provide persistent identifiers (PID) to enable access and citation to the data via a persistent link (e.g. DOI, URN).
  • Remember to check the funder, institutional, disciplinary or national recommendations for data repositories.
  • It is recommended to make all of the research data, code and software created within a research project available for reuse, for example, under a Creative Commons (https://creativecommons.org/choose/), GNU (https://www.gnu.org/licenses/gpl-3.0.en.html) or MIT license (https://opensource.org/licenses/MIT), or under another relevant license.


AVOID OVERLAPS WITH THE PUBLICATION PLAN! The research article publication does not equal data publication. The data journal is a publication forum specialised in publishing research data.

Describe whether you will make openly available or publish all your data or only parts of the data or only metadata (Tiina s) → MO/TUULITOIMISTO KOMMENTTI: LISÄTÄÄNKÖ METADATA?


  • Publish your data in a data repository or a data journal.

=> Meneekö tässä kaksi asiaa sekaisin? Data journaalissa julkaistaan artikkeli liittyen dataan. Repository on datan säilytyspaikka (Tiina S) MO KOMMENTTI: DATA JOURNAALEISSA JULKAISTAAN DATAA

→ siiri: eikö tärkeintä oo mainostaa, molempia vaihtoehtoja? en tunne data journaleita ja käytäntöjä tarkasti ja missä pitää lisäksi julkaista data, ehkä jopa riippuu journalista? (referessiksi: https://www.ands.org.au/working-with-data/publishing-and-reusing-data/data-journals)


  • Consider using repositories or publishers, which provide persistent identifiers (PID) to enable access to the data via a persistent link (e.g. DOI, URN). => Pitäisikö tämä sanoa painokkaammin? Pysyvä tunniste on esim viittaamiselle välttämätön (Tiina S) MO KOMMENTTI: VOI OLLA ALOJA JOILLA TÄMÄ ON HANKALA OLLA EHDOTTOMANA VAATIMUKSENA


Kati 23.12.2020: kohtaan "remember to check..." voisi lisätä "institutional" muiden lisäksi. MO KOMMENTTI: LISÄTTY EHDOTUKSEEN

Mielestäni kohta "you can publish a description..." on epäselvä siinä mielessä että tutkija voi myös rajoittaa pääsyä aineistoon käyttämällä joidenkin repojen työkaluja, mutta data on silti avattu koska se voi olla saatavilla pyyntöä vastaan. Mitä jos kohtaa muuttaisi vaikka "You can publish all or part of your data in a data repository and additionally, restrict access to the said data when enabled by the repository". Päivi: Hyvä täsmennys! Kannatetaan! MO KOMMENTTI/KYSYMYS: LISÄTÄÄNKÖ EHDOTUKSEEN?


Koko osion nimessä voisi hyödyntää Science Europen muotoilua "Long term preservation and data sharing after the research project". "Sharing" vaikuttaisi olevan vakiintunut muotoilu datan avaamisessa. - Jari & Saila MO KOMMENTTI: Sharing on hankala, sitä käytetään myös suojatun jakamisen yhteydessä (tai itse asiassa pitäisi käyttää tuollaisena yleisemmän tason kuvauksena; sekä julkaiseminen että suojattu työaikainen jakaminen ovat molemmat sharingiä).


"Describe the secured preservation procedure of sensitive data in Section 5.2." Minkälainen säilytysproseduuri tähän voisi tulla kyseeseen? Onko tällainen prosessi jossain jo toiminnassa? Onko esim. PASsissa sensitiivisä datoja? Voisiko tämän jättää pois? Vai tarkoitetaanko tällä tutkijan omaa prosessia esim. "Describe your secured preservation procedure of sensitive data in Section 5.2" MO KOMMENTTI: ON KÄYTÖSSÄ. REPOT OTTAVAT TÄHÄN VAAN VÄHÄN ERI KANNAN - esim Kielipankki ottaa vastaan sensitiivistä FSD jostain syystä vain "anonymisoitua".

Ehdottaisimme Science Europen mukaista lyhyempää ja ytimekkäämpää kysymystä: "How and when will data or its metadata be shared?". Näin vältettäisiin myös hankala "publish" -termi kysymyksessä. Muutenkin käyttäisimme linjakkaammin tuota "data sharing" käsitettä tässä kohdassa. Jari & Saila MO KOMMENTTI: Sharing on tosiaan hankala itse en toisi sitä tähän. Publish puolestaan on syytä olla mukana, koska datajournaalit ovat puolestaan nimenomaan julkaisemista.

EI KÄSITELTY 13.1. KOKOUKSESSA



  • Follow the funder's or publisher's policies. MYÖS TÄNNE!
  • esim. Remember to check funder, disciplinary or national recommendations for data archives.

Ensimmäinen lause > Describe how you will make data available and findable for reuse.

Metadata lisätään lauseeseen (Akatemian vaatimus myös):
If your data or parts of the data cannot be opened, explain why you publish only metadata.
(Metadata näkyy kysymyksessä, mutta hyvä näkyä myös ohjeessa)

data journal jätetään

pysyvä tunniste painokkaammin; voiko olla julkaistu, jos ei ole pidiä?
-alanmukaisia,yleisessä käytössä olevia arkistoja, joista ei saa pidiä, vaan arkistotunnisteen. > Prefer olisi painokkaampi; bullet ylemmäksi
jotain viittaamisesta (edellyttää pidiä): access and citing





Ehdotus: You can publish all or part of your data in a data repository and additionally, restrict access to the said data when enabled by the repository


Sharing: ei laiteta osion nimeen
-hankala sana, tutkijat mieltää tutkimuksen aikaiseksi jakamiseksi


VALMIS - HYVÄKSYTÄÄN 26.1.

5.2 Where will data with long-term value be preserved, and for how long?

5.2 Missä pitkällä aikavälillä arvokas data säilytetään ja kuinka pitkään?

5.2 Var bevaras datamaterial av långsiktigt värde och hur länge?

Briefly describe what part of your data you will preserve and for how long. Categorise your data sets according to the anticipated preservation period:

A) Data to be destroyed upon the ending of the project
B) Data to be archived for a verification period, which varies across disciplines, e.g., 5–15 years
C) Data to be archived for potential re-use, e.g., for 25 years
D) Data with long-term value to be archived by a curated facility for future generations for tens or hundreds of years

Describe which part of the data you will dispose of after the project and how you will destroy the data. Describe the access policy to the archived data. Consider using archives with a curation policy.

Tips for best practices

  • Remember to check funder, disciplinary or national recommendations for data archives.

Briefly describe what part of your data you will preserve, where it is preserved, and for how long. Long term preservation means that data is preserved for as long as necessary, for several decades or even centuries.

You can categorise your data sets according to the anticipated preservation period:

A) Data to be destroyed upon the ending of the project
B) Data to be archived for a verification period, which varies across disciplines, e.g., 5–15 years
C) Data to be archived for potential re-use, e.g., for 25 years
D) Data with long-term value to be archived by a curated facility for future generations for tens or hundreds of years

You will need to decide which of your research data to preserve and dispose of. Data that is unique or difficult to replicate might have long-term value and be fit for preservation. Special long term data repositories should be used for digital preservation. 


Tips for best practices

  • Decisions about preserving data should begin during the data management planning stage, and should take into account eg. institutional guidance and requirements.
  • Use data repositories with a commitment to long-term curation, e.g. Fairdata Digital Preservation Service is dedicated for research datasets that have significant value to the organization or on a national level currently and especially also in the future. Contact your home organisation for further information.
  • Jotain pointteja datan hävittämisestä tai muusta esim arkistoinnista?
    • Additionally, describe if some part of the data is disposed of after the project and how is the data destroyed.

Tässä kysymys ja ohjeteksti käsittelevät eri asioita, ensin pyydetään kertomaan minne pitkällä aikavälillä arvokkaat tiedot arkistoidaan ja sitten ohjeessa pyydetäänkin luettelemaan kaiken aineiston säilytys, kumpaa tässä halutaan? Long-term termi on hämmentävä, harvassa tutkimuksessa tuotetaan PAS säilytykseen meneviä aineistoja, niistäkö tässä puhutaan vai jostakin muusta? (Anne) MO KOMMENTTI: Eri asioita?

Minna 07.01.21: Tässä jää epäselväksi koskeeko kysymys arkistointia vai pitkäaikaissäilytystä vai molempia. Komppaan Annen kommenttia eli tässä voisi keskittyä vain preservation näkökulmaan (eli Briefly describe what part of your data you will preserve and for how long ) ja muistuttaa, että harvassa projektissa syntyy oikeasti kymmeniä vuosia säilytettävää dataa. Esim. Data that is unique or difficult to replicate might have long-term value and be fit for preservation. Jos sellaista syntyy niin: Special long term data repositories should be used for digital preservation.

Siiri: komppaan edellisiä. Tehtiin Minnan kanssa ehdotus docsiin (lähestytään kysymystä nimenomaan pas näkökulmasta.

MO KOMMENTTI: sekä arkistointi että pitkäaikaissäilytys käsitellään tässä; 5.2 osion oleellinen motivaatio on sen ero kysymykseen 5.1. 5.1ssa käsitellään avoimeksi saattamista, 5.2ssa suojattuna pitämistä (tai tuhoamista)


Harva voi DMP-vaiheessa luvata, että data pitäisi tallettaa sadoiksi vuosiksi. Voiko mikään taho luvata näin pitkää säilytysaikaa? - Jari & Saila MO KOMMENTTI: Ei tarvitse luvata. Ohjeen tarkoitus on herätellä ajattelemaan, mitä teet datalle tutkimuksen jälkeen. Sekä tuhoaminen, julkaiseminen että suojattu arkistointi pitää suunnitella. Tämä ei tapahdu itsestään. Ja kaiken lisäksi nämä vaativat monesti huomioimasti jo keruuvaiheessa.

Anne: Jatkona keskusteluun, minä näkisin olennaisena miettiä kaiken aineiston säilytystä,ei siis vain PAS aineistojen, tällöin tulisi mietittyä se määräajan säilytettävien hävityskin, se on hyvin olennainen osa aineistonhallintaa. Siirin ja Minnan ehdotuksesta selviää hyvin mitä on PAS, lisäksi säilyttäisin tuon A-D kategorisoinnin. MO KOMMENTTI: Samoin - lisäisin tuon esimerkin eri aikajakoista ja niiden motivaatioista

EI KÄSITELTY 13.1. KOKOUKSESSA

VALMIS - HYVÄKSYTTÄVISSÄ 26.1.2021 kokouksessa?


MO muistiinpanot: "kumpaa tässä halutaan? " Kumpaakin.


MO KOMMENTTI: Apua! Miksi suomenkielisessä kysymyksessä lukee tiedot!??! Voitaneen muuttaa aineistoksi tai dataksi


MO KOMMENTTI: Ehdotetuissa tipseissä tämä: "Use data repositories with a commitment to long-term curation" rajaa aika rajusti - haravalla tieteenalalla on tämän suuntaisia. Entä jos ei ole PAS-kuratoituja? Mitä silloin tehdään?

Kysymyksen muuttaminen?: säilytys, arkistointi ja tuhoaminen

-eri aikajänteet säilyttämisessä näkyviin
-pohdi, kuinka kauan pitää säilyttää

-varmistetaan, että oleelliset asiat säilyvät

Archive sana voi hämmentää

Voisiko 5.1 ja 5.2 yhdistää?!!!!

Siirin ja Minnan ehdotus hyväksytty. 

Suomenkielinen kysymys muutettu: 5.2 Missä pitkällä aikavälillä arvokas data säilytetään ja kuinka pitkään?


VALMIS - HYVÄKSYTÄÄN 26.1.


6. Data management responsibilities and resourcesTÄHÄN SARAKKEESEEN UUSI MUOTOILUEHDOTUSTÄHÄN SARAKKEESEEN VOI LAITTAA VAPAITA KOMMENTTEJA/KESKUSTELUA
26.1.2021 KOKOUKSEN MUISTIINPANOT ja PÄÄTÖKSET

6.1 Who (for example role, position, and institution) will be responsible for data management?

6.1 Kuka (esim. tehtävä ja laitos) vastaa aineistonhallinnasta?

6.1 Vem (t.ex. roll, ställning och enhet) ansvarar för specifika uppgifter i datahanteringen under projektets livscykel?

Summarise here all the roles and responsibilities described in the previous answers.

Tips for best practices

  • Outline the roles and responsibilities for data management/stewardship activities, for example, data capture, metadata production, data quality, storage and backup, data archiving, and data sharing. Name the responsible individual(s) where possible.
  • For collaborative projects, explain the co-ordination of data management responsibilities across partners.
  • Indicate who is responsible for implementing the DMP and for ensuring that it is reviewed and, if necessary, revised.
  • Consider scheduling regular updates of the DMP.


Finally, consider who will be responsible for the data resulting from your project after your project has ended.

Summarise here all the roles and responsibilities described in the previous answers. Also, consider who will be responsible for the data resulting from your project after your project has ended.

Tips for best practices

  • Outline the roles and responsibilities for data management/stewardship activities, for example, data capture, metadata production, data quality, storage and backup, data archiving, and data sharing. Name the responsible individual(s) where possible.
  • For collaborative projects, explain the co-ordination of data management responsibilities across partners.
  • Indicate who is responsible for implementing the DMP and for ensuring that it is reviewed and, if necessary, revised.
  • Consider scheduling regular updates of the DMP.


Data steward ja erityisesti tietovastaava ovat hämmentäviä termejä, kenellä tällaisia on?  Eikö datanhallinnasta yleensä vastaa tutkijat tai muut hankkeen toimijat? (Anne) MO KOMMENTTI: Vastuussa ovat toki kaikki ryhmässä, jotka data käsittelevät, mutta teityt instrumentit mahdollistavat avun palkkaamisen.


Siiri: mun mielestä toi DM ja DS on tossa in fine, harvalla varmasti niitä on ja tutkija itse vastaa monesta asiasta, mutta täydellisessä maailmassa voisi olla..

Anne jatkaa: DM ja DS tässä kohdassa joskus synnyttää mielikuvan että datanhallinta vaan sitten lykätään jonkun yliopiston DM/DS tyypin tehtäväksi, että ei tarvitse tutkijoiden huolehtia asioista joita suunnitelmaan kirjoittavat (big grin)

MO KOMMENTTI: Totta - näihän siinä saattaa käydä, mutta jos tällaista esiintyy DMP-tarkistuksessa tukipalveluiden on syytä ärähtää tutkijalle asiasta. Ja tämähän on tutkimusassareiden osalta arkipäivää jo nyt. PI:t ei kanna korttaan kekoon DMP-kirjoituksessa, jolloin eivät myöskään ymmärrä tästä puolesta, ja homman hoitaa tohtorikoulutettava tai aloittanut post-doc

Päivi: Joo, totta! Tullut joskus kyselyitäkin, että voiko nimetä tähän jounkun yliopiston tutkimuspalveluista.

siiri: laittaisin viimeisen lauseen toiseksi lauseeksi:

Summarize here all the roles and responsibilities described in the previous answers. Also, consider who will be responsible for the data resulting from your project after your project has ended. 


EI KÄSITELTY 13.1. KOKOUKSESSA

Siirin siivous hyväksytty.


Tietovastaava suomenkielisessä kysymyksessä? > poistetaan esimerkki (data steward) kysymyksestä



VALMIS - HYVÄKSYTÄÄN 26.1.

6.2 What resources will be required for your data management procedures to ensure that the data can be opened and preserved according to FAIR principles (Findable, Accessible, Interoperable, Re-usable)?

6.2 Mitä resursseja aineistonhallinta edellyttää, jotta voit varmistaa, että aineisto voidaan avata ja säilyttää FAIR-periaatteiden (ks. edellä) mukaan?

6.2 Vilka resurser behövs för hanteringen av ditt datamaterial för att data ska kunna öppnas och förvaras i enlighet med FAIR-principerna (sökbart, tillgängligt, interoperabelt och återanvändbart)?

Estimate the resources needed (for example, financial and time) to manage, preserve and share the data. Consider the additional computational facilities and resources that need to be accessed, and what the associated costs will amount to.

Tips for best practices

  • Remember to specify your data management costs in the budget, according to funder requirements.


Account for the costs of the necessary resources (for example, time) to prepare the data for sharing/preservation (data curation). Carefully consider and justify any resources needed to deliver the data. These may include storage costs, hardware, staff time, the costs of preparing data for deposit and repository charges.

Estimate the resources, such as time and financial costs, needed to manage, share and preserve the data. These may include storage costs, hardware, staff time, the costs of preparing data for deposit and repository charges.

Tips for best practices

  • Consider, if there will be additional costs from computational facilities or resources that need to be accessed.
  • Account for resources, time and money, needed to prepare the data for sharing it and preservation (data curation). 
  • Remember to specify your data management costs in the budget, according to funder requirements.

siiri: tässä on paljon toistoa ja sama asia sanotaan alussa ja lopussa ja välissäkin mainitaan. Tein ehdotuksen:

Estimate the resources, such as time and financial costs, needed to manage, share and preserve the data. These may include storage costs, hardware, staff time, the costs of preparing data for deposit and repository charges.

Tips for best practices

  • Consider, if there will be additional costs from computational facilities or resources that need to be accessed.
  • Account for resources, time and money, needed to prepare the data for sharing it and preservation (data curation). 
  • Remember to specify your data management costs in the budget, according to funder requirements.

MO KOMMENTTI: JEE - kiitos!

EI KÄSITELTY 13.1. KOKOUKSESSA

Siiri pisti kuntoon.

VALMIS - HYVÄKSYTÄÄN 26.1.


  • No labels