PUBLISHED VERSION:2021####
Translated, proofread and checked versions (updated 202#####):
DRAFT Updated 26.1.2021.
Section | 0. Introduction / VERSIO 2020 | TÄHÄN SARAKKEESEEN UUSI MUOTOILUEHDOTUS | TÄHÄN SARAKKEESEEN VOI LAITTAA VAPAITA KOMMENTTEJA/KESKUSTELUA | 13.1.2021 KOKOUKSEN MUISTIINPANOT | 26.1.2021 KOKOUKSEN MUISTIINPANOT ja PÄÄTÖKSET |
Motivation Motivointiosio Motivation | How do I write a DMP? - READ THIS FIRST!
Why should you manage your research data and write a data management plan (DMP)?
In the DMP context, ‘data’ is understood as a broad term. Data covers all of the information and material your research results are based on. You can concentrate on the data, which is your responsibility. Your DMP should describe how you will manage the data throughout the life cycle of your research. The DMP is a living document, which should be updated as the research project progresses. Your research data management practices should aim to produce reusable data, which follows FAIR principles, that is, your data will be Findable, Accessible, Interoperable and Re-usable. Good luck with your DMP! | Your DMP is a living document where you describe how you will manage your data throughout the research life cycle and update the plan when your project progresses. To avoid redundancy, refer to your research plan in your DMP and vice versa. The research plan describes the scientific, analytical and methodological processing of data, whereas the DMP describes the technical and administrative management of data. In the DMP context, ‘data’ is understood as a broad term. Data covers all of the information and research material your results are based on. How do I write a DMP? - READ THIS FIRST!
Why should you manage your research data and write a data management plan (DMP)?
| Motivointiosio kokonaisuudessaan on pitkä. Kannattaisin sen lyhentämistä ja tiivistämistä. / Tiina S Samaa mieltä, että tiivistys ja lyhentäminen voisi tehdä hyvää. Tämä palsta oli niin pieni, että kirjoittelin ehdotelman docsiin. Muutin myös järjestystä ja yritin saada pari palluraa vähemmän Siirin ehdototus on hyvä! Bullet pointsit ovat sinänsä toimivia, mutta vain jos niitä ei ole kovin montaa. Kommenttejamme miettiessämme huomasimme moneen otteeseen, että palluroita ei tule luettua järjestyksessä, jos tulee luettua lainkaan. Siiri on saanut hyvin ryhmitettyä toisiinsa liittyvät kohdat ja teksti on selkeämpi ja luettavampi. / Jari & Saila How do I write a DMP? - READ THIS FIRST!
Why should you manage your research data and write a data management plan (DMP)?
→ mä olisin ehkä muotoillut eri tavalla ja yhdistänyt fairiin: "DMP supports making your data FAIR: Findable, Accessible, Interoperable and Re-usable. This will increase data reuse as well as your visibility. " / siiri
Päivi 4.1.2021: Yllä oleviin Tiinan ja Siirin kommentteihin kommentti: FAIR-näkökulma tulisi tuoda tässä esiin kuitenkin niin, ettei tutkija luule, että periatteet toteutuu automaattisesti kunhan vaan on DMP tehty. In the DMP context, ‘data’ is understood as a broad term. Data covers all of the information and material your research results are based on. You can concentrate on the data, which is your responsibility.
Samaa mieltä että tätä osiota voisi lyhentää. “Your DMP reflects your managerial skills as a project leader.” Eikös DMP osoita yleisesti tutkijan taitoja, ei vain projektin johtajan taitoja? Voisiko muotoilla ”skills as a researcher”? Olisi tällöin kaikille tutkijoille motivointia, ei vain hankkeen johtajille. (Anne) Kati 23.12.2020: voisiko korostaa, että DMP:n päivitys ei kuulu vain tutkimuksen johtajille. Esim. "Your DMP reflects your managerial skills irrespective of your role in the project." Kati 23.12.2020: Tässä voisi korostaa että data management plan kattaa tosiaan kaikki tutkimustuotokset, mukaanlukien koodit. Esim. näin: "Here, data covers all of the information and materials your research produces, including, but not limited to, documents and software codes". On ihan hyvä kehottaa välttämään DMP:n päällekkäisyydestä tutkimussuunnitelman kanssa, mutta eikö riittäisi, että tämä se on mainittu tässä. Ohjeesta saa mittaa pois jo sillä, että poistaa tämän varoituksen muiden kysymysten lopusta. Päällekkäisyys tutkimussuunnitelman kanssa ei välttämättä ole edes haitaksi varsinkin nyt, kun DMP:t tulee meidän kommentoitaviksemme. / Jari & Saila Mitä tarkoitetaan kohdan "Data covers all of the information and material your research results are based on" material -sanalla? Vie ajatukset kohti fyysisiä näytteitä. Jari & saila Mitä tarkoittaa "You can concentrate on the data, which is your responsibility." Eikö tutkija ole aina vastuussa siitä datasta, mitä käsittelee? Siis joko itselleen, tutkittaville tai muulle taholle. Jos taas tämä viittaa yhteistyöhankkeisiin, niin sitten selventäisin tätä hiukan. Esim. In collaborative projects, you can concentrate on the data which is your responsibility. Toisaalta yhteisprojekteissakin (yhteis)kirjoitetaan yleensä vain yksi DMP. → jättäisimme epäselvänä ohjeena pois. Jari & Saila | Data covers all of the information and research material poistetaan: You can concentrate on the data, which is your responsibility. Jätetään Avoid overlaps -kohdat kuten ovat olleet. | Vielä pieniä tarkennuksia KORJATTU PUNAISEEN SARAKKEESEEN:
MUILTA OSIN HYVÄKSYTTÄVISSÄ 26.1.2021 kokouksessa? VALMIS - HYVÄKSYTÄÄN 26.1. |
1. General description of the data | TÄHÄN SARAKKEESEEN UUSI MUOTOILUEHDOTUS | TÄHÄN SARAKKEESEEN VOI LAITTAA VAPAITA KOMMENTTEJA/KESKUSTELUA | 13.1.2021 KOKOUKSEN MUISTIINPANOT | 26.1.2021 KOKOUKSEN MUISTIINPANOT ja PÄÄTÖKSET | |
1.1 What kinds of data is your research based on? What data will be collected, produced or reused? What file formats will the data be in? Additionally, give a rough estimate of the size of the data produced/collected. 1.1 Millaiseen aineistoon tutkimuksesi perustuu? Millaista aineistoa kerätään, tuotetaan tai käytetään uudelleen? Missä tiedostomuodossa aineisto on? Esitä myös karkea arvio tuotettavan/kerättävän aineiston koosta. 1.1 Vilka slags data baserar sig forskningen på? Hurdana data samlas in, produceras eller återanvänds? Vilka filformat används? Ge även en grov uppskattning av hur mycket data som kommer att produceras eller samlas in. | Briefly describe what types of data you are collecting or producing. In addition, explain what kinds of already existing data you will (re)use. List, for example, the types of texts, images, photographs, measurements, statistics, physical samples or codes. Categorise your data in a table or with a clear list, for example: The categorisation follows the license policy of your data sets. For example, briefly describe the license according to which you are entitled to (re)use the data. The categorisation can form a general structure for the rest of the DMP. List the file formats for each data set. In some cases, the file formats used during the research project may differ from those used in archiving the data after the project. List both. The file format is a primary factor in the accessibility and reusability of your data in the future. In the DMP, what is important is to describe the required disk space, not how many informants participated in the project. A rough estimation of the size of the data is sufficient, for example, less than 100 GB, approx. 1 TB or several petabytes. Tips for best practices
| Briefly describe what types of data you are collecting or producing. In addition, explain what kinds of already existing data you will (re)use. List, for example, the types of texts, images, photographs, measurements, statistics, physical samples or codes. Categorise your data in a table or with a clear list, for example: A) previously collected existing data which is being reused in this project, B) data collected for this project , C) data produced as an outcome of the research process. The categorisation can form a general structure for the rest of the DMP. List the file formats for each data set. In some cases, the file formats used during the research project may differ from those used in archiving the data after the project. List both. The file format is a primary factor in the accessibility and reusability of your data in the future. In the DMP, what is important is to describe the required disk space, not how many informants participated in the project. A rough estimation of the size of the data is sufficient, for example, less than 100 GB, approx. 1 TB or several petabytes. Tips for best practices
AVOID OVERLAPS WITH THE RESEARCH PLAN! Data analysis and methodological issues related to data and materials should be described in your research plan. | The categorisation follows the license policy of your data sets. For example, briefly describe the license according to which you are entitled to (re)use the data. The categorisation can form a general structure for the rest of the DMP. => On luultavasti vaikea asia luokitella datoja käyttölisenssien mukaan. Hyvä, jos näin osataan tehdä. Minulle ei ihan avaudu, miksi aineistotyypit pitää kategorisoida näin tässä kohdin (Tiina S) Voi kyllä olla hankala ymmärtää tuosta oranssista lauseesta /siiri (en kyllä osaa tehdä parempaa tähän hätään) Samaa mieltä että aineiston kategorisoiminen käyttölisenssien mukaan tässä haasteellista. Voisiko oranssista kappaleesta jättää pois kaksi ekaa lausetta ja jättää vain "The categorisation can form a general structure for the rest of the DMP." (Anne) = TÄMÄ HYVÄ JÄTETÄÄN ÄTÄ Onko kohta ”D) managerial documents and project deliverables, and so on.” tarpeellinen vai voisiko jättää pois? Ohjaa kuvailemaan hankkeen hallintaan liittyviä dokumentteja, jotka eivät suoraan liity aineistonhallintaan. (Anne) Ehdottaisimme tähän kohtaan alla olevaa jaottelua / Jari & Saila
Kati 23.12.2020: Jäin miettimään tuota "make sure to describe...". Ei liene kovin yleistä että projektissa koodattaisiin softaa, joka tuottaa erikoisia tiedostoformaatteja. Yleisempää lienee että koodataan skriptejä, joilla dataa käsitellään ja olemassaolevia softapaketteja käytetään sen lisäksi ja nämä paketit voivat tuottaa harvinaisia tiedostoformaatteja. Olisiko parempi selkeyttää sanomuotoa esim. "make sure to describe any special or uncommon software necessary to view or edit the data". Tuo avoid overlap on kyllä hyvä lisä! /siiri Ensimmäisenä kysymyksenä DMP:ssä pitäisi kysyä ”How will new data be collected”, kuten kysytään myös Science Europen pohjassa. Ja mielellään omana kysymyksenään. Tämä luo kontekstia DMP:lle ja helpottaa esim. DMP:n kommentointia, kun tietää edes ketä haastatellaan, tai keille kysely on lähetetty jne. Tokihan DMP:tä kommentoidessa pitäisi olla tutkimussuunnitelma mukana, mutta aina ei vain ole. Tässä ensimmäisessä kysymyksessä ei ole lainkaan haittaa siitä, että DMP menee päällekkäin tutkimussuunnitelman kanssa. Siispä, ehdotamme, että tämän ensimmäisen kohdan kysymykset korvattaisiin Science Europen kysymyksillä 1a How will new data be collected or produced and/or how will existing data be re-used? 1 b What data (for example the kind, formats, and volumes), will be collected or produced? Datan laatua käsittelevä kysymys sopisi vanhalle paikalleen Documentation and Quality kohtaan, kuten on myös Science Europen pohjassa. Kohdasta kolme jää vaikutelma, että siitä puuttuu jotain, kun ainoa kysymys on 3.1. Missä on 3.2? Lisäksi jättäisimme myös kohdan "avoid overlap" pois tästä - ja muistakin kysymyksistä. Riittää, että se on mainittu motivointiosuudessa. DMP:n päällekkäisyydestä tutkimussuunnitelman kanssa ei ole juurikaan haittaa eikä sitä voi oikein edes välttää. - Jari & Saila Lauseessa "A rough estimation of the size of the data..." olisi selkeämpi viitata suoraan tallennuskapasiteettiin, eli, "A rough estimation of the storage capasity needed is sufficient." - Jari & Saila = OTETAAN TÄMÄ KÄYTTÖÖN Lauseen "Examples of file formats are .csv, .txt, .docx, .xslx and .tif" tiedostomuodot eivät avaudu kaikille. Tämän voisi selventää esim. ".csv or .xslx for tables, .txt and .docx for text, .tif for pictures | Kysymysten muuttaminen muuttaa työmäärää muuallakin. Nykyinen kysymys on tarkempi RDM-maailmaa ajatellen kuin Science Europen vastaava. > säilytetään aiemmat kysymykset Avoid overlaps > säilytetään, tämä on sanottu vielä tarkemmin motivointi-kohdassa. kategorisointi: tiivistys ja selkeytys kategorioiden muutokset: (kategori c) outcome of the process täsmennys: research process KATEGORIAN KOHTA D VOISI OLLA VAIN EETTISESSÄ KOHDASSA: D) managerial documents and project deliverables, and so on. A rough estimation of the storage capasity needed is sufficient tiedostomuodot: esimerkit vie ajatukset konkretiaan > jätetään Tuulitoimisto stilisoi tämän kohdan (1.1) valmiiksi. | VALMIS - HYVÄKSYTTÄVISSÄ 26.1.2021 kokouksessa? VALMIS - HYVÄKSYTÄÄN 26.1. |
1.2 How will the consistency and quality of data be controlled? 1.2 Miten aineiston yhtenäisyys ja laatu varmistetaan? 1.2 Hur kontrolleras datamaterialets enhetlighet och kvalitet? | Explain how the data collection, analysis and processing methods used may affect the quality of the data and how you will minimise the risks related to data accuracy. Data quality control ensures that no data is accidentally changed and that the accuracy of the data is maintained over its entire life cycle. Quality problems can emerge due to the technical handling, converting or transferring of data, or during its contextual processing and analysis. Tips for best practices
AVOID OVERLAPS WITH THE RESEARCH PLAN! Issues related to data analysis, methods and tools should be described in your research plan, that is, do not include, for example, instrument calibration descriptions here. | Explain how the data collection, analysis and processing methods used may affect the quality of the data and how you will minimise the risks related to data accuracy. Data quality control ensures that no data is accidentally changed and that the accuracy of the data is maintained over its entire life cycle. Quality problems can emerge due to the technical handling, converting or transferring of data, or during its contextual processing and analysis. Tips for best practices
AVOID OVERLAPS WITH THE RESEARCH PLAN! Issues related to data analysis, methods and tools should be described in your research plan, that is, do not include, for example, instrument calibration descriptions here. | Tarkistussummien käyttö on hyvän neuvo, mutta menee varmasti monelta ohi. Se kuitenkin liittyy kiinteästi edelliseen bulletpointsiin, joten yhdistmällä nämä saadaan tarkistussummille selitys - tai ainakin selvennys siitä, mihin tarkistussumma ylipäätään liitty. Ehdotamme siis seuraava yhdistetään pointsit. - Jari & Saila
| Lisätään Jarin ja Sailan ehdotus muokattuna: OR software-producing checksums should be used. > lopulta poistettu kokonaan checksum -onko tutkijoiden työkalu? -liian hieno työkalu? versionhallinta syytä mainita myös tässä kohdassa: | VALMIS - HYVÄKSYTTÄVISSÄ 26.1.2021 kokouksessa? VALMIS - HYVÄKSYTÄÄN 26.1. |
2. Ethical and legal compliance | TÄHÄN SARAKKEESEEN UUSI MUOTOILUEHDOTUS | TÄHÄN SARAKKEESEEN VOI LAITTAA VAPAITA KOMMENTTEJA/KESKUSTELUA | 13.1.2021 KOKOUKSEN MUISTIINPANOT | 26.1.2021 KOKOUKSEN MUISTIINPANOT ja PÄÄTÖKSET | |
2.1 What legal issues are related to your data management? (For example, GDPR and other legislation affecting data processing.) 2.1 Mitä juridisia seikkoja liittyy aineiston hallintaan (esim. EU:n yleinen tietosuoja-asetus ja muu aineiston käsittelyyn liittyvä lainsäädäntö)? 2.1 Vilka juridiska frågor är relevanta för datahanteringen? (Till exempel GDPR och annan lagstiftning som påverkar behandling av data.) | All types of research data involve questions of rights and legal and ethical issues. Demonstrate that you are aware of the relevant legislation related to your data processing. If you are handling personal or sensitive information, describe how you will ensure privacy protection and data anonymisation or pseudonymisation. Tips for best practices
| All types of research data involve questions of rights and legal and ethical issues. If you are handling personal or sensitive information, describe how you will ensure privacy protection and data anonymisation or pseudonymisation. Tips for best practices
AVOID OVERLAPS WITH THE RESEARCH PLAN! Details of the ethical issues, the ethical committee statements and the use of laboratory animals should be described in the research plan. | Kati 23.12.2020: "... personal or sensitive data..." → Henkilödata lienee sensitiivisen datan alaluokka, joten olisiko selvempää sanoa esim. "If you are handling sensitive information, such as personal data, describe..." → siiri: eihän kaikki personal data ole sensitive personal dataa eli en lähtis noin muuttamaan. https://ec.europa.eu/info/law/law-topic/data-protection/reform/rules-business-and-organisations/legal-grounds-processing-data/sensitive-data/what-personal-data-considered-sensitive_en Eettinen osuus ei tule esiin varsinaisissa kysymyksissä lainkaan. Ohjeessa kuitenkin tulee. Jos eettisiä asioita halutaan kysyä, niin ne pitäisi olla selkeästi omana kysymyksenään. Sinänsä tarvetta eettisten asioiden kysymiselle ei välttämättä ole, sillä niitä käsitellään jo tutkimussuunnitelmassa. Mallia jäsennyksestä voisi ottaa Science Europen pohjasta s. 21. Siinä tämä kohta on jaettu kolmeen kysymykseen: 4 a) If personal data are processed, how will compliance with legislation on personal data and on security be ensured? 4 b) How will other legal issues, such as intellectual property rights and ownership, be managed? What legislation is applicable? 4 c) What ethical issues and codes of conduct are there, and how will they be taken into account? Tässä jaottelussa myös henkilötietojen käsittely saa oman kysymyksensä, mikä selkeyttää suunnitelmaa ja ennakoi myös koneluettavuuden tavoitetta. Eettiset asiat ja GDPR ovat isoja asiakokonaisuuksia, joiden käsittely osana lainsäädännöllisiä asioita ei anna niille sitä painoarvoa, mikä niille kuuluu. Koneluettavassa DMP-pohjassa ei voi olla tarpeettomasti polveilevia kysymyksiä. Ehdotus: Otetaan käyttöön Science Europen kysymykset osioon 2. - Jari & Saila 3. ja 4. bullet pointsi liittyy selkeästi toisiinsa, joten ne kannattaisi yhdistää yhdeksi palluraksi. - Jari & Saila | Mitä tässä halutaan kysyä, halutaanko, että luetteloidaan lakeja? -eettiset ja juridiset vaikuttavat myös siihen, voiko aineistoa avata ja se vaikuttaa myös tutkimuksen aikaiseen tallennusratkaisuun. > poisto (Muuten jätetään ennalleen.): Demonstrate that you are aware of the relevant legislation related to your data processing. | VALMIS - HYVÄKSYTTÄVISSÄ 26.1.2021 kokouksessa? VALMIS - HYVÄKSYTÄÄN 26.1. |
2.2 How will you manage the rights of the data you use, produce and share? 2.2 Miten hallinnoit käyttämäsi, tuottamasi ja jakamasi aineiston oikeuksia? 2.2 Hur hanteras rättigheterna till det datamaterial du använder, producerar och delar? | Describe how you will agree upon the rights of use related to your research data – including the collected, produced and (re)used data of your project. Here, you can employ your categorisation in the first question. Each of these categories involves different rights and licenses. Describe the transfer of rights procedures relevant to your project. Describe confidentiality issues if applicable in your project. Tips for best practices
| Describe how you will agree upon the rights of use related to your research data – including the collected, produced and (re)used data of your project. Here, you can employ your categorisation in the first question. Each of these categories involves different rights and licenses. Describe the transfer of rights procedures relevant to your project. Describe confidentiality issues if applicable in your project. License your data! Tips for best practices
| Tips for best practices
Minna 07.01.21: Voisiko lisensoinnin nostaa jopa tipseistä ohjetekstiin? Make your research data, code and software created within a research project available under an appropriate licence. "Consider the funder's policy" jää irralliseksi ja epämääräiseksi lauseeksi. Mihin politiikkaan tällä viitataan? Rahoittajien vaatimuksiin viitataan jo motivoinnissakin. Jari & Saila. Lisenssisuositus kaipaa täsmennystä siitä, mitä eri lisensseillä on tarkoitus lisensoida. Ehdotus: Use Creative Commons (https://creativecommons.org/choose/) for data, GNU (https://www.gnu.org/licenses/gpl-3.0.en.html), MIT license (https://opensource.org/licenses/MIT) or another relevant open license for softwares and codes. "Agreements on ownership" on herättää kysymyksen valmiista sopimuspohjista tai ainakin siitä miten omistajuus määrittyy. Onko sellaisia? Minusta omistajuuden voisi epämääräisenä käsitteenä jättää tästä pois, tai laittaa lainausmerkkeihin, jos se pitää tässä välttämättä olla. Mitä lisäarvoa se tuo, jos käyttöoikeuksista (lisenssit), rekisterinpitäjyydestä, aineistonkäsittelystä ja tutkimusluvistakin on jo sovittu. Omistajuudesta sopiminen kuulostaa turhan monimutkaiselta ja herättää lähinnä ihmetystä. Lakimiehetkään eivät tässä yleensä osaa auttaa, vaan kyselevät tästä meiltä. → Ehdotus: poistetaan sana "ownership" - Jari MO KOMMENTTI: Hyvä kommentti ja huomio - poistetaanko ownership? | lisätty: Licence your data! Tips for best practises lisätty publisher's > Consider the funder's or publisher's policies. (pitäisi olla myös kohdassa 5). Consider > Follow muotoilu jää vielä auki:
| VALMIS - HYVÄKSYTTÄVISSÄ 26.1.2021 kokouksessa? Vielä kysymys/keskustelua ownership-sanasta > poistettu VALMIS - HYVÄKSYTÄÄN 26.1. |
3. Documentation and metadata | TÄHÄN SARAKKEESEEN UUSI MUOTOILUEHDOTUS | TÄHÄN SARAKKEESEEN VOI LAITTAA VAPAITA KOMMENTTEJA/KESKUSTELUA | 13.1.2021 KOKOUKSEN MUISTIINPANOT | 26.1.2021 KOKOUKSEN MUISTIINPANOT ja PÄÄTÖKSET | |
3. How will you document your data in order to make the data findable, accessible, interoperable and re-usable for you and others? What kind of metadata standards, README files or other documentation will you use to help others to understand and use your data? 3. Miten dokumentoit aineistosi, jotta se on löydettävissä, saavutettavissa, yhteentoimiva ja uudelleen käytettävissä sekä itseäsi että muita varten? Mitä metatietostandardeja, README-tiedostoja ja muuta dokumentaatiota käytät, jotta muut voivat ymmärtää ja käyttää aineistoasi? 3. På vilket sätt dokumenterar du ditt datamaterial så att det är sökbart, tillgängligt, interoperabelt och återanvändbart? Vilka metadatastandarder, README-filer eller annan dokumentation kommer att användas för att andra ska kunna förstå och återanvända datamaterialet? | Data documentation enables data sets and files to be discovered, used and properly cited by other users (human or computer). Documentation includes essential information regarding the data, for example, where, when, why and how the data were collected, processed and interpreted. Without the proper documentation, your data is useless. Describe the tool, such as Qvain, that you will use to describe your data sets. Do not mention metadata standards if you do not use them. You can anticipate the open accessibility of your data and its description already here. However, a detailed description of which part of your data can be set openly available will be included in Section 5 below. AVOID OVERLAPS WITH THE RESEARCH PLAN! The data-level documentation (https://www.ukdataservice.ac.uk/manage-data/document/data-level.aspx) and details about experiments, analytical methods and the research context belong to the research plan. In the DMP you should concentrate on the study-level documentation (https://www.ukdataservice.ac.uk/manage-data/document/study-level.aspx). Tips for best practices
| Data documentation enables data sets and files to be discovered, used and properly cited by other users (human or computer). Without sufficient documentation the data cannot be reused. Documentation includes essential information regarding the data, for example a) core metadata (for discovery and identification) where, when, why and how the data were collected as well as b) descriptive information how the data is interpreted correctly using metadata standards, vocabularies and e.g. readme-files. Tips for best practices
| "Describe the tool, such as Qvain, that you will use to describe your data sets." => ? Know the minimum requirements for data documentation; see, for example, Qvain Light (https://www.fairdata.fi/en/qvain/qvain-light-user-guide/). => Pitäisikö tässäkin kohtaa puhua metadatasta? Eikö aineistojen dokumentaatio ole laajempi käsite ja metadata suppeampi käsite dokumentaation sisällä? Minusta tästä ohjeesta ei käy selvästi ilmi, kummasta puhutaan milloinkin. Kohta on ehkä hieman sekava
siiri: Huhhuh, mä oon myös sitä mieltä, että tää koko 3 pitäs selkeyttää. Kirjottelin oman ehdotuksen. Päivi 4.1.2021: Mää tykkäsin Siirin ehdotuksesta Minna 7.1.01: Minulta myös ääni Siirin ehdotukselle uudeksi tekstiksi. Kävin tekemässä siihen pari stilisointia. Minustakin Siirin ehdotus on hyvä. jättäisin vain "core metadata" käsitteen siitä pois, kun se ei ehkä sellaisenaan oikein avaudu ja tämä osio on muutenkin täynnä monelle vierasta käsitteistöä. -Jari Samaa mieltä että tässä menee helposti sekaisin dokumentaation ja metadatan eri merkityksiä, ja jää epäselväksi mitä tähän kohtaan toivotaan kirjoitettavan. Termien ja eri merkitysten selkiyttämisessä riittänee työtä enemmän kuin tässä ohjeessa on mahdollista tehdä. Onko olennaista mainita metadatastandardeja tässä ollenkaan? (Anne) Kati 23.12.2020: "... enables data sets and files to be..." → datasetit koostuvat tiedostoista. Olisiko parempi sanoa "...enables data sets to be discoverd...". Mielestäni "do not mention metadata standards..." on turha ja samoin "use research instruments...". Metadatastandardit ovat usein piilossa työkalujen sisällä siinä mielessä että ulos saa metadataa tietyillä standardeilla, mutta kohta voi olla hankala henkilöille, jotka eivät tunne tietovarastoja syvällisellä tasolla. Mielestäni on myös ok korostaa että readme-tiedostoja voi kuvata erikseen, onhan se metadataa, mutta usein eri tasolla kuin repositoryn metadata (yksi-moneen suhde). "You can anticipate the open accessibility of your data and its description already here" Epäselvä lause, jota ei ehkä tarvita tässä yhteydessä - ehdotamme poistamista. Jari & Saila. | Siirin ehdotus hyväksytty pois: FAIR (ei pystytä tässä kohtaa avaamaan tarpeeksi, ei ole konkreettinen, FAIR on ajattelumalli) (pitää päästä FAIRin taakse, prosesseihin) -FAIR on palveluntuottajan vastuulla, dokumentointi tutkijan vastuulla; FAIR -repositorion löytäminen on tutkijan vastuulla SIIRIN kysymys poistetaanko tämä? - Kyllä: onko tästä hyötyä tässä? Following the FAIR principles will help you ensure the Findability, Accessibility, Interoperability and Re-usability of your data. Muutetaan numerointi 3.1 > 3 koska vain yksi kysymys | Tätä vielä korjattu: VALMIS - HYVÄKSYTTÄVISSÄ 26.1.2021 kokouksessa? VALMIS - HYVÄKSYTÄÄN 26.1. |
4. Storage and backup during the research project | TÄHÄN SARAKKEESEEN UUSI MUOTOILUEHDOTUS | TÄHÄN SARAKKEESEEN VOI LAITTAA VAPAITA KOMMENTTEJA/KESKUSTELUA | 26.1.2021 KOKOUKSEN MUISTIINPANOT ja PÄÄTÖKSET | ||
4.1 Where will your data be stored, and how will the data be backed up? 4.1 Minne aineistosi tallennetaan, ja miten se varmuuskopioidaan? 4.1 Var kommer datamaterialet att lagras och hur sker säkerhetskopieringen? | Describe where you will store and back up your data during your research project. Explain the methods for preserving and sharing your data after your research project has ended in more detail in Section 5. Consider who will be responsible for backup and recovery. If there are several researchers involved, create a plan with your collaborators and ensure safe transfer between participants. Show that you are aware of the storing solutions provided by your organisation. Do not merely refer to IT services. In the end, you are responsible for your data, not the IT department or the organisation. Tips for best practices
| Describe where you will store and back up your data during your research project. Consider who will be responsible for backup and recovery. If there are several researchers involved, create a plan with your collaborators and ensure safe transfer between participants. Show that you are aware of the storing solutions provided by your organisation. Do not merely refer to IT services. In the end, you are responsible for your data, not the IT department or the organisation. Explain the methods for preserving and sharing your data after your research project has ended in more detail in Section 5. Tips for best practices
| siiri: vaihtaisin parin lauseen paikkaa (toka lause lopuksi, vaikka ymmärrän miksi se tavallaan on tuohon kärkeen tungettu): Describe where you will store and back up your data during your research project. Consider who will be responsible for backup and recovery. If there are several researchers involved, create a plan with your collaborators and ensure safe transfer between participants. Show that you are aware of the storing solutions provided by your organisation. Do not merely refer to IT services. In the end, you are responsible for your data, not the IT department or the organisation. Explain the methods for preserving and sharing your data after your research project has ended in more detail in Section 5. MO KOMMENTTI: OK, muokattu vasemmalla
| EI KÄSITELTY 13.1. KOKOUKSESSA | 26.1.2021 jatketaan tästä eteenpäin VALMIS - HYVÄKSYTÄÄN 26.1. |
4.2 Who will be responsible for controlling access to your data, and how will secured access be controlled? 4.2 Kuka valvoo pääsyä aineistoon, ja miten suojattua pääsyä aineistoon valvotaan? 4.2 Vem reglerar åtkomsten till datamaterialet och hur övervakas skyddad åtkomst? | It is essential to consider data security issues, especially if your data include sensitive data, personal data, politically sensitive information or trade secrets. Describe who has access to your data, what they are authorised to do with the data, or how you will ensure the safe transfer of data to your collaborators. Tips for best practices
| It is essential to consider data security issues, especially if your data include sensitive data, personal data, politically sensitive information or trade secrets. Describe who has access to your data, what they are authorised to do with the data, or how you will ensure the safe transfer of data to your collaborators. Tips for best practices
| Tipsien bulletti on aika hankalasti ilmaistu (joutuu lukemaan pariin kertaan, että ymmärtää), mutta emme keksineet tähän parempaakaan. → MO/Tuulitoimisto kommentti: Ehdottakaa muotoiluehdotusta!! | EI KÄSITELTY 13.1. KOKOUKSESSA | VALMIS - HYVÄKSYTÄÄN 26.1. Tuulitoimisto lisää Tips-huomion tips: access controls: vastaa tarvetta, ota huomioon arkaluonteisen aineiston erityisvaatimukset, normaali pääsynhallinta ei riitä; ota selvää tarvitaanko kaksoiskirjautuminen; usein eivät tutkijoiden valittavissa Katso, mitä organisaatiosi ohjeistaa |
5. Opening, publishing and archiving the data after the research project | TÄHÄN SARAKKEESEEN UUSI MUOTOILUEHDOTUS | TÄHÄN SARAKKEESEEN VOI LAITTAA VAPAITA KOMMENTTEJA/KESKUSTELUA | 26.1.2021 KOKOUKSEN MUISTIINPANOT ja PÄÄTÖKSET | ||
5.1 What part of the data can be made openly available or published? Where and when will the data, or its metadata, be made available? 5.1 Mikä osa aineistosta voidaan asettaa avoimesti saataville tai julkaista? Missä ja milloin aineisto tai siihen liittyvät metatiedot asetetaan saataville? 5.1 Vilken del av datamaterialet kan göras öppet tillgängligt eller publiceras? Var och när kommer datamaterialet eller dess metadata att göras tillgängliga? | Describe whether you will make openly available or publish all your data or only parts of the data. If your data or parts of the data cannot be opened, explain why. In the case of sensitive data, which cannot be opened, describe the opening of its metadata. Describe the secured preservation procedure of sensitive data in Section 5.2. The openness of research data promotes its reuse. Tips for best practices
| Describe how you will make data available and findable for reuse. If your data or parts of the data cannot be opened, explain why you publish only metadata. In the case of sensitive data, which cannot be opened, describe the opening of its metadata. Describe the secured preservation procedure of sensitive data in Section 5.2. The openness of research data promotes its reuse. Tips for best practices
| Describe whether you will make openly available or publish all your data or only parts of the data or only metadata (Tiina s) → MO/TUULITOIMISTO KOMMENTTI: LISÄTÄÄNKÖ METADATA?
=> Meneekö tässä kaksi asiaa sekaisin? Data journaalissa julkaistaan artikkeli liittyen dataan. Repository on datan säilytyspaikka (Tiina S) MO KOMMENTTI: DATA JOURNAALEISSA JULKAISTAAN DATAA → siiri: eikö tärkeintä oo mainostaa, molempia vaihtoehtoja? en tunne data journaleita ja käytäntöjä tarkasti ja missä pitää lisäksi julkaista data, ehkä jopa riippuu journalista? (referessiksi: https://www.ands.org.au/working-with-data/publishing-and-reusing-data/data-journals)
Kati 23.12.2020: kohtaan "remember to check..." voisi lisätä "institutional" muiden lisäksi. MO KOMMENTTI: LISÄTTY EHDOTUKSEEN Mielestäni kohta "you can publish a description..." on epäselvä siinä mielessä että tutkija voi myös rajoittaa pääsyä aineistoon käyttämällä joidenkin repojen työkaluja, mutta data on silti avattu koska se voi olla saatavilla pyyntöä vastaan. Mitä jos kohtaa muuttaisi vaikka "You can publish all or part of your data in a data repository and additionally, restrict access to the said data when enabled by the repository". Päivi: Hyvä täsmennys! Kannatetaan! MO KOMMENTTI/KYSYMYS: LISÄTÄÄNKÖ EHDOTUKSEEN? Koko osion nimessä voisi hyödyntää Science Europen muotoilua "Long term preservation and data sharing after the research project". "Sharing" vaikuttaisi olevan vakiintunut muotoilu datan avaamisessa. - Jari & Saila MO KOMMENTTI: Sharing on hankala, sitä käytetään myös suojatun jakamisen yhteydessä (tai itse asiassa pitäisi käyttää tuollaisena yleisemmän tason kuvauksena; sekä julkaiseminen että suojattu työaikainen jakaminen ovat molemmat sharingiä). "Describe the secured preservation procedure of sensitive data in Section 5.2." Minkälainen säilytysproseduuri tähän voisi tulla kyseeseen? Onko tällainen prosessi jossain jo toiminnassa? Onko esim. PASsissa sensitiivisä datoja? Voisiko tämän jättää pois? Vai tarkoitetaanko tällä tutkijan omaa prosessia esim. "Describe your secured preservation procedure of sensitive data in Section 5.2" MO KOMMENTTI: ON KÄYTÖSSÄ. REPOT OTTAVAT TÄHÄN VAAN VÄHÄN ERI KANNAN - esim Kielipankki ottaa vastaan sensitiivistä FSD jostain syystä vain "anonymisoitua". Ehdottaisimme Science Europen mukaista lyhyempää ja ytimekkäämpää kysymystä: "How and when will data or its metadata be shared?". Näin vältettäisiin myös hankala "publish" -termi kysymyksessä. Muutenkin käyttäisimme linjakkaammin tuota "data sharing" käsitettä tässä kohdassa. Jari & Saila MO KOMMENTTI: Sharing on tosiaan hankala itse en toisi sitä tähän. Publish puolestaan on syytä olla mukana, koska datajournaalit ovat puolestaan nimenomaan julkaisemista. | EI KÄSITELTY 13.1. KOKOUKSESSA
| Ensimmäinen lause > Describe how you will make data available and findable for reuse. Metadata lisätään lauseeseen (Akatemian vaatimus myös): data journal jätetään pysyvä tunniste painokkaammin; voiko olla julkaistu, jos ei ole pidiä? Ehdotus: You can publish all or part of your data in a data repository and additionally, restrict access to the said data when enabled by the repository Sharing: ei laiteta osion nimeen VALMIS - HYVÄKSYTÄÄN 26.1. |
5.2 Where will data with long-term value be preserved, and for how long? 5.2 Missä pitkällä aikavälillä arvokas data säilytetään ja kuinka pitkään? 5.2 Var bevaras datamaterial av långsiktigt värde och hur länge? | Briefly describe what part of your data you will preserve and for how long. Categorise your data sets according to the anticipated preservation period: A) Data to be destroyed upon the ending of the project Describe which part of the data you will dispose of after the project and how you will destroy the data. Describe the access policy to the archived data. Consider using archives with a curation policy. Tips for best practices
| Briefly describe what part of your data you will preserve, where it is preserved, and for how long. Long term preservation means that data is preserved for as long as necessary, for several decades or even centuries. You can categorise your data sets according to the anticipated preservation period: A) Data to be destroyed upon the ending of the project You will need to decide which of your research data to preserve and dispose of. Data that is unique or difficult to replicate might have long-term value and be fit for preservation. Special long term data repositories should be used for digital preservation. Tips for best practices
| Tässä kysymys ja ohjeteksti käsittelevät eri asioita, ensin pyydetään kertomaan minne pitkällä aikavälillä arvokkaat tiedot arkistoidaan ja sitten ohjeessa pyydetäänkin luettelemaan kaiken aineiston säilytys, kumpaa tässä halutaan? Long-term termi on hämmentävä, harvassa tutkimuksessa tuotetaan PAS säilytykseen meneviä aineistoja, niistäkö tässä puhutaan vai jostakin muusta? (Anne) MO KOMMENTTI: Eri asioita? Minna 07.01.21: Tässä jää epäselväksi koskeeko kysymys arkistointia vai pitkäaikaissäilytystä vai molempia. Komppaan Annen kommenttia eli tässä voisi keskittyä vain preservation näkökulmaan (eli Briefly describe what part of your data you will preserve and for how long ) ja muistuttaa, että harvassa projektissa syntyy oikeasti kymmeniä vuosia säilytettävää dataa. Esim. Data that is unique or difficult to replicate might have long-term value and be fit for preservation. Jos sellaista syntyy niin: Special long term data repositories should be used for digital preservation. Siiri: komppaan edellisiä. Tehtiin Minnan kanssa ehdotus docsiin (lähestytään kysymystä nimenomaan pas näkökulmasta. MO KOMMENTTI: sekä arkistointi että pitkäaikaissäilytys käsitellään tässä; 5.2 osion oleellinen motivaatio on sen ero kysymykseen 5.1. 5.1ssa käsitellään avoimeksi saattamista, 5.2ssa suojattuna pitämistä (tai tuhoamista) Harva voi DMP-vaiheessa luvata, että data pitäisi tallettaa sadoiksi vuosiksi. Voiko mikään taho luvata näin pitkää säilytysaikaa? - Jari & Saila MO KOMMENTTI: Ei tarvitse luvata. Ohjeen tarkoitus on herätellä ajattelemaan, mitä teet datalle tutkimuksen jälkeen. Sekä tuhoaminen, julkaiseminen että suojattu arkistointi pitää suunnitella. Tämä ei tapahdu itsestään. Ja kaiken lisäksi nämä vaativat monesti huomioimasti jo keruuvaiheessa. Anne: Jatkona keskusteluun, minä näkisin olennaisena miettiä kaiken aineiston säilytystä,ei siis vain PAS aineistojen, tällöin tulisi mietittyä se määräajan säilytettävien hävityskin, se on hyvin olennainen osa aineistonhallintaa. Siirin ja Minnan ehdotuksesta selviää hyvin mitä on PAS, lisäksi säilyttäisin tuon A-D kategorisoinnin. MO KOMMENTTI: Samoin - lisäisin tuon esimerkin eri aikajakoista ja niiden motivaatioista | EI KÄSITELTY 13.1. KOKOUKSESSA | VALMIS - HYVÄKSYTTÄVISSÄ 26.1.2021 kokouksessa? MO muistiinpanot: "kumpaa tässä halutaan? " Kumpaakin. MO KOMMENTTI: Apua! Miksi suomenkielisessä kysymyksessä lukee tiedot!??! Voitaneen muuttaa aineistoksi tai dataksi MO KOMMENTTI: Ehdotetuissa tipseissä tämä: "Use data repositories with a commitment to long-term curation" rajaa aika rajusti - haravalla tieteenalalla on tämän suuntaisia. Entä jos ei ole PAS-kuratoituja? Mitä silloin tehdään? Kysymyksen muuttaminen?: säilytys, arkistointi ja tuhoaminen -eri aikajänteet säilyttämisessä näkyviin -varmistetaan, että oleelliset asiat säilyvät Archive sana voi hämmentää Voisiko 5.1 ja 5.2 yhdistää?!!!! Siirin ja Minnan ehdotus hyväksytty. Suomenkielinen kysymys muutettu: 5.2 Missä pitkällä aikavälillä arvokas data säilytetään ja kuinka pitkään? VALMIS - HYVÄKSYTÄÄN 26.1. |
6. Data management responsibilities and resources | TÄHÄN SARAKKEESEEN UUSI MUOTOILUEHDOTUS | TÄHÄN SARAKKEESEEN VOI LAITTAA VAPAITA KOMMENTTEJA/KESKUSTELUA | 26.1.2021 KOKOUKSEN MUISTIINPANOT ja PÄÄTÖKSET | ||
6.1 Who (for example role, position, and institution) will be responsible for data management? 6.1 Kuka (esim. tehtävä ja laitos) vastaa aineistonhallinnasta? 6.1 Vem (t.ex. roll, ställning och enhet) ansvarar för specifika uppgifter i datahanteringen under projektets livscykel? | Summarise here all the roles and responsibilities described in the previous answers. Tips for best practices
| Summarise here all the roles and responsibilities described in the previous answers. Also, consider who will be responsible for the data resulting from your project after your project has ended. Tips for best practices
| Data steward ja erityisesti tietovastaava ovat hämmentäviä termejä, kenellä tällaisia on? Eikö datanhallinnasta yleensä vastaa tutkijat tai muut hankkeen toimijat? (Anne) MO KOMMENTTI: Vastuussa ovat toki kaikki ryhmässä, jotka data käsittelevät, mutta teityt instrumentit mahdollistavat avun palkkaamisen. Siiri: mun mielestä toi DM ja DS on tossa in fine, harvalla varmasti niitä on ja tutkija itse vastaa monesta asiasta, mutta täydellisessä maailmassa voisi olla.. Anne jatkaa: DM ja DS tässä kohdassa joskus synnyttää mielikuvan että datanhallinta vaan sitten lykätään jonkun yliopiston DM/DS tyypin tehtäväksi, että ei tarvitse tutkijoiden huolehtia asioista joita suunnitelmaan kirjoittavat MO KOMMENTTI: Totta - näihän siinä saattaa käydä, mutta jos tällaista esiintyy DMP-tarkistuksessa tukipalveluiden on syytä ärähtää tutkijalle asiasta. Ja tämähän on tutkimusassareiden osalta arkipäivää jo nyt. PI:t ei kanna korttaan kekoon DMP-kirjoituksessa, jolloin eivät myöskään ymmärrä tästä puolesta, ja homman hoitaa tohtorikoulutettava tai aloittanut post-doc Päivi: Joo, totta! Tullut joskus kyselyitäkin, että voiko nimetä tähän jounkun yliopiston tutkimuspalveluista. siiri: laittaisin viimeisen lauseen toiseksi lauseeksi: Summarize here all the roles and responsibilities described in the previous answers. Also, consider who will be responsible for the data resulting from your project after your project has ended. | EI KÄSITELTY 13.1. KOKOUKSESSA | Siirin siivous hyväksytty. Tietovastaava suomenkielisessä kysymyksessä? > poistetaan esimerkki (data steward) kysymyksestä VALMIS - HYVÄKSYTÄÄN 26.1. |
6.2 What resources will be required for your data management procedures to ensure that the data can be opened and preserved according to FAIR principles (Findable, Accessible, Interoperable, Re-usable)? 6.2 Mitä resursseja aineistonhallinta edellyttää, jotta voit varmistaa, että aineisto voidaan avata ja säilyttää FAIR-periaatteiden (ks. edellä) mukaan? 6.2 Vilka resurser behövs för hanteringen av ditt datamaterial för att data ska kunna öppnas och förvaras i enlighet med FAIR-principerna (sökbart, tillgängligt, interoperabelt och återanvändbart)? | Estimate the resources needed (for example, financial and time) to manage, preserve and share the data. Consider the additional computational facilities and resources that need to be accessed, and what the associated costs will amount to. Tips for best practices
| Estimate the resources, such as time and financial costs, needed to manage, share and preserve the data. These may include storage costs, hardware, staff time, the costs of preparing data for deposit and repository charges. Tips for best practices
| siiri: tässä on paljon toistoa ja sama asia sanotaan alussa ja lopussa ja välissäkin mainitaan. Tein ehdotuksen: Estimate the resources, such as time and financial costs, needed to manage, share and preserve the data. These may include storage costs, hardware, staff time, the costs of preparing data for deposit and repository charges. Tips for best practices
MO KOMMENTTI: JEE - kiitos! | EI KÄSITELTY 13.1. KOKOUKSESSA | Siiri pisti kuntoon. VALMIS - HYVÄKSYTÄÄN 26.1. |