Helsingin yliopiston datatukiverkosto päivittää vuosittain aineistonhallintasuunnitelman ohjettaan. Päivitys tehdään 28.2.2023 mennessä. Kullekin osiolle on merkitty vastuuhenkilö. Liisa, Marja ja Tuija katsovat kokonaisuuden. Tuija päivittää lopullisen version datatuen verkkosivulle, DMPTuuliin ja tarvittaessa Zenodoon. Tavoitteena on, että päivitetty versio on tutkijoiden käytettävissä maaliskuun loppuun mennessä.
| | University of Helsinki DMP guidance
Päivitettävä teksti | Helsingin yliopiston DMP-ohje
Päivitettävä teksti | VASTUUHENKILÖT JA KUITTAUS
Verkkosivun ohje päivitetty 20.4.2023 Ohje päivitetty DMPTuuliin 21.4.2023 |
Motivation Motivointiosio Motivation
| Your DMP is a living document where you describe how you will manage your data throughout the research life cycle. Update the plan when your project progresses. To avoid redundancy, refer to your research plan in your DMP and vice versa. The research plan describes the scientific, analytical and methodological processing of data, whereas the DMP describes the technical and administrative management of data. In the DMP context, ‘data’ is understood as a broad term. Data covers all the information and research material your results are based on.
How do I write a DMP? - READ THIS FIRST! - Read all of the questions first! Answer the questions where applicable and at least the main categories – if a certain question is not applicable in your case, justify why not.
- Include background information such as the name of the applicant and the project, the project number, the funding programme and the version of the DMP. Demonstrate your data management and version control skills, for example, when considering the name of the DMP file.
- Use the DMP as a risk evaluation document – it shows that you can recognise, anticipate and handle the risks related to your data management workflow.
- The DMP should be drawn from your own research project – do not copy from somewhere else and write only sentences you understand.
- Follow the organisation’s or funder’s requirements.
Why should you manage your research data and write a data management plan (DMP)? - It is good research practice and helps you to save time and money!
- You will reduce the risk of losing your data.
- You will be able to anticipate complex ownership and user rights issues in advance.
- DMP supports making your data FAIR: Findable, Accessible, Interoperable and Re-usable. This will increase data reuse as well as visibility of your project.
- You will meet your funder’s requirements.
- Your DMP reflects your researcher skills.
| Why should you manage your research data?
Research data management and its planning are integral parts of good research practices. Data management aims to - recognize and control the risks involved,
- pay attention to data protection and information security,
- agree about data ownership, sharing, and preservation, as well as
- ensure that the necessary resources and equipment are available.
Your Data Management Plan (DMP) should describe how you manage data during as well as after the active phase of the research project. The plan should be updated as the research project evolves. Your research data management practices should aim to produce reusable data, which follows FAIR principles, that is, your data should be Findable, Accessible, Interoperable and Re-usable.
In the DMP data is understood as a broad term including: - data collected by various methods (such as surveys, interviews, measurements, imaging techniques etc.),
- data produced during the research (such as analysis results),
- research sources (such as archive material),
- notes and field notes, and
- source code and software.
How do I write a DMP? - Read all of the questions first
! - Use the DMP to complement your research plan – avoid overlaps and refer between plans when needed.
- The research plan describes the scientific, analytical and methodological processing of data.
- The data management plan describes the technical and administrative management of data.
- DMP shows that you can recognize, anticipate and handle the risks related to your data management workflow.
- Follow the organisation’s or funder’s requirements.
- Answer at least the main categories. If a certain question is not applicable in your case, justify why not.
- Include background information such as the name of the applicant and the project, the project number, the funding programme and the version of the DMP.
| Miksi tutkimusaineistojen hallinta on tärkeää?
Tutkimusaineiston hallinta ja suunnittelu kuuluu olennaisesti hyviin tutkimuskäytäntöihin. Tavoitteena on - tunnistaa ja hallita riskejä,
- huomioida riittävä tietosuoja ja tietoturva,
- sopia aineiston tekijyydestä, käytöstä ja säilyttämisestä, sekä
- varmistaa tarvittavat resurssit ja välineet.
Aineistohallintasuunnitelmassa (Data Management Plan, DMP) kuvataan, kuinka tutkimusaineistoja hallitaan tutkimusprojektin aikana ja projektin aktiivivaiheen jälkeen. Sitä on päivitettävä tutkimusprojektin edetessä. FAIR-lyhenne kiteyttää aineistonhallinnan tavoitteet. Aineiston on tarkoitus olla löydettävissä (Findable), saavutettavissa (Accessible), yhteentoimiva (Interoperable) ja uudelleen käytettävissä (Re-usable).
Aineistohallintasuunnitelmassa tutkimusaineistoksi (tutkimusdata) katsotaan - kerätty aineisto (kuten näytteet, kyselyt, haastattelut, mittaukset, arvioinnit, kuvantamismenetelmät);
- tuotettu aineisto (esimerkiksi analyysissä syntyvä aineisto);
- muut lähteet (kuten arkistomateriaali);
- muistiinpanot ja kenttäpäiväkirjat sekä
- lähdekoodit ja ohjelmistot.
Miten laadit aineistonhallintasuunnitelman? - Tutustu ensin kaikkiin kysymyksiin
! - Aineistonhallintasuunnitelma täydentää tutkimussuunnitelmaasi. Päällekkäisyyksien välttämiseksi voit viitata suunnitelmasta toiseen.
- Tutkimussuunnitelma kuvaa aineiston tieteellistä, analyyttistä ja metodologista käsittelyä.
- Aineistonhallintasuunnitelma kuvaa aineiston teknistä ja hallinnollista käsittelyä.
- Suunnitelma osoittaa, että osaat tunnistaa ja ennakoida aineistonhallintaan liittyviä riskejä ja ottaa lainsäädännön huomioon.
- Noudata organisaation tai rahoittajan vaatimuksia.
- Vastaa ainakin pääkysymyksiin. Jos jokin kysymys ei liity tutkimukseesi, perustele, miksi näin on.
- Vaikka suunnitelma on rahoittajan vaatimus, se on parhaimmillaan käytännönläheinen ja helposti ymmärrettävä työdokumentti itselle ja kollegoille.
- Liitä suunnitelmaan mukaan kaikki olennaiset taustatiedot kuten hakijoiden ja hankkeen nimet, numerotunnisteet ja versiotiedot.
| Kirjaa tarvittaessa tähän sarakkeeseen lyhyt kommentti, mitä korjasit
Kaikki linkit tarkistettava ja päivitettävä
Ryhmä kuittaa tähän, kun kohta on valmis (sekä suomi että englanti) (esimerkki kuittauksesta: 25.2.2023 VALMIS TK, LS ) VALMIS KL, MP
-päivitetty verkkosivulle (suomi) -englanti päivitetty verkkosivulle 13.3.2023
|
| | 1. General description of the data | | MUUTOSLOKI/KOMMENTTISARAKE |
1.1 What kinds of data is your research based on? What data will be collected, produced or reused? What file formats will the data be in? Additionally, give a rough estimate of the size of the data produced/collected. 1.1 Millaiseen aineistoon tutkimuksesi perustuu? Millaista aineistoa kerätään, tuotetaan tai käytetään uudelleen? Missä tiedostomuodossa aineisto on? Esitä myös karkea arvio tuotettavan/kerättävän aineiston koosta.
| Briefly describe what types of data you are collecting or producing. In addition, explain what kinds of already existing data you will (re)use. List, for example, the types of texts, images, photographs, measurements, statistics, physical samples or codes. Categorise your data in a table or with a clear list, for example: A) previously collected existing data which is being reused in this project, B) data collected for this project, C) data produced as an outcome of the research process. The categorisation can form a general structure for the rest of the DMP. List the file formats for each data set. In some cases, the file formats used during the research project may differ from those used in archiving the data after the project. List both. The file format is a primary factor in the accessibility and reusability of your data in the future. In the DMP, what is important is to describe the required disk space, not how many informants participated in the project. A rough estimation of the size of the data is sufficient, for example, less than 100 GB, approx. 1 TB or several petabytes. Tips for best practices - Use a table or bullet points for a concise way to present data types, file formats, the software used and the size of the data.
- Examples of file formats are .csv, .txt, .docx, .xslx and .tif.
- Make sure to describe any special or uncommon software necessary to view or use the data, especially if the software is coded in your project.
- You can also estimate the increase in data production or collection during the project for a specific time period: "The project is producing/collecting approximately 100 GB of data per week."
AVOID OVERLAPS WITH THE RESEARCH PLAN! Data analysis and methodological issues related to data and materials should be described in your research plan, not in your data management plan. | Discuss the following in your answer: - What kind of data will be used and produced in the project? If you use sensitive data, see the recommendations below the examples.
- In which file formats will the data be?
- Approximately how much data will the project have, e.g. in gigabytes or the number of samples?
- Will you use or develop special software?
Tips for best practices List your data in the following way using bullet points or a table. The plan is based on the described data types. If you use categorization or abbreviations to describe the data, it will be easier for you to refer to the specific dataset in the rest of the plan. Example 1 datatypes in a list format:
1. Data collected in this project - Questionnaire x, file format .pdf, size 5 GB
- DNA samples (clarify the origin, human or another organism), physical sample, size n=500
- Pictures/videos about x, file format .jpg, .avi, size 1 TB
2. Data produced as an outcome of the process - Analyses of questionnaire x, .pdf, .xlsx, 2 GB
- DNA sequences/analyses, FASTA, .txt, .xlsx, 2 TB
- Documentation of the data (survey form, codebook, laboratory notebooks, readme files)
3. Previously collected existing data reused in this project - Samples from the Biobank
- Data from Statistics Finland, database, 10 GB
- Survey data from Finnish Social Science database Aila
- Interviews or language corpus from the Language Bank of Finland
Example 2 datatypes in a table format: | | | | |
|---|
| | | | | Analysis of questionnaire x | | | | | | | | | |
Guidance for sensitive data It is essential to identify sensitive data types, as data management planning includes recognizing and managing the risks involved with such data. If your data contains personal data, you need to identify the controller. More information can be found in the Data protection guide for researchers (Flamma) and in Additional instructions for managing sensitive data. Sensitive data is information that could cause damage if revealed. Such data are: - Personal data:
- Personal data includes all identifiers from which a person is identifiable directly or indirectly.
- Direct identifiers: name, phone number, social security number, picture, voice, fingerprint, dental chart, etc
- Indirect identifiers: gender, age, education, profession, nationality, work history, system log history, marital status, residence information, car license number, opinion, psychological or physical feature etc.
- Sensitive personal data
information:- Special categories of personal data:
- Data revealing racial or ethnic origin, political opinions, religious or philosophical beliefs or trade union membership
- Genetic data
- Biometric data processed for the purpose of uniquely identifying a person
- Data concerning health
- Data concerning a person’s sex life or sexual orientation
- Other sensitive personal data:
- Data describing the economic or social status
- Location data
- Communication data
- Behaviour
- Other data that is particularly personal e.g., notes and diaries
- Sensitive information about species, such as endangered animals, plants, nature conservation areas, or biosafety (FIN).
- Other confidential information, such as patents, military information, organizational information, or trade secrets.
| Käsittele vastauksessasi seuraavia asioita: - Mitä aineistoa tutkimuksessa käytetään ja tuotetaan? Jos käytät arkaluonteista tietoa, katso esimerkkien alla oleva ohje.
- Missä tiedostomuodoissa aineiston eri osat ovat?
- Arvioi aineiston yhteenlaskettu koko, esimerkiksi gigatavuina, sekä otoskoko.
- Käytättekö erityisiä ohjelmia tai kehitättekö omia?
Hyviä käytäntöjä Luettele datatyypit listana tai taulukkona esimerkiksi alla olevien luokittelujen mukaisesti. Suunnitelma pohjautuu kuvattuihin datatyyppeihin, ja jos käytät kategorisointia tai lyhenteitä datayyppien kuvailussa, sinun on helpompi viitata datoihin suunnitelman loppuosassa. Esimerkki 1 datatyypeistä listamuodossa: 1. Tutkimusta varten kerättävä aineisto - Kysely aiheesta x, tiedostomuoto .pdf, koko 5 Gt
- DNA-näyte (erittele näytteen alkuperä - ihminen vai muu eliö), fyysinen näyte, koko n=500
- Kuvat/videot aiheesta x, tiedostomuoto .jpg, .avi, koko 1 Tt
2. Tutkimusprosessin tuloksena syntyvä aineisto - Kyselyaineiston analyysit, .pdf, .xlsx, 2 Gt
- DNA sekvenssi/analyysi, FASTA, .txt, .xlsx, 2 Tt
- Aineiston dokumentaatioaineisto (kyselylomake, koodikirja, laboratoriopäiväkirja, readme-tiedostot)
3. Aiemmin kerätty aineisto - Näytteet Biopankista
- Tilastokeskuksen aineisto x, tietokanta, 10 Gt
- Kyselyaineisto Tietoarkiston Aila-tietokannasta
- Haastatteluaineisto tai kielikorpus Kielipankista
Esimerkki 2 datatyypeistä taulukkomuodossa: | | | | |
|---|
| | | | | Kyselyaineiston analyysi x | prosessin tuloksena syntyvä aineisto | | | | | aiemmin kerätty aineisto (Biopankki) | | | |
Lisäohjeita arkaluonteisten ja luottamuksellisten aineistojen käyttäjille Koska tutkimusaineiston arkaluonteiset osat sisältävät erityisen paljon riskejä, niiden tunnistaminen ja hallinnointi vaatii erityistä tarkkuutta. Henkilötietojen osalta kerro, mikä taho toimii rekisterinpitäjänä. Lisätietoja Tutkijoiden tietosuojaohjeessa (Flamma) sekä Täydentävästä ohjeesta arkaluonteisen datan hallintaan. Arkaluonteinen ja luottamuksellinen tieto on sellaista, joka voi paljastuessaan aiheuttaa vahinkoa. Tällaisia aineistoja ovat esimerkiksi: - Henkilöitä koskevat tiedot:
- Henkilötietoa ovat kaikki ne tiedot, joista henkilö on tunnistettavissa joko suoraan tai epäsuorasti
- suorat tunnisteet: nimi, puhelinnumero, henkilötunnus, kuva, ääni, sormenjälki, hammaskartta
- epäsuorat tunnisteet: sukupuoli, ikä, koulutus, ammattiasema, kansallisuus, sijainti, työhistoria, järjestelmän lokitiedot, sivilisääty, asuinpaikka, auton rekisterinumero, mielipide, psyykkinen tai fyysinen ominaisuus
- Arkaluonteiset henkilöä koskevat tiedot:
- Erityiset henkilötietoryhmät:
- tiedot, joista ilmenee rotu tai etninen alkuperä, poliittisia mielipiteitä, uskonnollinen tai filosofinen vakaumus tai ammattiliiton jäsenyys
- geneettiset tiedot
- biometriset tiedot, jos niitä käsitellään teknisin menetelmin henkilön yksiselitteistä tunnistamista varten
- terveyttä koskevat tiedot
- luonnollisen henkilön seksuaalista käyttäytymistä ja suuntautumista koskevat tiedot.
- Muut sensitiiviseksi koetut henkilöä koskevat tiedot:
- Taloudellinen tai sosiaalinen status
- Henkilön sijainnin seurantatiedot
- Viestintä
- Käyttäytyminen
- Muut erityisen henkilökohtaisiksi koetut tiedot esim. muistiinpanot, päiväkirjat
- Sensitiivinen lajitieto, kuten uhanalaiset eläimet ja kasvit, luonnonsuojelullinen tieto tai bioturvallisuusuuteen liittyvä tieto.
- Muu luottamuksellinen tieto, kuten patentit, maanpuolustukseen liittyvä tieto, organisatorinen tieto tai liikesalaisuudet.
| Aleksi, Iina
Lisätty linkki Täydentevä ohje arkaluonteisen datan hallintaan.
VALMIS IH, AP
suomi päivitetty verkkosivulle 13.3.2023 Esimerkistä pois 1 Taulukkoa ei verkkosivulla verkkosivulla ei tekstiä: lisäohjeita
englanti päivitetty verkkosivulle 14.3.2023
|
1.2 How will the consistency and quality of data be controlled?
1.2 Miten aineiston yhtenäisyys ja laatu varmistetaan?
| Explain how the data collection, analysis and processing methods used may affect the quality of the data and how you will minimise the risks related to data accuracy. Data quality control ensures that no data is accidentally changed and that the accuracy of the data is maintained over its entire life cycle. Quality problems can emerge due to the technical handling, converting or transferring of data, or during its contextual processing and analysis. Tips for best practices - Adopt and enforce formal version control processes. This can mean e.g. simply shared and documented file naming conventions, or everyone in team working in Git repositories.
- Transcriptions of audio or video interviews should be checked by someone other than the transcriber.
- Analog material should be digitised in the highest resolution possible for accuracy.
- In all conversions, maintaining the original information content should be ensured.
- Organise training sessions and set guidelines to ensure that everyone in your research group can implement quality control and anticipate the risks related to the quality of the data.
AVOID OVERLAPS WITH THE RESEARCH PLAN! Issues related to data analysis, methods and tools should be described in your research plan, that is, do not include, for example, instrument calibration descriptions here. | Discuss the risks involved in controlling data integrity and quality, as well as how they are managed. Notice that data quality and the quality of research methods are two distinct issues. Tips for best practices Describe the following practices, if they are or will be in use: - What tools for data management do you use, e.g. electronic lab notebook or digital survey form?
- How the research team is familiarized with the RDM practices?
- Are the methods validated, or are quality control pipelines in use?
- Are transcriptions of audio or video interviews checked by someone other than the transcriber?
- Are checksums used?
- Digitizing of analogue or physical material should be done with sufficient accuracy.
- In all conversions, maintaining the original information content should be ensured.
- Discuss how minimisation, pseudonymisation, and anonymisation affect data quality.
| Tuo esille piilevät riskit aineiston yhtenäisyyden ja laadun varmistamisessa ja se, miten riskejä kontrolloidaan. Huomaa, että aineiston laatu ja tutkimusmenetelmän laatu tarkoittavat eri asioita. Hyviä käytäntöjä Kerro vastauksessa esimerkiksi seuraavista käytännöistä,
- Mitä aineistonhallinnan työkaluja sinulla on käytössäsi, kuten tietokantapohja, elektroninen laboratoriopäiväkirja tai sähköinen kyselylomake?
- Miten aineistoa käsittelevät henkilöt perehdytetään?
- Ovatko käytettävät menetelmät validoituja, tai onko käytössä laatukäsikirja?
- Tarkistaako joku äänitettyjen tai kuvattujen haastattelujen litteroinnin?
- Käytättekö tarkistussummia?
- Vastaavatko digitoidut aineistot riittävän tarkasti alkuperäisiä fyysisiä tai analogisia aineistoja?
- Varmistetaanko alkuperäisen tietosisällön säilyminen, jos tietoja siirretään, muutetaan tai konvertoidaan järjestelmästä toiseen?
- Pohdi, miten mahdollinen minimointi, pseudonymisointi tai anonymisointi vaikuttavat aineiston laatuun.
| suomi päivitetty verkkosivulle 13.3.2023 englanti päivitetty verkkosivulle 14.3.2023 |
| | 2. Ethical and legal compliance | 2. Eettisten periaatteiden ja lainsäädännön noudattaminen | MUUTOSLOKI/KOMMENTTISARAKE |
2.1 What legal issues are related to your data management? (For example, GDPR and other legislation affecting data processing.)
2.1 Mitä juridisia seikkoja liittyy aineiston hallintaan (esim. EU:n yleinen tietosuoja-asetus ja muu aineiston käsittelyyn liittyvä lainsäädäntö)?
| All types of research data involve questions of rights and legal and ethical issues. If you are handling personal or sensitive information, describe how you will ensure privacy protection and data anonymisation or pseudonymisation. Tips for best practices - Check your institutional ethical guidelines, data privacy guidelines and data security policy, and prepare to follow the instructions that are given in these guidelines.
- If your research is to be reviewed by an ethical committee, outline in your DMP how you will comply with the protocol (e.g., how you will remove personal or sensitive information from your data before sharing data to ensure privacy protection).
- Will you process personal data? If you intend to do so, please detail what type of personal data you will collect.
- All data related to an identified or identifiable person is personal data. Information such as names, telephone numbers, location data and information on the congenital diseases of the individual's grandparents is personal data.
- Office of the Data Protection Ombudsman (https://tietosuoja.fi/en/processing-of-personal-data)
AVOID OVERLAPS WITH THE RESEARCH PLAN! Details of the ethical issues, the ethical committee statements and the use of laboratory animals should be described in the research plan. | Discuss the following in your answer: - Does your data include personal data?
- Are there any aspects of your data covered by general or discipline-specific research ethics guidelines?
- Do you need an ethical review for your study, which is always carried out prior to data collection, if necessary?
- What kind of research permits do you need? E.g. data permits by Findata, research permit of the organisation being researched?
- Do you work with other confidential or sensitive data than described above (e.g., endangered species (FIN), conservation areas, military information)?
- Are there Intellectual Property Rights (IPR) such as copyright or patent right matters involved with the data?
- (Are there any international sanctions and export control issues related to research?)
Describe how you will maintain high ethical standards and comply with relevant legislation when managing your research data. Describe what are the risks involved, and how are they managed. - Justify why you have the right to collect, handle, and preserve data that involves ethical issues. For example, explain if you have passed an ethical review, and describe how you will ask for informed consent from the potential research subjects to participate in the study.
- If you handle personal data
(more tips behind the link):- Specify the legal basis for processing of personal data (research carried out in the public interest,
consent?) - Inform your research subjects (Openness towards the subjects/participants in the research project.)
Mention, who are the parties processing data and who or which organisation is the controller (or is there a joint controllership between the parties)- Describe, what kind of personal data you need and why
- Describe, how you will secure the processed data and the privacy of the data subjects (examinees) and if needed, how you perform data anonymisation or pseudonymisation.
- Assess the risk to data subjects that the processing of their data may cause
- Assess the need for data protection impact assessment (with the help of Preliminary assessment for data protection - form)
- Perform the data protection impact assessment if needed
- Assess how you will fulfill the data subject rights (including informing)
- Describe, how you will take care of the erasure of unnecessary data and what happens after your research
- If you transfer or disclose data for processing outside of the EU, please describe how the legality of the transfer and data subject rights will be taken care of. Data transfers outside the EU mean e.g. that you disclose personal data for partners that are located outside the EU or if you use a cloud service which servers are located outside the EU for data processing.
Additional information For example, other requirements apply to informing participants and documenting the processing of personal data. You can find more information about them in the links below. Data protection guide for researchers (Flamma)
General information about data protection (Flamma) Informing research participants (Data management guidelines, FSD)
Data protection recommendation for GLAM sector (FIN, Finnish GLAM jurisprudence group) Research ethics on Flamma and on the university's external website | Käsittele vastauksessasi seuraavia asioita: - Sisältääkö aineistosi henkilöihin liittyvää tietoa
(jolloin on otettava huomioon tietosuojalainsäädäntö)? - Liittyykö aineistoosi yleisissä tai tieteenalakohtaisissa tutkimuseettisissä ohjeistuksissa linjattuja näkökohtia?
- Tarvitseeko tutkimuksesi eettisen ennakkoarvioinnin, joka tehdään tarvittaessa aina ennen aineistonkeruun aloittamista?
- Millaisia tutkimus- tai viranomaislupia tarvitset? Esim. Findatan tietolupa, kohdeorganisaation tutkimuslupa?
- Käsitteletkö muuta salassa pidettävää tai luottamuksellista aineistoa kuin yllämainitut (esim. sensitiivinen lajitieto, suojelualueet, asevoimiin liittyvä tieto)?
- Liittyykö aineistoon tekijänoikeus- tai patentointikysymyksiä?
- (Onko tutkimukseesi seikkoja, joita liittyy kansainväisiä pakotteita tai vientivalvontaa?)
Kerro, miten täytät eettiset vaatimukset ja noudatat asiaankuuluvaa lainsäädäntöä tutkimusaineiston hallinnassa. Kuvaa myös tärkeimmät riskit ja kuinka hallitset niitä. - Perustele, että sinulla on oikeus kerätä, käsitellä ja säilyttää aineistoa, joihin liittyy eettisiä seikkoja. Esim. kerro, onko mahdollinen eettinen ennakkoarviointi tehty ja kuvaile, miten pyydät mahdollisilta tutkittavilta tietoon perustuvat suostumukset tutkimukseen osallistumiselle.
- Jos käsittelet henkilötietoja
(henkilötietoja (lisäohjeita linkin takana):
- Kuvaile, miten keräät aineiston ja huomioit tietosuojan
lainsäädännön yleiset periaatteet:- Mikä on käsittelyperuste
ella (yleensä yleisen edun mukainen tieteellinen tutkimus) ja mahdollisilla luvilla saat aineiston käyttöösi? Tarvitsetko suostumuksia? - Miten informoit tutkittavia? (Avoimuus tutkittavia/tutkimushankkeeseen osallistuvia kohtaan.)
- Mitkä henkilöihin liittyvät tiedot ovat tarpeellisia ja miksi (minimointiperiaate) ja kerro miten tarvittaessa anonymisoit tai pseudonymisoit aineiston.
Miten huomioit käyttötarkoitussidonnaisuuden (että aineistoja käytetään vain niihin tarkoituksiin joihin ne on kerätty ja mitä tutkittaville on mahdollisesti informoitu) Miten Huolehdit siitä että tietoja ei sälytetä kauempaa kuin on tarpeen (pseudonymisointi, anonymisointi, tietojen tuhoaminen) ja mitä aineistolle tapahtuu tutkimuksen päättymisen jälkeen
- Arvioi, mitä riskejä henkilötietojen käsittelystä voi aiheutua tutkittaville ja kuvaile miten ne vältät? Mikäli
tutkimus tietojen käsittely saattaa aiheuttaa korkean riskin tutkittaville, on sinun tehtävä myös tietosuojaa koskeva vaikutustenarviointi. - Arvioi miten voit toteuttaa rekisteröidyn oikeudet
- Mikäli siirrät tai luovutat aineistoa käsiteltäväksi EU:n ulkopuolelle, kerro miten siirtojen lainmukaisuudesta huolehditaan. Tietoja voi siirtyä EU:n ulkopuolelle esimerkiksi jos luovutat tietoja kumppaneille jotka sijaitsevat EU:n ulkopuolella tai jos käytät tietojen käsittelyssä pilvipalvelua, jonka palvelimet sijaitsevat EU:n ulkopuolella.
Lisäohjeita Esimerkiksi tutkittavien informointiin ja henkilötietojen käsittelyn dokumentointiin liittyy myös muita vaatimuksia, joista löytyy tarkempaa tietoa alla olevista linkeistä. Tutkijoiden tietosuojaohje Flammassa
Yleistä tietosuojasta Flammassa Tutkittavien informointi (Aineistonhallinnan käsikirja, Tietoarkisto)
Tietosuoja KAM-sektorilla (KAM-juridiikkaryhmä) Tutkimusetiikkaa koskevat ohjeet Flammassa ja yliopiston ulkoisilla sivuilla | Aura, Lotta ja Soile katsovat tätä 10.3. muutokset Aura, Lotta muutokset 10.3.2023 - Kansallisessa ohjeessa muutettava information → data
- Lotta kysynyt Pertulta, tarvitseeko huomioida pakotteita ja vientivalvontaa koskevia asioita (koskevat myös dataa/tutkimusaineistoja?). Soile ehdottaa, että jos kysymystä tarvita tässä, niin sen voi siirtää meidän tsekkaus-listalle.
suomi päivitetty verkkosivulle 21.3.2023 (ilman pakotteita ja vientivalvontaa) englanti päivitetty verkkosivulle 21.3.2023 (ilman sanctions ja export control)
|
2.2 How will you manage the rights of the data you use, produce and share? 2.2 Miten hallinnoit käyttämäsi, tuottamasi ja jakamasi aineiston oikeuksia? | Describe how you will agree upon the rights of use related to your research data – including the collected, produced and (re)used data of your project. Here, you can employ your categorisation in the first question. Each of these categories involves different rights and licenses. Describe the transfer of rights procedures relevant to your project. Describe confidentiality issues if applicable in your project. License your data! Tips for best practices - Agreements on rights of use should be made as early as possible in the project life cycle.
- Have you gained consent for data preservation and sharing?
- Follow the funder's or publisher's policies.
- It is recommended to make all of the research data, code and software created within a research project available for reuse, e.g., under a Creative Commons (
https://creativecommons.org/choose/), GNU (https://www.gnu.org/licenses/gpl-3.0.en.html) or MIT license (https://opensource.org/licenses/MIT), or under another relevant license. | Describe what has been agreed about data usage rights. Consider if there are rights belonging to a third party. Anticipate what licenses will be used when data is opened.
Guidance about data ownership and licenses Data ownership rights depend on research funding. Ensure that the necessary agreements have been made in the beginning of the project (data ownership, authorship and results).
- Use a license when opening your data for reuse (e.g. research data, code, software).
- The UH recommends license open as possible
the CC0 license for research data, with which you waive your rights to the work. You retain your moral rights, and Good scientific practice still stipulates that the author be mentioned. Alternative licenses: - UH Library Open Access Creative Commons license guide
- GNU or MIT licenses and other software licenses.
Additional information
Research ethics (Flamma)
Legal aspects & research integrity UH University of Helsinki research data policy Responsible conduct of research (RCR) | Kuvaa, mitä aineiston käytöstä on sovittu sekä kohdistuuko aineistoon kolmansien osapuolten oikeuksia. Ennakoi, millä lisenssillä aineistoa aiotaan julkaista.
Ohjeita datan omistusoikeuksista ja lisensseistä Aineiston omistajuus riippuu rahoittajasta. Huolehdi että kaikki tarvittavat sopimukset on tehty jo heti projektin alussa (aineiston omistajuus, kirjoittajuus ja tulokset). - Muista, että useimmat rahoittajat (Suomen Akatemia, EU) edellyttävät aineiston oikeuksien siirtämistä yliopistolle.
- Ohjeita sopimusten tekemiseen (Flamma)
- Kun avaat aineistoa, käytä lisenssiä.
Lisäohjeita
Flamman tutkimusetiikka-sivu
Flamman tutkijan tietosuojaohje Helsingin yliopiston tutkimusdatapolitiikka Hyvä tieteellinen käytäntö (HTK) | Kehitysehdotus: - Pitäisikö lisenssit ja muut olla avaamisen ja arkistoinnin yhteydessä (nyt kohta 5.)?
- tutkimusdatapolitiikka-linkki muutetaan ohjaamaan Heldan (perustelu: Heldassa pysyvä tunniste)
suomi päivitetty verkkosivulle 21.3.2023 englanti päivitetty verkkosivulle 21.3.2023
|
| | 3. Documentation and metadata | 3. Dokumentointi ja metatiedot |
MUUTOSLOKI/KOMMENTTISARAKE |
3. How will you document your data in order to make the data findable, accessible, interoperable and re-usable for you and others? What kind of metadata standards, README files or other documentation will you use to help others to understand and use your data? 3. Miten dokumentoit aineistosi, jotta se on löydettävissä, saavutettavissa, yhteentoimiva ja uudelleen käytettävissä sekä itseäsi että muita varten? Mitä metatietostandardeja, README-tiedostoja ja muuta dokumentaatiota käytät, jotta muut voivat ymmärtää ja käyttää aineistoasi? | Data documentation enables data sets and files to be discovered, used and properly cited by other users (human or computer). Without sufficient documentation the data cannot be reused. Documentation includes essential information regarding the data, for example a) core metadata (for discovery and identification) where, when, why and how the data were collected as well as b) descriptive information how the data is interpreted correctly using metadata standards, vocabularies and e.g. readme-files. Tips for best practices - Describe all the types of documentation (README files, metadata standards, vocabularies etc.) you will provide to help secondary users to understand and reuse your data. Repositories often require the use of a specific metadata standard. Check whether a discipline-specific metadata schema or standard exists that can be adopted.
- Consider how the data will be organised during the project. Describe, for example, your file-naming conventions, version control and folder structure.
- Use research instruments, which create standardised metadata formats automatically.
- Identify the types of information that should be captured to enable other researchers to discover, access, interpret, use and cite your data. See for example Qvain requirements (https://www.fairdata.fi/en/user-guides/qvain-user-guide/#QvainDataset)
| Metadata is the documentation and description of research data. Metadata standards are uniformal models of data documentation. The documentation describes who collected the data and how it was collected. When, where, and by which means was it collected? How has it been processed? Metadata can include information about test arrangements, methods of analysis or research environments. “The documentation and metadata associated with research data should follow discipline-specific standards to enable the reuse and further enrichment of the data in future research projects. Metadata associated with research data must be published whenever possible, either in national or international metadata services.” (quoted from Research Data Policy) The documentation during the research project includes, e.g. explanations of variables and codes (data dictionary, codebooks) and readme-files. Documentation also includes file naming conventions, version control and directory structure. After the project, the research data is published, archived, or listed in a data repository or in a metadata catalogue. For this, the data needs to be described as a whole or, e.g., by data types.
Tips for best practices - Please note that the documentation – file names, variables, and other metadata – might include personal or sensitive data.
- Get acquainted with the University of Helsinki’s documentation guide.
- Plan documentation prior to data collection. Begin documentation and metadata creation at the start of the project and continue with it until the end of the project.
- Data repositories often require the use of a specific metadata standard. Check if there is a discipline-specific metadata standard or metadata model.
- If there is no suitable metadata standard, you can create a readme-type metadata file.
- Use generally accepted vocabularies to describe the data. You can find suitable and accepted terms from Finto or EMBL-EBI Ontology lookup service.
- For documenting codes and algorithms, use the university’s GitLab-based version control service.
- Open the metadata in a way others can access it, e.g. in Etsin. You can check the requirements for metadata in Etsin from Qvain-tool’s instructions.
Additional information: | Metadata on dokumentaatiota, jolla kuvataan tutkimusdataa tai -aineistoa. Metadatastandardilla tarkoitetaan yhtenäistä mallia tutkimusaineiston kuvailuun. Dokumentoinnissa kuvataan, kuka datan tai aineiston on kerännyt, miten ja missä, milloin se on kerätty ja miten käsitelty. Nämä metatiedot voivat sisältää tietoa myös koeasetelmasta, analyysimenetelmästä ja tutkimusympäristöstä. "Tutkimusaineistojen metadata tulee julkaista aina kun se on mahdollista, joko kansallisissa tai kansainvälisissä metadatapalveluissa. Tutkimusaineistojen dokumentoinnin ja metatietojen tulee noudattaa tieteenalan standardeja, jotta aineistoa voidaan hyödyntää ja rikastaa myöhemmissä tutkimushankkeissa." (Tutkimusdatapolitiikka) Projektin aikana dokumentointia ovat mm. muuttujien ja koodien selitteet (tietohakemistot, koodikirjat) ja readme-tiedostot. Lisäksi dokumentaatioon liittyvät tiedostojen nimeämiskäytännöt, versionhallinta ja kansiorakenne. Projektin jälkeen tutkimusaineistot kuvataan kokonaisuutena tai esim. datatyypeittäin data-arkistoihin tai metadataluetteloihin datan julkaisemisen tai säilytyksen yhteydessä.
Hyviä käytäntöjä - Muista aineiston kuvailun yhteydessä, että myös tiedostonimet, tiedostokansioiden nimet sekä muuttujat ja metadata saattavat sisältää henkilötietoja tai arkaluonteista tietoa.
- Tutustu Helsingin yliopiston dokumentointioppaaseen.
- Suunnittele datan dokumentointi ennen datan keräämistä. Aloita dokumentointi ja metadatan luominen heti projektin alussa ja jatka tutkimuksen loppuun asti.
- Data-arkistot edellyttävät usein tietyn metatietostandardin käyttämistä. Tarkista myös, onko tieteenala- tai yhteisökohtaista metatietomallia tai -standardia saatavilla.
- Jos sopivaa metatietostandardia ei ole olemassa, voit laatia "readme"-tyylisen metatietodokumentin.
- Käytä yleisesti hyväksyttyjä sanastoja aineiston kuvailuun. Sopivia sanastoja löydät Fintosta tai EMBL-EBI Ontology -hakupalvelusta.
- Koodien ja algoritmien dokumentointiin hyödynnä yliopiston GitLab-versionhallintapalvelua.
- Avaa metadata muiden tutkijoiden löydettäväksi esim. Etsin-palveluun. Vaatimukset metadatalle voi tarkistaa Qvain-työkalun ohjeista.
Lisäohjeita: | Aleksi, Iina Suomenkielinen ja englanninkielinen yhdenmukaistettava, eroavat toisistaan suuresti Linkit koostetusti Lisäohjeita-kohtaan?
VALMIS / AP, IH
suomi päivitetty verkkosivulle 13.3.2023 englanti päivitetty verkkosivulle 16.3.2023
|
| | 4. Storage and backup during the research project | 4. Tallentaminen ja varmuuskopiointi tutkimushankkeen aikana | MUUTOSLOKI/KOMMENTTISARAKE |
4.1 Where will your data be stored, and how will the data be backed up? 4.1 Minne aineistosi tallennetaan, ja miten se varmuuskopioidaan | Describe where you will store and back up your data during your research project. Consider who will be responsible for backup and recovery. If there are several researchers involved, create a plan with your collaborators and ensure safe transfer between participants. Show that you are aware of the storing solutions provided by your organisation. Do not merely refer to IT services. In the end, you are responsible for your data, not the IT department or the organisation. Explain the methods for preserving and sharing your data after your research project has ended in more detail in Section 5. Tips for best practices - The use of a safe and secure storage provided and maintained by your organisation’s IT support or other reliable IT provider such as CSC is preferable.
- Do NOT USE external hard drives as the main storing option.
- Follow your institution's data security requirements
| Consider the following questions: - Where will your data be stored and backed up (linkki korjattu) during the project?
- Who is responsible for backups?
- Make a plan with your partners and ensure secure data transfer.
Opening, publishing, and archiving data after the project will be described in section five. Tips for best practices Make sure your project has sufficient storage space. If not, please contact Helpdesk at tel. +358 (0)2 941 55555 or helpdesk@helsinki.fi. - If you work with sensitive data:
- Be sure that your storage is safe enough for the data, e.g. a dedicated UH or CSC secure storage space (Umpio, storage server, ePouta...).
- Encryption: If needed, particularly mobile devices, portable and external storage devices should be encrypted for use, e.g., Cryptomator. (muutettu linkki englanninkieliseen ohjeeseen)
- Please, be in contact with datasupport@helsinki.fi if you are unsure about data protection.
Additional information Using & storing (UH Research data management) UH Research data management services | Vastaa seuraaviin kysymyksiin: - Minne aineisto tallennetaan ja varmuuskopioidaan (linkki korjattu) tutkimushankkeen aikana?
- Kuka on vastuussa varmuuskopioinnista?
- Tee suunnitelma yhteistyökumppaniesi kanssa ja varmista tietojen turvallinen siirto ja jakaminen osallisten välillä.
Aineiston avaaminen, julkaiseminen ja arkistointi tutkimushankkeen päätyttyä kuvataan kohdassa 5. Hyviä käytäntöjä - Käytä Helsingin yliopiston tietotekniikkakeskuksen tallennus- ja jakamispalveluita: tallennuspalvelutaulukko.
- Office 365 -pilvipalvelut ovat käteviä jakamiseen ja yhteistyöhön, jos aineisto ei ole arkaluontoista tai luottamuksellista.
- Älä käytä koneen sisäistä kovalevyä tai USB-levyjä pääasiallisena tallennusvälineenä.
Varmista että projektillasi on riittävästi tallennuskapasiteettia. Lisää levytilaa saat ottamalla yhteyttä Helpdeskiin puh. 02 941 55555 tai helpdesk@helsinki.fi - Jos työskentelet arkaluontoisen tai luottamuksellisen aineiston kanssa:
- Varmista, että tallennusratkaisusi on tarpeeksi turvallinen aineistollesi, esim. erillinen HY:n tai CSC:n turvatallennuspalvelu (Umpio, tallennuspalvelin, ePouta...).
- Salaus tarpeen mukaan. Erityisesti mobiililaitteet, kannettavat ja ulkoiset tallennuslaitteet on pyrittävä salaamaan. Esim. Cryptomator.
- Ota yhteyttä datasupport@helsinki.fi, jos olet epävarma aineiston suojaamisesta.
Lisäohjeita Using & Storing (HY:n aineistonhallinnan opas) Tutkimusdatapalvelut Helsingin yliopistolla | Janne ja Sanna Korjattu ja lisätty muutamia linkkejä (tekstissä korjattujen linkkien kohdalla vielä punaisella ilmoitus huomiota herättämässä, eli punaiset tekstit voi poistaa lopullisesta versiosta). Korjattu versio 15.3.2023 Suomi ja englanti päivitetty verkkosivulle 16.3.2023
|
4.2 Who will be responsible for controlling access to your data, and how will secured access be controlled? 4.2 Kuka valvoo pääsyä aineistoon, ja miten suojattua pääsyä aineistoon valvotaan? | It is essential to consider data security issues, especially if your data include sensitive data, personal data, politically sensitive information or trade secrets. Describe who has access to your data, what they are authorised to do with the data, or how you will ensure the safe transfer of data to your collaborators. Tips for best practices - Access controls should always be in line with the level of confidentiality involved.
| Answer the following questions:
- Who is responsible for controlling access to the data?
- How will the access control be carried out? Is there an IT solution (e.g., password protection, usage logs, or some physical solution (file cabinet) in use?
- Who in the research group has access to which data?
- Why has each access right (editing, watching, deleting) been awarded?
- Tell how information security and the risks from sensitive data have been taken into account. Will sensitive data be stored in an encrypted form? More tips are below.
Tips for best practices - If you use a personal or shared network (linkki muokattu) drive, you can easily control access rights.
- Access control (tähän voisi lisätä linkin lisätietoihin?) of sensitive data should be well considered. Data handling and transferring needs to be in line with permissions.
- Access control: There must be a list of users and all rights granted, and a procedure for withdrawing rights.
- Monitoring: How will data usage be monitored during the study: can the technical equipment log who used, when, and what data? Ask IT services what kind of automatic usage and change log is provided.
- Security of the premises: Check the locking options of workspaces, safe lockers and cabinets, and camera and access surveillance.
Additional information National Cyber Security Centre: Ohje lokitietojen tallentamiseen ja hyödyntämiseen (FIN) UH Helpdesk at tel. +358 (0)2 941 55555 or helpdesk@helsinki.fi | Vastaa seuraaviin kysymyksiin: - Kuka (nimeä henkilö) valvoo pääsynhallintaa aineistoihin?
- Miten valvonta toteutuu käytännössä? Onko käytössä IT-ratkaisu (esim. salasanan takana oleva käyttöoikeus, muutosloki) tai fyysinen ratkaisu (esim. arkistokaappi/ kassakaappi)?
- Kenellä tutkimusryhmässä on oikeus mihinkin aineistoon?
- Miksi kukin käyttöoikeus (muokkaus, katselu, poisto) on myönnetty?
- Kerro, kuinka arkaluontoisen aineiston tietoturva ja riskit on otettu huomioon. Säilytetäänkö aineisto esimerkiksi kryptattuna? Lisävinkkejä alla.
Hyviä käytäntöjä - Kun käytät henkilökohtaista tai jaettua verkkolevytilaa (linkki korjattu), pystyt helposti hallitsemaan käyttöoikeuksia.
- Arkaluontoisen aineiston pääsynhallintaan pitää kiinnittää erityistä huomiota. Aineiston käytön ja siirron pitää olla suostumuksen ehtojen mukaista, mikäli aineisto on saatu käyttöön suostumuksen perusteella.
- Pääsynhallinta: Käytössä pitää olla lista myönnetyistä oikeuksista ja käyttäjistä sekä tapa, jolla käyttöoikeuksia aineistoon voi myös perua ja poistaa.
- Valvonta: Miten aineiston käyttöä seurataan tutkimuksen aikana? Pystyvätkö käytetyt tekniset välineet pitämää kirjaa siitä kuka käytti, mitä aineistoa ja milloin? Kysy organisaatiosi IT-tuesta, onko tarjolla käyttö- ja muutoslokitusta.
- Tilaturvallisuus: Tarkista työtilojen lukitukset, turvalliset säilytyskalusteet, kameravalvonta ja kulkuoikeuksien valvonta.
Lisäohjeita Kyberturvallisuuskeskus: Ohje lokitietojen tallentamiseen ja hyödyntämiseen HY Helpdesk puh. 02 941 55555 tai helpdesk@helsinki.fi | |
| | 5. Opening, publishing and archiving the data after the research project | 5. Aineiston avaaminen, julkaiseminen ja arkistointi tutkimushankkeen päätyttyä | MUUTOSLOKI/KOMMENTTISARAKE |
5.1 What part of the data can be made openly available or published? Where and when will the data, or its metadata, be made available? 5.1 Mikä osa aineistosta voidaan asettaa avoimesti saataville tai julkaista? Missä ja milloin aineisto tai siihen liittyvät metatiedot asetetaan saataville? | Describe how you will make data available and findable for reuse. If your data or parts of the data cannot be opened, explain why you publish only metadata. In the case of sensitive data, which cannot be opened, describe the opening of its metadata. Describe the secured preservation procedure of sensitive data in Section 5.2. The openness of research data promotes its reuse. Tips for best practices - You can publish a description (i.e., the metadata) of your data without making the data itself openly available, which enables you to restrict access to the data.
- Publish your data in a data repository or a data journal.
- Check re3data.org (https://www.re3data.org/) to find a repository for your data.
- Prefer repositories or publishers, which provide persistent identifiers (PID) to enable access and citation to the data via a persistent link (e.g. DOI, URN).
- Remember to check the funder, institutional, disciplinary or national recommendations for data repositories.
- It is recommended to make all of the research data, code and software created within a research project available for reuse, for example, under a Creative Commons (https://creativecommons.org/choose/), GNU (https://www.gnu.org/licenses/gpl-3.0.en.html) or MIT license (https://opensource.org/licenses/MIT), or under another relevant license.
AVOID OVERLAPS WITH THE PUBLICATION PLAN! The research article publication does not equal data publication. The data journal is a publication forum specialised in publishing research data. | Please answer the following questions, you can refer to the table in Section 1,if you used one): - What part of the data will be opened/published?
- Where will the data be opened? Name the repositories - if possible.
- When the data can be opened/published ?
- Will some part of the data be destroyed?
- Do some parts of the data require anonymisation or pseudonymisation before opening?
If your data cannot be opened: - why data can not be opened?
- where the project metadata will be opened?
- Even though data including personal data cannot be opened, its metadata, which do not contain sensitive information, should be opened.
Tips for opening data containing personal data information - Opening and sharing personal data are dictated for example by:
- how the research participants are informed about opening data (if the data has been gathered directly from research participants) ?
when the data are collected, - If the research participants are directly identifiable, the explicit consent of the research participants
subject is required for the opening of the data. material, from. - is further use of the data restricted by administrative authrorisations?
whether the research participants have given their consent?what form and for what purposes the data is to be opened or shared?- When opening, you must ensure that the data is properly protected, pseudonymized or anonymized
the information. In some cases, the material may be shared for the originally intended purpose.- If you are planning on sharing personal data, please contact the University research lawyers (researchlawyers@helsinki.fi), if necessary.
Tips for best practices - Choose suitable repositories for sharing and opening your data already at the beginning of the project. Check that your data fulfills the repository requirements.
“As a rule, research data produced under the auspices of the University of Helsinki and related to published research results are open and available for shared use. The discoverability and citability of research data must be ensured.” (University of Helsinki research data policy)Where to open data?Check the recommendations of the publishers, learned societies, and funders of your own field.Where have you or your colleagues in the same field published data?- You can search for suitable repositories from: re3data.org, fairsharing.org
- Prefer discipline spesific data repositories. If you can not find any, you can use general repositories such as IDA, Zenodo, Dryad, Figshare.
- If you cannot open the data, open your metadata
about your project data, e.g., in Zenodo or in the national Etsin service. Choose repositories using persistent identifiers (DOI, URN).Remember to give your data a license (see 2.2)
Additional information UH Research data policy UH principles of open publishing Tutkijan muistilista tutkimusdatan julkaisemiseen (Responsible Research) | "Helsingin yliopiston piirissä tuotettu, julkaistuihin tutkimustuloksiin liitetty tutkimusdata on lähtökohtaisesti yhteiskäyttöistä ja avointa. Tutkimusaineistojen avaamisessa noudatetaan niin avointa kuin mahdollista, niin suljettua kuin välttämätöntä -periaatetta.” ()
Vastaa seuraaviin kysymyksiin, voit viitata esimerkiksi taulukkoon kohdassa 1 (jos sellainen on tehty): - Mikä osa aineistosta avataan / julkaistaan?
- Missä aineiston osat julkaistaan? Nimeä mahdolliset data-arkistot.
- Milloin aineisto voidaan avata/julkaista?
Poistetaanko / Tuhotaanko jokin osa aineistosta ?- Onko aineistoa muokattava tai käsiteltävä ennen avaamista/julkaisua (
stilisointi, anonymisointi, pseudonymisointi)?
Jos aineistoasi ei voida avata kokonaan tai osittain: - miksi aineistoa ei voida avata?
- missä aineiston metatiedot julkaistaan?
- Vaikka henkilötietoja sisältävää aineistoa ei voisi avata, sen keskeiset (ei arkaluonteisia yksityiskohtia sisältävät) kuvailutiedot pitäisi avata.
Vinkkejä henkilötietoja sisältävän aineiston avaamiseksi - Henkilötietoja sisältävän aineiston avaamisen
ja julkaisun mahdollisuuksiin vaikuttavat mm.:- mitä tutkittaville on informoitu tietoja kerättäessä (jos tiedot on kerätty tutkittavilta suoraan)?
- Aineiston avaamiseen, josta tutkittavat ovat suoraan tunnistettavissa, on
lähtökohtaisesti pyydettävä tutkittavalta suostumus. onko tutkittavalta kenties saatu avaamiseen nimenomainen suostumus?- rajoittavatko viranomaisluvat aineiston jatkokäyttöä?
miten tunnistettavassa muodossa tiedot aiotaan avata tai julkaista.
Jo suunnitteluvaiheessa on hyvä miettiä mihin käyttöön aikoo aineiston mahdollisesti avattavan. Tällöin pystyt ottamaan avaamisen huomioon tutkittavia informoitaessa tai mahdollisia lupia haettaessa ja avaaminen sujuu helpommin. - Avaamisessa/
julkaisussa tulee huolehtia edelleen tietojen asianmukaisesta suojaamisesta ja mahdollisuuksien mukaan minimoida sekä pseudonymisoida tai anonymisoida tiedot. Mikäli aineistoa ei pysty täysin anonymisoimaan on mietittävä muita suojakeinoja. Kun aineisto avataan/julkaistaan, on edelleen huolehdittava että tietoja ei käsitellä epäasianmukaisiin tarkoituksiin vaan yhdenmukaisiin siihen nähden mitä tutkittaville on informoitu ja/tai mihin käyttöön aineistot on kerätty tai saatu. On siis edelleen huolehdittava siitä, että aineistot eivät päädy epäasianmukaiseen käyttöön ja tarvittaessa sitouttaa tietojen vastaanottaja käsittelemään niitä asianmukaisesti (esimerkiksi arvioimalla tietopyynnöt tapauskohtaisesti ja sopimuksin). - Jos suunnittelet henkilötietoja sisältävän aineiston jakamista, ota tarvittaessa yhteyttä yliopiston tutkimuspalvelujen juristeihin (tutkimuksenjuristit@helsinki.fi)
Myös tässä vaiheessa on kiinnitettävä huomiota siihen, päätyvätkö tiedot EU:n ulkopuolelle
Hyviä käytäntöjä - Suunnittele aineistosi avaaminen
sopivat palvelutja julkaisua varten jo tutkimuksen alkuvaiheessa. Varmista, että ainestosi täyttää valitsemasi data-arkiston vaatimukset.Mitä vaatimuksia palveluntarjoajan täytettäväksi on jo tiedossa? Esim. mitä tukea palveluntarjoajat antavat, minkälaiset pääsynhallintamenettellyt on, voiko asettaa vaatimuksia tai rajoituksia aineiston käytölle? Kun valitset palvelun jo tässä vaiheessa, pystyt paremmin huolehtimaan myös siitä, että Missä aineisto kannattaa avata?Suosi avattavalle aineistolle data-arkistoa, joka turvaa aineiston löydettävyyden ja viitattavuuden Tarkista oman alasi kustantajien, tieteellisten seurojen ja rahoittajien suositukset.Missä sinä tai alasi kollegat ovat aiemmin julkaisseet aineistoja?- Voit etsiä aineistollesi tietylle aineistotyypille sopivaa julkaisupaikka datarepositoriota re3data.org palvelusta; fairsharing.org!
Yleisiä julkaisupaikkoja Suosi tieteenalakohtaisia datarepositorioita. Jos sellaista ei löydy, voit käyttää kaikille tieteenaloille sopiva julkaisualustoja, kuten IDA, Zenodo, Dryad, Figshare- Pyri suosimaan tieteenalakohtaisia datarepositorioita, jotka on serfifioitu CORE TRUST SEAL -merkillä
- Kiinnitä huomiota myös palvelun tietoturvan tasoon, jos kyse on suojattavasta aineistosta.
- Jos et voi avata aineistoa, julkaise kuitenkin
tutkimusaineiston metatiedot, esim. Zenodossa tai kansallisessa Etsimessä. Valitse pysyviä tunnisteita (DOI, URN) käyttävä palvelu. Muista antaa aineistollesi käyttölisenssi (kts. 2.2)
Lisäohjeita Helsingin yliopiston tutkimusdatapolitiikka HY: avoimen julkaisemisen periaatteet Tutkijan muistilista tutkimusdatan julkaisemiseen (Vastuullinen tiede) | Soile ja Mikko M - 27.2.2023 tehdyt muutokset, 10.3.2023 tehdyt muutokset
- mottomme: lyhempi parempi
- Päällekkäisyyttä kansallisen ohjeen ja muiden ohjeen kohtien kanssa poistettu, samoin toistoa.
- (Lotalta tarkistus?) Tarvitaanko? Juridisia kohtia vähän, ja ne käydään tarkemmin läpi kohdassa 2. Yleissääntönä: Jos suunnittelet henkilötietoja sisältävän aineiston jakamista, ota yhteyttä yliopiston tutkimuspalvelujen juristeihin (tutkimuksenjuristit@helsinki.fi)
- Mikko M tarkistaa linkit, kun tekee muutokset kohtaan 5.2
- VALMIS MM JA SM, Lotalta ja Aura pos. palaute 10.3.2023
Näitä tekstejä ei ole englanninkielisessä ohjeessa ja siksi niitä ei ole suomenkielisellä verkkosivullakaan: - Pyri suosimaan tieteenalakohtaisia datarepositorioita, jotka on serfifioitu CORE TRUST SEAL -merkillä
- Kiinnitä huomiota myös palvelun tietoturvan tasoon, jos kyse on suojattavasta aineistosta. -TK
suomi ja englanti päivitetty verkkosivulle 12.4.2023
|
5.2 Where will data with long-term value be archived, and for how long? 5.2 Missä pitkällä aikavälillä arvokas aineisto säilytetään ja kuinka pitkään?
| Briefly describe what part of your data you will preserve, where it is preserved, and for how long. Long term preservation means that data is preserved for as long as necessary, for several decades or even centuries. You can categorise your data sets according to the anticipated preservation period: A) Data to be destroyed upon the ending of the project B) Data to be archived for a verification period, which varies across disciplines, e.g., 5–15 years C) Data to be archived for potential re-use, e.g., for 25 years D) Data with long-term value to be archived by a curated facility for future generations for tens or hundreds of years You will need to decide which of your research data to preserve and dispose of. Data that is unique or difficult to replicate might have long-term value and be fit for preservation. Special long term data repositories should be used for digital preservation. Tips for best practices - Decisions about preserving data should begin during the data management planning stage, and should take into account e.g. institutional guidance and requirements.
- Use data repositories with a commitment to long-term curation, e.g. Fairdata Digital Preservation Service is dedicated for research datasets that have significant value to the organization or on a national level currently and especially also in the future. Contact your home organisation for further information.
| Discuss where data with long-term value is archived and for how long. - What part of the data is archived?
- Where will it be archived?
- For how long will the data be preserved?
- Are there
some costs related to archiving? Who takes care of them? Will some part of the data be destroyed?
An archiving plan is part of research quality and transparency. Tips for best practices - When data is created, it is important to consider how long it will be preserved.
- Check publisher-related → publisher's
preservation time requirements for data preservation, if you plan to publish in a journal that demands opening your data. - Check discipline-specific and funder-related → funder's
preservation time requirements requirements for data preservation . - Personal data may also be archived.
The data subjects must be informed of the archiving and the basis on which the archiving is based. The intended life cycle of the data, including the possible further use of the data after the end of the research project, must be openly communicated to the research subjects. This also applies to pseudonymised and anonymised data.- The identifiable data
identification of individuals should, as far as possible, be removed unless there are proper grounds for archiving them. - The appropriate protection of personal data, ie who has access to the data and why, must continue to be taken into account when archiving the material.
- The UH offers guidance on safe data storage and preservation solutions
preservation methods. If you are preserving sensitive personal information, contact datasupport@helsinki.fi.
- Biological samples can be stored in biobanks (if the study subjects have granted a permission to do so)
- Fairdata-PAS is a preservation service for nationally valuable data for dozens or hundreds of years. More information about UH service queue for Fairdata-PAS here.
- Even if the project does not generate data requiring long-term preservation, the data should be kept for the duration of the verification of the results, which varies from discipline to discipline (generally at least 5 years).
Links to general guides and additional information Five steps in deciding what data to keep (DCC, UK) UH Archiving plan (Flamma)
UH Research data services Data disposal (Data management guidelines, FSD) | Kerro mihin aineisto, jolla on pitkäaikaista arvoa, arkistoidaan ja kuinka pitkäksi ajaksi. - Mikä osa aineistosta arkistoidaan?
- Missä arkistossa aineistoa säilytetään?
- Kuinka pitkään aineisto säilyy ko. arkistossa?
- Onko arkistoinnissa kuluja ja kuka niistä vastaa?
Arkistointisuunnitelma on osa tutkimuksen laadun ja läpinäkyvyyden varmistusta. Hyviä käytäntöjä - Tutkimuksessa syntyvän aineiston säilytysaika on tärkeä miettiä ja sopia sitä mukaan kuin aineistoa syntyy.
Etenkin henkilötietoja sisältävän aineiston osalta säilytysaika tulisi miettiä jo etukäteen ja informoida tutkittavia (tietosuojailmoituksessa)
- Tarkista kustantajan vaatimukset julkaisuun liittyvän aineiston säilyttämisajasta.
- Muista tarkistaa rahoittaja- ja alakohtaiset suositukset.
- Myös henkilötietoja sisältävä aineisto voidaan arkistoida.
Henkilötietojen arkistointi on huomioitava jo tutkittavien informoinnissa ja samalla on määritettävä arkistointiperuste (mihin tarkoitukseen aineisto arkistoidaan). Tutkittaville on avoimesti kerrottava aineiston suunniteltu elinkaari, ml. tutkimusaineiston mahdollinen jatkokäyttö tutkimuksen päättymisen jälkeen. Tämä koskee myös pseudonymisoitua ja anonymisoitua tutkimusaineistoa.- Henkilöiden tunnistetiedot tulisi mahdollisuuksien mukaan poistaa, ellei niiden arkistoinnille ole asianmukaista perustetta.
, johtuen aineiston luonteesta. Arkistoinnista on myös informoitava tutkittavia, sekä siitä mihin aineiston arkistointi perustuu (mihin tarkoitukseen aineistot arkistoidaan). Aineiston arkistoinnissa on edelleen huomioitava henkilötietojen asianmukainen suojaaminen eli kenellä aineistoon on pääsy ja miksi sekä arkiston tietoturvan taso. - Helsingin yliopistolla on tarjolla neuvontaa turvallisten tallennusratkaisujen valintaan. J
os olet säilyttämässä pitkään arkaluonteista henkilötietoa, Ota yhteyttä: datasupport@helsinki.fi
- Ihmisnäytteisiin liittyvä aineisto voidaan arkistoida biopankkiin (jos tähän saadaan tutkittavilta biopankkisuostumus, tutustu biopankin ohjeistuksiin).
Oletko arvioinut, syntyykö projektissasi arvokkaita aineistoja?- Kansallisesti arvokkaille aineistoille on tarjolla Fairdata-PAS -palvelu aineistojen säilyttämiseksi kymmenistä satoihin vuosiin. Lisätietoja HY:n pitkäaikaissäilytyspalvelusta täällä.
- Vaikka projektissa ei synny pitkäaikaista säilyttämistä vaativia aineistoja, data tulisi säilyttää tulosten verifioimisen ajaksi, mikä vaihtelee tieteenaloittain (yleisesti vähintään 5 vuotta)
Lisäohjeita Five steps to decide what data to keep (DCC, UK) HY:n asiakirjojen säilytysohje (Flamma) Aineiston hävittäminen (Aineistonhallinnan käsikirja, Tietoarkisto) | Mikko M Soilen ehdottamat lisäykset 28.2.2023 ja muutokset
suomi ja englanti päivitetty verkkosivulle 12.4.2023
|
| | 6. Data management responsibilities and resources | 6. Aineistonhallintaa koskevat vastuut ja resurssit | MUUTOSLOKI/KOMMENTTISARAKE |
6.1 Who (for example role, position, and institution) will be responsible for data management? 6.1 Kuka (esim. tehtävä ja laitos) vastaa aineistonhallinnasta? | Summarise here all the roles and responsibilities described in the previous answers. Also, consider who will be responsible for the data resulting from your project after your project has ended. Tips for best practices - Outline the roles and responsibilities for data management/stewardship activities, for example, data capture, metadata production, data quality, storage and backup, data archiving, and data sharing. Name the responsible individual(s) where possible.
- For collaborative projects, explain the co-ordination of data management responsibilities across partners.
- Indicate who is responsible for implementing the DMP and for ensuring that it is reviewed and, if necessary, revised.
- Consider scheduling regular updates of the DMP.
| Summarise and describe the roles and responsibilities here. Answer the following questions: - Are data management responsibilities allocated to one person, or is the whole research group involved?
How do you share tasks between different parties if you are working in a research consortium? - Who is responsible for data protection?
- If the data contains personal data
information, list the persons and organizations allowed to handle personal information and their different roles - Who is responsible for data protection and access to data?
Tips for best practices - When you are managing the data follow shared practices (documentation, metadata, storing and sharing)
- Make sure that everyone is trained in the necessary practices and that everyone follows the same practices.
- Note who is responsible for updating the DMP document when you make decisions or changes in your practice.
- List the persons or organizations responsible for different data management tasks.
- You need to name the group members / colleagues / persons allowed to handle personal data
information and their different roles (controller, joint controller, processor) - Which one of you or the organizations involved will be responsible for the data after the project?
| Kerro, kuka on vastuussa aiemmissa kohdissa kerrotuista suunnitelmaan liittyvistä tehtävistä ja mitä rooleja siihen liittyy?
- Onko aineistonhallinta tietyn henkilön vai koko tutkimusryhmän vastuulla?
- Miten tehtävät jakautuvat konsortion tai yhteistyöhankkeen osallistujien kesken?
- Kuka vastaa aineiston tietosuojaan liittyvistä asioista?
- Jos aineisto sisältää henkilötietoja, kerro mitkä tahot käsittelevät henkilötietoja ja missä roolissa (rekisterinpitäjä, yhteisrekisterinpitäjä, käsittelijä)?
- Kuka vastaa aineiston tietoturvasta ja käyttöoikeuksien jakamisesta?
Hyviä käytäntöjä - noudattakaa yhteisiä käytäntöjä aineiston käsittelyssä (esim. datan dokumentointi, metadata, tallennus ja jakaminen).
- huolehtikaa siitä, että kaikki projektiin osallistuvat henkilöt ovat saaneet riittävän perehdytyksen tai koulutuksen datanhallintaan liittyviin tehtäviin.
- sopikaa, kuka on vastuussa suunnitelman täytäntöönpanosta ja päivittämisestä.
- nimetkää henkilöt tai organisaatiot eri tehtäviin, jos mahdollista.
- Henkilötietojen käsittelyyn liittyvät roolit ja vastuut on määriteltävä tutkimusprojektiin osallistuvien yhteistyökumppanien kesken.
- sopikaa myös, kuka vastaa aineistosta projektin päätyttyä.
| Maija, Tuija VALMIS MP, TK
Kehitysehdotus (Lotta, Soile): pitäisikö resurssi-asioita käsitellä omissa kohdissaan, esim. 4. kohdassa tallennusratkaisujen kustannuksia jne.?
suomi päivitetty verkkosivulle 13.3.2023 englanti päivitetty verkkosivulle 14.3.2023 |
6.2 What resources will be required for your data management procedures to ensure that the data can be opened and preserved according to FAIR principles (Findable, Accessible, Interoperable, Re-usable)? 6.2 Mitä resursseja aineistonhallinta edellyttää, jotta voit varmistaa, että aineisto voidaan avata ja säilyttää FAIR-periaatteiden (ks. edellä) mukaan? | Estimate the resources, such as time and financial costs, needed to manage, share and preserve the data. These may include storage costs, hardware, staff time, the costs of preparing data for deposit and repository charges. Tips for best practices - Consider, if there will be additional costs from computational facilities or resources that need to be accessed.
- Account for resources, time and money, needed to prepare the data for sharing it and preservation (data curation).
- Remember to specify your data management costs in the budget, according to funder requirements.
| Describe what resources (time and costs) are needed for data management? Thorough planning at the start and during the project means less work at the end when the data is prepared for opening and preservation. Tips for best practices - Estimate whether expert help or an assistant is needed for data management, data preservation, and data sharing tasks.
- Give an estimate of how much time is needed for data documentation and cleaning to prepare the data (not results) to be opened: 1–2 h weekly, one day per month, 1–2 weeks before publishing, or some other time estimate.
- Data documentation and cleaning means, for example, producing metadata (section 3.1), anonymising sensitive data, arranging data, transferring data etc.
- It is recommended to keep documentation up to date throughout the project life cycle.
Allocate time and funds also if you need to anonymize, protect or destruct sensitive data. - Specify your data management costs in the budget according to funder requirements.
Have you prepared for protecting, anonymizing or destroying sensitive data and have you allocated enough resources for this.
| Mitä resursseja (aika ja kustannukset) aineistonhallintaan tarvitaan? Mitä paremmin tutkimusaineiston hallinta on suunniteltu ja toteutettu jo tutkimushankkeen alussa ja sen aikana, sitä vähemmän työtä tarvitaan aineiston avaamisessa ja arkistoinnissa. Huolellinen aineistonhallinan suunnittelu projektin alussa ja sen aikana vähentää työtä projektin lopussa, kun aineistoa valmistellaan avaamista ja arkistointia varten. Hyviä käytäntöjä - Arvioi, edellyttääkö aineiston hallinnointi, säilyttäminen ja jakaminen asiantuntija-apua tai palkattua työntekijää.
- Anna arvio ajasta, joka menee data-aineiston (ei tulosten) siistimiseen ja dokumentointiin julkaisukuntoon. Esimerkiksi: siihen käytetään viikoittain aikaa 1-2 h, kuukaudessa päivä, 1-2 viikkoa ennen arkistointia tms.
- Aineiston siistiminen ja dokumentointi tarkoittaa muun muassa metatiedon tuottamista (kohta 3.1), henkilötietoa sisältävän aineiston anonymisointia, aineiston valintaa, järjestelyä ja siirtämistä.
- On suositeltavaa pitää dokumentointi ajan tasalla koko tutkimuksen elinkaaren ajan.
- Ota huomioon arkaluonteisen aineiston suojaamiseen, anonymisointiin ja poistamiseen tarvittava aika ja sen aiheuttamat kustannukset
- Erittele aineistonhallinnan kustannukset budjetissa rahoittajan ohjeiden mukaisesti.
| suomi päivitetty verkkosivulle 13.3.2023 englanti päivitetty verkkosivulle 14.3.2023
|