Page tree
Skip to end of metadata
Go to start of metadata

Tämä on kommentoitu työversio HY:n aineistonhallinnan ohjeesta englanniksi ja suomeksi (20200307).


Introduction Univ. Helsinki DMP guidance
HY:n ohjeMUUTOSLOKI/KOMMENTTISARAKE

Motivation

Motivointiosio

Motivation



Why should you manage your research data?

Research data management and its planning are an integral part of good research practices. Data management aims to

  • recognise and control the risks involved,
  • pay attention to data protection and information security,
  • agree about data ownership, sharing, and preservation, as well as
  • ensure that the necessary resources and equipment are available.

Your Data Management Plan (DMP) should describe how you manage data during as well as after the active phase of the research project. The plan should be updated as the research project evolves.

The DMP is part of your research plan. To avoid overlap between your DMP and the research plan, you can refer from one document to the other. Describe your data analysis and other methods in your research plan.

In the DMP data is understood as a broad term including:

  • data collected by various methods (such as surveys, interviews, measurements, imaging techniques etc.),
  • data produced during the research (such as analysis results),
  • research sources (such as archive material), and
  • source code and software.

You can use these general questions to structure your DMP and answer them when applicable.

Good luck with your DMP!





UUSI KANSALLISEN 2020-OHJEEN MUOTOILU:

How do I write a DMP? - READ THIS FIRST!

  • Read all of the questions first!
  • Use a DMP to complement your research plan – avoid overlaps with the research plan!
  • The research plan describes the scientific, analytical and methodological processing of data.
  • The data management plan describes the technical and administrative management of data.
  • To avoid redundancy, refer to your research plan in your DMP and vice versa.
  • Use the DMP as a risk evaluation document – it shows that you can recognise, anticipate and handle the risks related to your data management workflow.
  • The DMP should be drawn from your own research project – do not copy/paste examples from somewhere else.
  • Write only sentences you yourself understand.
  • Answer the questions where applicable – if a certain question is not applicable in your case, justify why not.
  • Answer at least the main categories – each sub-question does not need to be answered separately.
  • Include background information such as the name of the applicant and the project, the project number, the funding programme and the version of the DMP.
  • Demonstrate your data management and version control skills, for example, when considering the name of the DMP file.
  • Follow the organisation’s or funder’s requirements.


Why should you manage your research data and write a data management plan (DMP)?

  • It is good research practice!
  • You will reduce the risk of losing your data.
  • You will be able to anticipate complex ownership and user rights issues in advance.
  • It helps you support open access to create productive future collaborations.
  • You will meet your funder’s requirements.
  • It helps you save time and money.
  • Your DMP reflects your managerial skills as a project leader.

In the DMP context, ‘data’ is understood as a broad term. Data covers all of the information and material your research results are based on. You can concentrate on the data, which is your responsibility.

Your DMP should describe how you will manage the data throughout the life cycle of your research. The DMP is a living document, which should be updated as the research project progresses.

Your research data management practices should aim to produce reusable data, which follows FAIR principles, that is, your data will be Findable, Accessible, Interoperable and Re-usable.

Good luck with your DMP!



Miksi tutkimusaineistojen hallinta on tärkeää?

Tutkimusaineiston hallinta sekä sen suunnittelu kuuluvat olennaisesti hyviin tutkimuskäytäntöihin ja sen tavoitteena on

  •  tunnistaa ja hallita riskejä,
  • huomioida riittävä tietosuoja ja tietoturva,
  • sopia aineiston tekijyydestä, käytöstä ja säilyttämisestä, sekä
  • varmistaa tarvittavat resurssit ja välineet.

Aineistohallintasuunnitelmassa (Data Management Plan, DMP) kuvataan, kuinka tutkimusaineistoja hallitaan tutkimusprojektin aikana ja projektin aktiivivaiheen jälkeen. Sitä on päivitettävä tutkimusprojektin edetessä!

Aineistonhallintasuunnitelma on osa tutkimussuunnitelmaasi. Päällekkäisyyksien välttämiseksi voit viitata aineistonhallintasuunnitelmassa tutkimussuunnitelmaan ja päinvastoin. Kuvaa aineiston analysointi ja käytetyt menetelmät tutkimussuunnitelmassa.

Aineistohallintasuunnitelmassa tutkimusaineistoksi (tutkimusdata) voidaan lukea

  • eri menetelmillä kerätyn aineiston (kuten näytteet, kyselyt, haastattelut, mittaukset, arvioinnit, kuvantamismenetelmät yms.);
  • tutkimuksen aikana tuotetun aineiston (kuten analysoitu aineisto);
  • muun lähdemateriaalin (esimerkiksi monimuotoinen arkistomateriaali); sekä
  • lähdekoodit ja ohjelmistot.

Voit käyttää näitä yleisen tason kysymyksiä aineistonhallintasuunnitelmasi jäsentelyyn. Vastaa kysymyksiin soveltuvin osin.

Onnea aineistonhallintaan ja hallinnan suunnitteluun!





UUSI KANSALLISEN 2020-OHJEEN MUOTOILU:

Miten laadin aineistonhallintasuunnitelma? LUE AINAKIN NÄMÄ ENSIN.

  • Tutustu ensin kaikkiin kysymyksiin!
  • Käytä aineistonhallintasuunnitelmaa tutkimussuunnitelmasi täydentämiseen. Vältä päällekkäisyyttä tutkimussuunnitelman kanssa.
    • Tutkimussuunnitelma kuvaa aineiston tieteellistä, analyyttistä ja metodologista käsittelyä.
    • Aineistonhallintasuunnitelma kuvaa aineiston teknistä ja hallinnollista käsittelyä.
    • Päällekkäisyyksien välttämiseksi viittaa aineistonhallintasuunnitelmassa tutkimussuunnitelmaan ja päinvastoin.
  • Käytä aineistonhallintasuunnitelmaa riskinarvioinnin kuvauksena. Osoita, että pystyt tunnistamaan, ennakoimaan ja hallitsemaan aineistonhallintaprosessiin liittyviä riskejä.
  • Laadi aineistonhallintasuunnitelma oman tutkimushankkeesi näkökulmasta. Älä kopioi esimerkkejä muualta.
  • Kirjoita vain virkkeitä, jotka itse ymmärrät.
  • Vastaa kysymyksiin, jotka koskevat tutkimustasi. Jos jokin kysymys ei liity tutkimukseesi, perustele, miksi näin on.
  • Vastaa ainakin pääkysymyksiin. Kaikkiin alakysymyksiin ei tarvitse vastata erikseen.
  • Sisällytä suunnitelmaan taustatietoja, esimerkiksi hakijan ja hankkeen nimet, hankkeen numero, rahoituspäätöksen tunniste ja aineistonhallintasuunnitelman versiotieto.
  • Osoita aineiston- ja versionhallintataitosi esimerkiksi nimeämällä myös aineistonhallintasuunnitelma asianmukaisesti.
  • Noudata organisaation tai rahoittajan vaatimuksia.


Mihin tutkimusaineistojen hallinnointia ja aineistonhallintasuunnitelmaa tarvitaan?

  • Tutkimusaineistojen hallinnointi ja aineistonhallintasuunnitelman laatiminen kuuluvat hyviin tieteellisiin käytäntöihin.
  • Etukäteen laadittu aineistonhallintasuunnitelma vähentää aineistojen häviämisen tai tuhoutumisen riskiä.
  • Suunnitelman avulla pystyt ennakoimaan ja hallitsemaan omistajuuteen ja käyttöoikeuksiin liittyviä yksityiskohtia.
  • Etukäteen laadittu suunnitelma mahdollistaa aineistojen avaamisen ja luo edellytyksiä uusien yhteistyöhankkeiden muodostumiselle.
  • Suunnittelu auttaa seuraamaan rahoittajien linjauksia.
  • Suunnittelemalla säästät aikaa ja rahaa.
  • Aineistonhallintasuunnitelma kertoo osaamisestasi hankkeen johtajana.

Aineistonhallintasuunnitelman yhteydessä aineisto (data) ymmärretään laajasti. Tutkimusaineisto ja -data kattavat kaikki tiedot ja resurssit, joihin tutkimustuloksesi perustuvat. Suunnitelmassa voit keskittyä kuvamaan vastuullasi olevaan aineistoon.

Aineistonhallintasuunnitelma kuvaa, miten tutkimusaineistoa hallinnoidaan koko tutkimuksen elinkaaren ajan. Aineistonhallintasuunnitelmaa päivitetään säännöllisesti tutkimushankkeen edistyessä.

Tutkimusaineiston hallintaan liittyvien käytäntöjen tulee pyrkiä ns. FAIR-periaatteiden noudattamiseen eli siihen, että aineisto on löydettävissä (Findable), saavutettavissa (Accessible), yhteentoimiva (Interoperable) ja uudelleen käytettävissä (Re-usable).

Onnea aineistonhallintasuunnitelman laatimiseen!


  • Kirjaa tähän sarakkeeseen lyhyt kommentti, mitä korjasit TAI
  • Kommentti, mikä mielestäsi vaatii korjaamista







Miksi  "The DMP is part of your research plan." kun ovat erillisiä? - "The DMP complements your research plan" olisi ehdotukseni ja vastaava suomeksi. Kansallinenkin ohje puhuu täydentämisestä. / Monica


Tässä lauseessa "Describe your data analysis and other methods in your research plan." vaihdoin sanan introduce describe:iin. / Monica



Pitäisikö tähän kohtaan lisätä muistiinpanot? (t. filosofi). 
Komppaan tässä filosofia, muistiinpanot/notes (fieldnotes) ovat myös etnografisessa tutkimuksessa usein tärkeitä. /Monica











Uuteen kansalliseen ohjeeseen kerättiin tutkijapalautteesta ja kommentointikokemuksista uusia yleisiä vinkkejä DMP-motivointiin liittyen. Onko näissä jotain, mitä halutaan nostaa myös HYn omaan ohjeeseen vai oletetaanko, että ohjeita luetaan rinnakkain, jolloin tekstit on toisteisia ja kuormittavia? -  mikko

  • Mielestäni tämä uusi motivointiosio on puhuttelevampi kuin vanha ja tästä voisi kyllä parhaat palat siirtää HY:n motivointiin. Mun mielestä rinnakkainen lukeminen on turhan raskasta ja fiksuinta on adoptoida parhaat palat HY:n ohjeeseen. /Siiri

Yksi oleellinen huomio, jolla DMPstä pyritään tekemään joustavampi, on se, että kaikkiin alakysymyksiin ei tarvitse vastata erikseen - vastaukset kohtiin #.1 ja #.2 voi niputtaa halutessaan yhteen. Oleellista on, että kuusi teemaa on käsitelty selkeästi. Tämän voisi tuoda esiin myös HYn ohjeessa.

recognise > recognize (https://grammarist.com/spelling/recognize-vs-recognise/)

Ehdotan do not copy/paste examples (add: or phrases) from... ja vastaavasti suomenkielisessä esimerkkejä tai ilmauksia...





It helps you support > it helps you to support... and to create...

It helps you save time and money > It helps you to save time and money


Mitä tämä tarkoittaa? "You can concentrate on the data, which is your responsibility."  Ehdotan tilalle 'You can focus (concentrate:kin käy) on the data, that you are responsible for.' / Monica


1. General description of the data

1. Aineiston yleiskuvaus

MUUTOSLOKI/KOMMENTTISARAKE

1.1 What kinds of data is your research based on? What data will be collected, produced or reused? What file formats will the data be in? Additionally, give a rough estimate of the size of the data produced/collected.

1.1 Millaiseen aineistoon tutkimuksesi perustuu? Millaista aineistoa kerätään, tuotetaan tai käytetään uudelleen? Missä tiedostomuodossa aineisto on? Esitä myös karkea arvio tuotettavan/kerättävän aineiston koosta.



Discuss the following in your answer:

  • What data will be used and produced in the project? If you use sensitive data, see the recommendations below the examples.
  • In which file formats will the data be in?
  • Approximately how much data will the project have?
  • Will you use or develop special software?

Tips for best practices

Categorise your data in the following way using bullet points or a table, and use the same categorisation in all phases of your plan. Your answer to this question forms a general structure for the rest of the plan.

Example 1:
1. Data collected for this project

  • Questionnaire x, file format .pdf, size 5 Gb
  • DNA samples (n=500)
  • Pictures/videos about x, file format .jpg, .avi, size 1 Tb

2. Data produced as an outcome of the process

  • Analyses of questionnaire x, .pdf, .xslx, 1 Gb
  • DNA sequences/analyses, FASTA, .txt, .xslx, 2 Tb
  • Documentation of the data (readme files, data dictionary, laboratory notebooks)

3. Previously collected existing data reused in this project

  • Samples from the Biobank
  • Data from Statistics Finland, database, 10 Gb

Example 2:

Data typeSourceFile formatSensitivitySize
Questionnaire xdata collected.csv, .txt, .docxno/yes1 Gb
Analysis of questionnaire xdata produced.xslx, .tif
100 Mb
DNA samplesdata reused from Biobank



Guidance for sensitive data

It is important to identify sensitive data types, as planning data management includes recognising and managing the risks involved with such data. If you work with personal information, identify the controller. More information can be found in the Data protection guide for researchers (Flamma).

Sensitive data is information that could cause damage if revealed.

  • Personal data: 
    • Personal information includes all identifiers from which the person is identifiable directly or indirectly.
      • Direct identifiers: name, phone number, social security number, picture, voice, fingerprint, dental chart
      • Indirect identifiers: gender, age, education, profession, nationality, work history, system log history, marital status, residence information, car license number
  • Sensitive personal information;
    • Special categories of personal data:
      • Data revealing racial or ethnic origin, political opinions, religious or philosophical beliefs or trade union membership 
      • Genetic data 
      • Biometric data processed for the purpose of uniquely identifying a person 
      • Data concerning health
      • Data concerning a person’s sex life or sexual orientation
    • Other sensitive personal data: 
      • Data describing economic or social status
      • Location data
      • Communication data
      • Behaviour
      • Other data that is particularly personal
      • ‒ f.ex, notes and diaries

  • Sensitive information about species, such as endangered animals, plants, nature conservation areas, or biosafety.
  • Other confidential information, such as patents, military information, organisational information, or trade secrets.


Käsittele vastauksessasi seuraavia asioita:

  • Mitä aineistoa tutkimuksessa käytetään ja tuotetaan? Jos käytät arkaluonteista tietoa, katso esimerkkien alla oleva ohje.
  • Missä tiedostomuodoissa aineiston eri osat ovat?
  • Kuinka paljon aineistosi vaatii levytilaa / muistia?
  • Käytättekö erityisiä ohjelmia / kehitättekö omia?

Hyviä käytäntöjä

Vastaa kysymykseen esimerkiksi ranskalaisin viivoin alla olevan luokittelun mukaisesti tai taulukkona. Nämä vastaukset muodostavat suunnitelman loppuosan perusrakenteen.

Esimerkki 1:

1. Tutkimusta varten kerättävä aineisto

  • Kyselykaavakkeet aiheesta x, tiedostomuoto .pdf, koko 5Gb
  • DNA-näyte, näyte
  • Kuvat/videot aiheesta x, tiedostomuoto .jpg, .avi, koko 1Tb

2. Tutkimusprosessin tuloksena syntyvä aineisto

  • Kyselykaavakkeiden analyysit, .pdf, .xslx, 2Gb
  • DNA sekvenssi/analyysi, FASTA, .txt, .xslx, 2Tb
  • Aineiston dokumentaatioaineisto (laboratoriopäiväkirja, koodikirja, readme-tiedostot)

3. Aiemmin kerätty aineisto (esim. jonkun muun toimesta)

  • Näytteet Biopankista
  • Tilastokeskuksen aineisto x, tietokanta, 10Gb

Esimerkki 2:

Aineistotyyppi

LähdeTiedostomuotoArkaluonteisuusKoko
kyselykaavake xkerättävä aineisto.csv, .txt, .docxei/kyllä1 Gb
kyselykaavakkeen analyysi xprosessin tuloksena syntyvä aineisto.xslx, .tif
100 Mb
DNA näytteetaiemmin kerätty aineisto                  Biopankista       



Lisäohjeita arkaluonteisten ja luottamuksellisten aineistojen käyttäjille

Tutkimusaineiston arkaluonteiset osat ovat erityisen tarpeellista tunnistaa, koska aineistonhallinnan suunnittelussa keskitytään näihin liittyvien riskien tunnistamiseen ja hallintaan. Henkilötietojen osalta kerro, mikä taho toimii rekisterinpitäjänä. Lisätietoja Tutkijoiden tietosuojaohjeessa (Flamma).

Arkaluonteinen ja luottamuksellinen tieto on sellaista, joka voi paljastuessaan aiheuttaa vahinkoa. Tällaisia aineistoja ovat esimerkiksi:

  • Henkilötiedot:
    • Henkilötietoja ovat kaikki ne tiedot, joista henkilö on yksilöitävissä joko suoraan tai epäsuorasti
      • suorat tunnisteet: nimi, puhelinnumero, henkilötunnus, kuva, ääni, sormenjälki, hammaskartta
      • epäsuorat tunnisteet: sukupuoli, ikä, koulutus, ammattiasema, kansallisuus, sijainti, työhistoria, järjestelmän lokitiedot, sivilisääty, asuinpaikka, auton rekisterinumero
  • Arkaluonteinen henkilötieto:
    • Erityiset henkilötietoryhmät:
      • tiedot, joista ilmenee rotu tai etninen alkuperä, poliittisia mielipiteitä, uskonnollinen tai filosofinen vakaumus tai ammattiliiton jäsenyys 
      • geneettiset tiedot 
      • biometriset tiedot, jos niitä käsitellään henkilön yksiselitteistä tunnistamista varten 
      • terveyttä koskevat tiedot
      • luonnollisen henkilön seksuaalista käyttäytymistä ja suuntautumista koskevat tiedot.
    • Muutoin sensitiivisemmät henkilötiedot: 
      • Taloudelliset tiedot
      • Sijainti
      • Viestintä
      • Käyttäytyminen
      • Muut erityisen henkilökohtaisiksi koetut tiedot
        • esim. muistiinpanot, päiväkirjat
  • Sensitiivinen lajitieto, kuten uhanalaiset eläimet ja kasvit, luonnonsuojelullinen tieto tai bioturvallisuusuuteen liittyvä tieto.
  • Muu luottamuksellinen tieto, kuten patentit, maanpuolustukseen liittyvä tieto, organisatorinen tieto tai liikesalaisuudet.

Käänsin taulukon suomeksi -Tuija

Olisiko hyvä: "Jos käytät mahdollisesti arkaluonteista tietoa" -Sebastian

Tähän voisi vielä lisätä muutaman aineistotyypiin esim. tietoarkistosta kysely/haastattelupaketin ja Kielipankista kielikorpuksen; voin lisäillä ellei joku ehdi ennen - Mikko

"Tutkimusaineiston arkaluonteiset osat ovat erityisen tarpeellista tunnistaa, koska aineistonhallinnan suunnittelussa keskitytään näihin liittyvien riskien tunnistamiseen ja hallintaan. "  Englanninkielisessä ohjeessa on includes ei concentrates.  Pitäähän aineistonhallintasuunnitelmassa käsitellä muidenkin aineistojen riskejä.  Voisiko olla: Koska tutkimusaineiston arkaluonteiset osat sisältävät erityisen paljon riskejä, niiden tunnistaminen ja hallinnointi on ensiarvoisen tärkeää / vaatii erityistä tarkkuutta. -Tuija v















Lotta: "rekisterinpitäjä" linkin taakse voisi laittaa suoraan viittauksen HY:n linjanvetoon asiasta:https://flamma.helsinki.fi/fi/group/tutkimuksen-tuki/tutkimuksen-tietosuoja-asiat#menu2

recognising > recognizing?


Lotta: Siirsin tässä kohtaa henkilötiedot listan lopuksi tähän eteen, että järjestys olisi loogisempi: "mitä on henkilötieto" → sitten vasta " mitä on arkaluonteinen henkilötieto"



Lotta: Muokkasin arkaluonteisen tiedon osalta kohdan kokonaan uusiksi

1.2 How will the consistency and quality of data be controlled?

1.2 Miten aineiston yhtenäisyys ja laatu varmistetaan?




Discuss the risks involved in controlling data integrity and quality, as well as how they are managed. Notice that data quality and the quality of research methods are two distinct things.

Tips for best practices

Describe the following practices, if they are/will be in use:

  • Do you use data management tools, e.g., a database for data collection?
  • Has everyone handling the data been introduced to the best practices?
  • Are the methods validated, or are quality control pipelines in use?
  • Are transcriptions of audio or video interviews checked by someone other than the transcriber (“double blinding”)?
  • Are checksums used (software)?
  • Digitizing of analog or physical material should be done with sufficient accuracy.
  • In all conversions, maintaining the original information content should be ensured.
  • Discuss how minimisation, pseudonymisation, and anonymisation affect data quality.

Tuo esille piilevät riskit aineiston yhtenäisyyden ja laadun varmistamisessa ja se, miten riskejä kontrolloidaan. Huomaa, että aineiston laatu ja tutkimusmenetelmän laatu tarkoittavat eri asioita.

Hyviä käytäntöjä

Kerro vastauksessa esimerkiksi seuraavista käytännöistä, mikäli ne liittyvät aineistonhallinnan työnkulkuihisi:

  • Onko käytössäsi aineistonhallinnan työkaluja, kuten aineiston keräämiseen tarkoitettu tietokanta?
  • Onko kaikki aineistoa käsittelevät henkilöt perehdytetty?
  • Ovatko käytettävät menetelmät validoituja, tai onko käytössä laatukäsikirja?
  • Tarkistaako joku äänitettyjen tai kuvattujen haastattelujen litteroinnin (”double blinding”)?
  • Käytättekö tarkistussummia (ohjelmistot)?
  • Vastaavatko digitoidut aineistot riittävän tarkasti alkuperäisiä fyysisiä tai analogisia aineistoja?
  • Varmistetaanko alkuperäisen tietosisällön säilyminen, jos tietoja muutetaan tai konvertoidaan järjestelmästä toiseen?
  • Pohdi, miten mahdollinen minimointi, pseudonymisointi tai anonymisointi vaikuttavat aineiston laatuun.

”double blinding” lienee tässä yhteydessä harhaanjohtava/väärä termi. Litterointien laadunvarmistuksen ei tarvitse - tai ei ehkä jopa kannata tai pidä - olla anonyymi prosessi. Voiko termin poistaa? - mikko

Samaa mieltä - termi tulee vertaisarvioinnista eikä tässä ole kysymys siitä. Ehkä voisi puhua vain tarkistuksesta tai verifioinnista - Markku 


2. Ethical and legal compliance

2. Eettisten periaatteiden ja lainsäädännön noudattaminenMUUTOSLOKI/KOMMENTTISARAKE

2.1 What legal issues are related to your data management? (For example, GDPR and other legislation affecting data processing.)

2.1 Mitä juridisia seikkoja liittyy aineiston hallintaan (esim. EU:n yleinen tietosuoja-asetus ja muu aineiston käsittelyyn liittyvä lainsäädäntö)?


Discuss the following in your answer:

  • Does your data include personal information?
  • Does your work with animals require an ethical permit?
  • Do you work with other confidential or sensitive data than described above (e.g., endangered species (FIN), conservation areas, military information)?

Describe how you will maintain high ethical standards and comply with relevant legislation when managing your research data. What are the risks involved, and how are they managed?

Tips for best practices

  • Justify why you have the right to collect, handle, and preserve data that involves ethical issues, for example, that you have passed an ethical review.
  • If you handle personal information (more tips behind the link):
    • Identify the controller, if this has not been mentioned in section 1.1.
    • Describe how you will ensure privacy protection and if needed data anonymisation or pseudonymisation.

Additional information

For example, other requirements apply to informing participants and documenting the processing of personal data. You can find more information about them in the links below.

Data protection guide for researchers (Flamma)
General information about data protection (Flamma)
Data protection group in Yammer
Informing research participants (Data management guidelines, FSD)
Data protection recommendation for GLAM sector (FIN, Finnish GLAM jurisprudence group)
Research ethics (Flamma)

Käsittele vastauksessasi seuraavia asioita:

  • Sisältääkö aineistosi henkilötietoa?
  • Teetkö eläinten kanssa töitä, jotka vaativat eettisen luvan?
  • Käsitteletkö muuta salassa pidettävää tai luottamuksellista aineistoa kuin yllämainitut (esim. sensitiivinen lajitieto, suojelualueet, asevoimiin liittyvä tieto)?

Kerro, miten täytät eettiset vaatimukset ja noudatat asiaankuuluvaa lainsäädäntöä tutkimusaineiston hallinnassa. Kuvaa myös tärkeimmät riskit ja kuinka hallitset niitä.

Hyviä käytäntöjä

  • Perustele, että sinulla on oikeus kerätä, käsitellä ja säilyttää aineistoa, joihin liittyy eettisiä seikkoja. Esim. eettinen ennakkoarviointi on tehty.
  • Käsitellessäsi henkilötietoja (lisäohjeita linkin takana):
    • Kerro, mitkä tahot käsittelevät tietoja ja kuka tai ketkä ovat aineiston rekisterinpitäjiä 
    • Kuvaile, mitä henkilöihin liittyviä tietoja tarvitset ja miksi 
    • Määritä käsittelyn lainmukainen peruste (suostumus, yleisen edun mukainen tieteellinen tutkimus?)
    • Arvioi, mitä riskejä henkilötietojen käsittelystä voi aiheutua tutkittaville. Arvioi myös täältä löytyvän Ennakkoarviointi-lomakkeen avulla tarvetta tietosuojaa koskevalle vaikutusten arvioinnille ja tee vaikutustenarviointi tarpeen mukaan.
    • Kerro, miten suojaat käsiteltävät tiedot ja tutkittavien yksityisyyden sekä tarvittaessa anonymisoit tai pseudonymisoit tiedot.
    • Arvioi miten voit toteuttaa rekisteröidyn oikeudet (ml. tietojen käsittelystä informointi)
    • Miten huolehdit tarpeettomien tietojen poistamisesta ja mitä aineistolle tapahtuu tutkimuksen päättymisen jälkeen

Lisäohjeita

Esimerkiksi tutkittavien informointiin ja henkilötietojen käsittelyn dokumentointiin liittyy myös muita vaatimuksia, joista löytyy tarkempaa tietoa alla olevista linkeistä.

Tutkijoiden tietosuojaohje Flammassa
Yleistä tietosuojasta Flammassa
Tietosuojan tukiryhmä Yammerissa
Tutkittavien informointi (Aineistonhallinnan käsikirja, Tietoarkisto)
Tietosuoja KAM-sektorilla (KAM-juridiikkaryhmä)
Flamman tutkimusetiikka-sivu

Kakkososion uudet kysymykset kannattaa lukea ja tarkistaa, tarvitseeko ohje täsmennystä tai päivitystä suhteessa uusiin kysymyksiin. - mikko


Pitäisikö olla vielä yleisemmin: Sisältääkö aineistosi henkilötietoa → ihmisiin liittyvää tietoa? -Sebastian


Tarvitaanko vielä linkkejä (hankalaan?) Yammeriin - onko kaikki siirretty jo Flammaan? Esim. toi tietosuojaryhmän matskut?


KAM-juridiikkaryhmän tietosuojasuositus lisätty listaan. - mikko


Lotta: Muokkasin tuota "käsitellessäsi henkilötietoja kohtaa", pahoittelut, en ehtinyt kääntämään täksi päiväksi. 


Lisäsin 'if needed' koska suomenkielisessä on 'tarvittaessa' "Describe how you will ensure privacy protection and if needed data anonymisation or pseudonymisation." / Monica





2.2 How will you manage the rights of the data you use, produce and share?

2.2 Miten hallinnoit käyttämäsi, tuottamasi ja jakamasi aineiston oikeuksia?

Answer the following questions:

  • What has been agreed about data usage rights? Are there rights belonging to a third party?
  • What kind of data-sharing agreements do you plan to make with your research partners?
  • Are there Intellectual Property Rights (IPR) such as copyrights involved with the data?
  • What license will be used when/if data is opened?

Tips for best practices

Guidance about data ownership and licenses:

  • Describe who owns the data, whether rights will be transferred and whether ownership issues have been agreed upon with partners outside of the university. Agreements about authorship should be done at the beginning of the project. By doing so, you prevent possible conflicts about rights of use.
    • Remember that many funding agencies (Academy of Finland, EU) require data ownership to be transferred to the university. Ensure that the necessary agreements have been made.
    • The University of Helsinki does not automatically own a researcher’s data if this has not been agreed. Principal investigators are responsible for concluding contracts on the ownership and user rights of research data at as early a stage as possible. [University of Helsinki research data policy]
    • Instructions on concluding an agreement (Flamma)
  • Which license will be used for opening the data? It is recommended to make all research data, code and software created within a research project available for reuse. The UH recommends the CC0 license, with which you waive your rights to the work. You retain your moral rights, and good scientific practice still stipulates that the author be mentioned. Alternative licenses:
    A. Creative Commons: Information on licenses in UH Library Open Access: License Guide
    B. GNU or MIT licenses

Additional information
Research ethics (Flamma)
Legal aspects & research integrity UH

Vastaa seuraaviin kysymyksiin:

  • Mitä aineiston käytöstä on sovittu? Kohdistuuko aineistoon kolmansien osapuolten oikeuksia?
  • Miten aineiston käytöstä sovitaan tulevien yhteistyökumppaneiden kanssa?
  • Liittyykö aineistoon patentteja?
  • Millä lisenssillä aineistoa aiotaan julkaista?

Hyviä käytäntöjä

Tarkempia ohjeita oikeuksista aineistoon ja lisensseistä:

  • Kerro selkeästi mikä taho(t) omistaa aineiston. Kerro tarvittaessa, että hankkeeseen osallistuvat tutkijat ovat allekirjoittaneet oikeuksiensiirtositoumukset ja että yliopiston ulkopuolisten yhteistyökumppaneiden kanssa on sovittu aineiston ja tulosten oikeuksista. Lisäksi kirjoittajuuksista tulee sopia projektin alkuvaiheessa. Sopimalla aineiston oikeuksista ja julkaisujen tekijyyksistä ehkäiset ennalta mahdollisia aineiston käyttöön liittyviä riitatilanteita.
    • Muista, että useimmat rahoittajat (Suomen Akatemia, EU) edellyttävät aineiston oikeuksien siirtämistä yliopistolle. Huolehdithan, että tarvittavat sopimukset tehdään.
    • Helsingin yliopisto ei omista tutkijoiden keräämää aineistoa, paitsi kun tästä on erikseen sovittu. Vastuulliset tutkijat vastaavat siitä, että tutkimuksessa syntyvien aineistojen omistus- ja käyttöoikeuksia koskevat sopimukset tehdään mahdollisimman varhaisessa vaiheessa [Helsingin yliopiston tutkimusdatapolitiikka].
    • Ohjeita sopimusten tekemiseen (Flamma)
  • Kerro, millä lisenssillä tutkimusaineisto aiotaan avata. Yliopisto suosittelee CC 0 -lisenssiä, jolloin käyttäjä saa oikeudet vapaasti käyttää aineistoa kaikkiin tarkoituksiin. Säilytät kuitenkin moraaliset tekijänoikeutesi, ja hyvä tieteellinen käytäntö edellyttää edelleen tekijän mainitsemista. Vaihtoehtoisia lisenssejä:

Lisäohjeita
Flamman tutkimusetiikka-sivu
Legal aspects & research integrity (HY:n aineistonhallinnan opas)



Pohdin tässä sitä että Vastaa seuraaviin kysymyksiin: alkaa datan käyttöoikeuksista ja Hyviä käytäntöjä datan omistusoikeuksista. / Monica










Tämä "The University of Helsinki does not automatically own a researcher’s data if this has not been agreed." ei täysin vastaa suomenkielistä lausetta "Helsingin yliopisto ei omista tutkijoiden keräämää aineistoa, paitsi kun tästä on erikseen sovittu."  Suomenkielinen voi sikäli olla vähän vaarallinen että joku voi ajatella että kunhan vältän sopimuksen tekemistä niin voin pitää omistusoikeudet. Pitäisikö selkeyttääkseen kertoa että data ownership rights depend on research funding? Tietenkin pitää myös tehdä sopimuksia. / Monica  




"own a researcher’s data" Eikös data ole monikkomuotoinen eli ottaisin "a" pois -MR  

" a" tässä viittaa researcher's:iin eikä dataan eli en ottaisi pois./ Monica




3. Documentation and metadata

3. Dokumentointi ja metatiedot

MUUTOSLOKI/KOMMENTTISARAKE

3.1 How will you document your data in order to make the data findable, accessible, interoperable and re-usable for you and others?  What kind of metadata standards, README files or other documentation will you use to help others to understand and use your data?

3.1 Miten dokumentoit aineistosi, jotta se on löydettävissä, saavutettavissa, yhteentoimiva ja uudelleen käytettävissä sekä itseäsi että muita varten?  Mitä metatietostandardeja, README-tiedostoja ja muuta dokumentaatiota käytät, jotta muut voivat ymmärtää ja käyttää aineistoasi?

Explain how you will document your data during the project. Documentation means describing the data, i.e., these documents explain what data the project has and where the data originates from.

Documentation includes data dictionaries (explaining variables and codes) and readme files. Other important issues include file naming conventions, version control, and directory structure. There are standard methods available for documentation called metadata standards, which should be used if suitable for the data. These will increase the value of the data by making it easier to reuse. The documentation guide for UH researchers is available in HULib's Zenodo collection.

Tips for best practices

Discuss the following practices, if they are/will be in use. Further explanations and examples can be found the documentation guide.

  • Metadata standards: Many storage services require data to be saved using a standard. Hence, if you know where you will open data, check their standard requirements.
  • Data management software, i.e., databases and an electronic laboratory notebook
  • Data dictionaries, which explain variables, or code books, which gather all of the codes and calculations used.
  • File naming conventions
  • Directory structure
    • Remember, if metadata, i.e., file, directory, or variable names, include sensitive data or personal information, they need to be handled accordingly.
  • Readme file(s) provide information about data files to ensure they are interpreted correctly.
  • Version control

Kerro vastauksessa, miten dokumentoit aineiston projektin aikana. Dokumentointi tarkoittaa aineiston kuvaamista eli dokumentteja, jotka selittävät, mitä aineistoa projektissa on ja miten ne ovat syntyneet.

Dokumentointia ovat mm. muuttujien ja koodien selitteet (data dictionary & koodikirjat) ja readme-tiedostot. Lisäksi dokumentaatioon liittyvät tiedostojen nimeämiskäytännöt, versionhallinta sekä kansiorakenne. Dokumentointiin on olemassa stardardoituja käytäntöjä. Niiden käyttö lisää aineiston arvoa ja jatkokäytön mahdollisuuksia. HY:n ohje dokumentaatioon on saatavilla HYn Zenodo-kokoelmassa.

Hyviä käytäntöjä

Kerro vastauksessa esimerkiksi seuraavista käytännöistä, mikäli hyödynnät niitä (esimerkkejä dokumentaatio-ohjeessa):

  • Metadatastandardit: Monet arkistot edellyttävät tietyn standardin käyttöä. Jos tiedät, missä julkaiset aineiston tutkimuksen valmistuttua, kannattaa tarkistaa kyseisen paikan standardivaatimukset.
  • Tietokantaohjelmistot & aineistonhallintaohjelmistot (esim. elektroninen laboratoriopäiväkirja).
  • Sanasto, jossa selitetään käytetyt muuttujat, termit, lyhenteet ja mittayksiköt; tai koodikirja, joka kerää ja kuvaa projektin koodit ja algoritmit.
  • Tiedostojen nimeämiskäytännöt
  • Kansiorakenne
    • Muista aineiston kuvailun yhteydessä, että myös tiedostonimet, tiedostokansioiden nimet sekä muuttujat ja metadata saattavat sisältää henkilötietoja tai arkaluonteista tietoa.
  • README-tiedostot, jotka kuvaavat aineistotiedostojen sisältöä tai vaikkapa koko projektia.
  • Versionhallinta.

Muutin suomenkielisen lauseen " ja miten se syntynyt",  > "ja miten ne ovat syntyneet".  -Tuija

Olisiko "mistä ne ovat peräisin" kuiteinkin parempi? Jotenkin "miten ne ovat syntyneet" ei kuulosta minun korviini hyvältä ja siinä on myös tuo miten ei esim. mistä -Tuija
Mikä on niiden alkuperä? - Markku


Voiko data dictionaryn kääntää tietohakemistoksi vai olisiko se sanasto? Hyvissä käytännöissä käytetään sanaa Sanasto.-Tuija

Minusta sanasto - datasanasto? Hakemisto edellyttää hakumahdollisuutta.

codebooks > koodikirjat   -Tuija

Vaihdon täältä > Zenodosta. -Tuija Muokkasin samaa kohtaa vähän lisää, mm. poistin svetisismin ja korjasin myös engl.versioon. - mikko

Muutin: kannattaa tarkistaa standardivaatimukset > kannattaa tarkistaa kyseisen paikan standardivaatimukset.  -Tuija



4. Storage and backup during the research project

4. Tallentaminen ja varmuuskopiointi tutkimushankkeen aikana

MUUTOSLOKI/KOMMENTTISARAKE

4.1 Where will your data be stored, and how will the data be backed up?

4.1 Minne aineistosi tallennetaan, ja miten se varmuuskopioidaan

  • Where will your data be stored and backed up during the project?
  • Who is responsible for backups?
  • Make a plan with your partners and ensure secure data transfer.

Opening, publishing, and archiving data after the project will be described in section five.

Tips for best practices

  • Use the IT Services provided and maintained by the University of Helsinki.
    • Personal / group storage space, which are maintained and backed up (every hour) by the UH Centre for Information Services
    • Other UH storing options, e.g., virtual server, dedicated physical server
    • Univ. Helsinki DataCloud for research groups.
    • Cloud storage options: Use the UH OneDrive for business or the Teams cloud instead of other services (e.g., Google drive/Dropbox).
    • CSC services for data storage

Does your project have sufficient storage space? If not, please contact Helpdesk at tel. +358 (0)2 941 55555 or helpdesk@helsinki.fi.

  • If you work with sensitive data:
    • Be sure that your storage is safe enough for the data, e.g., UMPIO (UH), a virtual storage server (UH), a private storage server (UH), NetApp storage cluster (UH), ePouta (CSC).
    • Do not use cloud storage due to its insufficient data protection!
    • Encryption: If needed, particularly mobile devices, portable and external storage devices should be encrypted for use, e.g., Cryptomator.
    • Please, be in contact with datasupport@helsinki.fi if you are unsure about data protection.
    • Do NOT USE external hard drives as the main storing option.

Additional information
Using & storing (UH Research data management)
UH Research data management services

Vastaa seuraaviin kysymyksiin:

  • Minne aineisto tallennetaan ja varmuuskopioidaan tutkimushankkeen aikana?
  • Kuka on vastuussa varmuuskopioinnista ja palauttamisesta?
  • Tee suunnitelma yhteistyökumppaniesi kanssa ja varmista tietojen turvallinen siirto ja jakaminen osallisten välillä.

Aineiston avaaminen, julkaiseminen ja arkistointi tutkimushankkeen päätyttyä kuvataan kohdassa 5.

Hyviä käytäntöjä

  • Käytä Helsingin yliopiston tietotekniikkakeskuksen tallennuspalveluita, joissa on automaattinen varmuuskopiointi.
  • Esimerkiksi: kotihakemisto/ ryhmähakemisto, jota ylläpitää ja varmuuskopioi (joka tunti) HY:n tietotekniikkakeskus.
  • Tutkimusryhmille Helsingin yliopiston DataCloud
  • Muu HY:n tallennusratkaisu, esim. virtuaalipalvelin tai oma tallennuspalvelin.
  • Pilvipalvelut: Käytä HY:n OneDrive for Business - tai Teams- pilvipalvelua ulkopuolisten palveluiden tai kuluttajapalveluiden (esim. Google Drive/ Dropbox) sijaan
  • CSC-palvelut aineiston säilyttämiseen

Selvitä, onko projektillasi riittävästi tallennuskapasiteettia. Lisää levytilaa saat ottamalla yhteyttä Helpdeskiin puh. 02 941 55555 tai helpdesk@helsinki.fi

  • Jos työskentelet arkaluontoisen aineiston kanssa:
    • Varmista, että tallennusratkaisusi on tarpeeksi turvallinen aineistollesi, esim. UMPIO (HY), Virtual storage server (HY), Private storage server (HY), Netapp- storage cluster (HY), ePouta (CSC)
    • Älä käytä pilvipalveluita tietosuojan vuoksi!
    • Salaus tarpeen mukaan. Erityisesti mobiililaitteet, kannettavat ja ulkoiset tallennuslaitteet on pyrittävä salaamaan. Esim. Cryptomator.
    • Ota yhteyttä datasupport@helsinki.fi, jos olet epävarma aineiston suojaamisesta.
  • ÄLÄ KÄYTÄ ulkoisia kovalevyjä pääasiallisena tallennusvälineenä.

Lisäohjeita
Using & Storing (HY:n aineistonhallinnan opas)
Tutkimusdatapalvelut Helsingin yliopistolla


tarvitaanko sanaa palauttamisesta tässä kohtaa (toinen bullet point)?: varmuuskopioinnista ja palauttamisesta?  -siinä tapauksessa lisäisin minkä palauttamisesta on kyse: aineistojen -Tuija

Olisiko selkeämpi: Kuka on vastuussa varmuuskopioiden luomisesta, säilyttämisestä ja palauttamisesta? -Sebastian
Kyllä - Markku
Kyllä. Englanninkielisessä palauttamista - data restoration - ei mainita/ Monica


Lisäsin DataCloudin listaan. Kysymys tikeläisille - joko tätä saa mainostaa? Käsittääkseni tuotantokäytössä aivan tuota pikaa..? - mikko

Datacloudia mainostaessa on syytä mainita, että siitä ei oteta varmuuskopioita, eli sinne tallennettavasta datasta pitäisi olla joko varmuuskopiot jossain muualla tai sitten sinne tallennettava data ei ole luonteeltaan arvokasta. -Jonne


4.2 Who will be responsible for controlling access to your data, and how will secured access be controlled?

4.2 Kuka valvoo pääsyä aineistoon, ja miten suojattua pääsyä aineistoon valvotaan?

Answer the following questions:
  • Who is responsible for controlling access to the data?
  • How will the access control be carried out? Is there an IT solution (e.g., password protection, usage logs, or some physical solution (file cabinet) in use?
  • Who in the research group has access to which data?
  • Why has each access right (editing, watching, deleting) been awarded?
  • Tell how information security and the risks from sensitive data have been taken into account. Will sensitive data be stored in an encrypted form? More tips are below.

Tips for best practices

  • If you use a personal or shared network drive, you can easily control access rights.
  • Access control of sensitive data should be well considered. Data handling and transferring needs to be in line with permissions.
  • Access control: There must be a list of users and all rights granted, and a procedure for withdrawing rights.
  • Monitoring: How will data usage be monitored during the study: can the technical equipment log who used, when, and what data? Ask IT services what kind of automatic usage log is provided.
  • Security of the premises: Check the locking options of workspaces, safe lockers and cabinets, and camera and access surveillance.

Additional information

National Cyber Security Centre: Ohje lokitietojen tallentamiseen ja hyödyntämiseen (FIN)

UH Helpdesk at tel. +358 (0)2 941 55555 or helpdesk@helsinki.fi

Vastaa seuraaviin kysymyksiin:

Kuka (nimeä henkilö) valvoo pääsynhallintaa aineistoihin?

Miten valvonta toteutuu käytännössä? Onko käytössä IT-ratkaisu (esim. salasanan takana oleva käyttöoikeus, muutosloki) tai fyysinen ratkaisu (esim. arkistokaappi/ kassakaappi)?

Kenellä tutkimusryhmässä on oikeus mihinkin aineistoon?

Miksi kukin käyttöoikeus (muokkaus, katselu, poisto) on myönnetty?

Kerro, kuinka arkaluontoisen aineiston tietoturva ja riskit on otettu huomioon. Säilytetäänkö aineisto esimerkiksi kryptattuna? Lisävinkkejä alla.

Hyviä käytäntöjä

Kun käytät henkilökohtaista tai jaettua verkkolevytilaa, pystyt helposti hallitsemaan käyttöoikeuksia.

Arkaluontoisen aineiston pääsynhallintaan pitää kiinnittää erityistä huomiota. Aineiston käytön ja siirron pitää olla suostumuksen ehtojen mukaista, mikäli aineisto on saatu käyttöön suostumuksen perusteella.

Pääsynhallinta: Käytössä pitää olla lista myönnetyistä oikeuksista ja käyttäjistä sekä tapa, jolla käyttöoikeuksia aineistoon voi myös perua ja poistaa.

Valvonta: Miten aineiston käyttöä seurataan tutkimuksen aikana? Pystyvätkö käytetyt tekniset välineet pitämää kirjaa siitä kuka käytti, mitä aineistoa ja milloin? Kysy organisaatiosi IT-tuesta, onko tarjolla käyttö- ja muutoslokitusta.

Tilaturvallisuus: Tarkista työtilojen lukitukset, turvalliset säilytyskalusteet, kameravalvonta ja kulkuoikeuksien valvonta.

Lisäohjeita
Kyberturvallisuuskeskus: Ohje lokitietojen tallentamiseen ja hyödyntämiseen
HY Helpdesk puh. 02 941 55555 tai helpdesk@helsinki.fi


Mihin pääsynhallinan linkin pitäisi ohjata? Menee nyt meidän oppaan etusivulle.-Tuija













Englanniksi ei Monitoring kohdassa mainita muutoslokitus - change logs /Monica






5. Opening, publishing and archiving the data after the research project

5. Aineiston avaaminen, julkaiseminen ja arkistointi tutkimushankkeen päätyttyä

MUUTOSLOKI/KOMMENTTISARAKE

5.1 What part of the data can be made openly available or published? Where and when will the data, or its metadata, be made available?

5.1 Mikä osa aineistosta voidaan asettaa avoimesti saataville tai julkaista? Missä ja milloin aineisto tai siihen liittyvät metatiedot asetetaan saataville?

Go through all your data types, e.g., by using a table (as in section 1.1), and answer the following questions:

  • What part of the data will be opened/published?
  • Where will the data be opened? Name the repositories.
  • When will the data be available?
  • Will some part of the data be destroyed?

If your data cannot be opened, explain why, and tell where the project metadata will be opened.

  • Data with personal information can only be published anonymised. Pseudonymised data is still personal data, and hence, it cannot be opened without explicit consent for that purpose.
  • Personal information can be shared subject to a license, if the original processing purpose allows it. If you plan to share data which includes personal information, be in contact with UH’s research lawyers (researchlawyers@helsinki.fi).
  • The metadata of the data holding personal information should still be able to be opened, although the actual data cannot be.

Tips for best practices

  • Choose suitable repositories for sharing and opening your data already at the beginning of the project. Check that your data fulfills the repository requirements.
  • “As a rule, research data produced under the auspices of the University of Helsinki and related to published research results are open and available for shared use. The discoverability and citability of research data must be ensured.” [University of Helsinki research data policy]
    • Where to open data?
      • Check the recommendations of the publishers, learned societies, and funders of your own field of science.
      • Where have you or your colleagues in the same field published data?
      • Specific repositories for one data type can be found in re3data.org.
      • General repositories are, e.g., IDA, Zenodo, Dryad, and Figshare.
    • If you cannot open the data, open your metadata about your project data, e.g., in Zenodo or in national Etsin.
    • Choose repositories using persistent identifiers (DOI, URN).

Additional information
UH principles of open publishing
Tutkijan muistilista tutkimusdatan julkaisemiseen (Vastuullinen tiede, FIN)

Erittele kaikki aineiston osat käyttäen esimerkiksi taulukkoa (kuten kohdassa 1.1) ja vastaa seuraaviin kysymyksiin:

Mikä osa aineistosta avataan / julkaistaan?

Missä data-arkistossa aineiston osat julkaistaan?

Milloin aineisto on saatavilla?

Poistetaanko / tuhotaanko jokin aineiston osa?


Jos aineistoasi ei voida avata kokonaan tai osittain, perustele miksi, ja kerro, missä aineiston metatiedot julkaistaan.

  • Henkilötietoja sisältävät aineistot voidaan avata vain anonymisoituina. Pseudonymisoituna aineisto on edelleen henkilötietoa ja sitä EI tästä syystä voi avata, ellei siihen ole nimenomaisesti pyydetty suostumusta.
  • Henkilötietoja sisältävä aineisto voidaan jakaa joissain tapauksissa alkuperäisen käsittelyperusteen mukaiseen tarkoitukseen. Jos suunnittelet henkilötietoja sisältävän aineiston jakamista, ota yhteyttä yliopiston tutkimuspalvelujen lakimiehiin (tutkimuksenjuristit@helsinki.fi)
  • Henkilötietoja sisältävän aineiston keskeiset metatiedot kannattaa avata, vaikka itse aineistoa ei voisi julkaista.

Hyviä käytäntöjä

  • Valitse sopivat palvelut aineistojesi jakamista ja säilytystä varten jo tutkimuksen alkuvaiheessa. Huolehdi myös siitä, että aineistosi täyttää valitsemasi palvelun asettamat vaatimukset.
  • ”Helsingin yliopiston piirissä tuotettu, julkaistuihin tutkimustuloksiin liitetty tutkimusaineisto on lähtökohtaisesti yhteiskäyttöistä ja avointa. Aineiston löydettävyydestä ja viitattavuudesta on huolehdittava.” [Helsingin yliopiston tutkimusdatapolitiikka]
  • Missä aineisto kannattaa julkaista?
    • Tarkista oman alasi kustantajien, tieteellisten seurojen ja rahoittajien suositukset.
    • Missä saman alan kollegat ovat julkaisseet aineistoja?
    • Missä itse olet aiemmin julkaissut?
    • Spesifejä, tietylle aineistotyypille sopivia palveluita voi etsiä esim. re3data.org palvelusta
    • Yleisiä palveluita ovat esim. IDA, Zenodo, Dryad & Figshare
  • Jos et voi avata aineistoa, julkaise kuitenkin tutkimusaineiston metatiedot, esim. Zenodossa tai kansallisessa Etsimessä.
  • Valitse pysyviä tunnisteita (DOI, URN) käyttävä palvelu

Lisäohjeita
HY: avoimen julkaisemisen periaatteet
Tutkijan muistilista tutkimusdatan julkaisemiseen (Vastuullinen tiede)

Voisiko metatiedot-sanaa suomentaa tai selkiinnyttää? Ymmärtäisikö tutkijat paremmin esim. kuvailutiedot? - mikko
Kuvailutieto on ehkä vähän kirjastokieltä...mutta sinänsä ok. 


Miksi jotkin linkit ovat hakasulkeissa? Voidaanko yhtenäistää? - mikko







Muutin englanninkieliseksi sp-osoitteeksi researchlawyers.../ Monica

Heti sähköposti-osoitteen jälkeisessä bullet pointissa ei englanniksi ja suomeksi sanota samaa. toisessa 'should be able to' toisessa 'kannattaa avata' / Monica






Where to open data? ekassa kohdassa puhutaan field of science. Englanniksi Keskustakampuksen tieteenalat eivät usein ole field of science. Voisiko 'of science' ottaa pois? / Monica


5.2 Where will data with long-term value be archived, and for how long?

5.2 Mihin pitkällä aikavälillä arvokkaat tiedot arkistoidaan ja kuinka pitkäksi ajaksi?

Discuss where data with long-term value is archived and for how long.

  • What part of the data is archived?
  • Where will it be archived?
  • For how long will the data be preserved?
  • Are there some costs related to archiving? Who takes care of them?
  • Will some part of the data be destroyed?

An archiving plan is part of research quality and transparency.

Tips for best practices

  • When data is created, it is important to consider how long it will be preserved.
  • Remember to check if the publisher has requirements for the length of time for preservation regarding data related to a publication.
  • Check discipline-specific and funder-related preservation time requirements.
  • Traditionally, special categories of personal data (sensitive data) are advised to be destroyed when the project ends. However, GDPR does not require the destruction of data, but does require that participants need to be informed about data preservation and the basis of the duration of preservation.
    • The UH offers guidance on safe preservation methods. If you are preserving sensitive personal information, contact datasupport@helsinki.fi.
  • Biological samples can be stored in biobanks.
  • Fairdata-PAS is a preservation place for nationally valuable data for dozens or hundreds of years.
    • More information about UH service queue for Fairdata-PAS here.

Links to general guides and additional information

Five steps in deciding what data to keep (DCC, UK)
UH Archiving plan (Flamma)
UH Research data services
Data disposal (Data management guidelines, FSD)

Kerro mihin aineisto, jolla on pitkäaikaista arvoa, arkistoidaan ja kuinka pitkäksi ajaksi.

  • Mikä osa aineistosta arkistoidaan?
  • Missä arkistossa aineistoa säilytetään?
  • Kuinka pitkään aineisto säilyy ko. arkistossa?
  • Onko arkistoinnissa kuluja ja kuka niistä vastaa?
  • Tuhotaanko joku osa aineistosta?

Arkistointisuunnitelma on osa tutkimuksen laadun ja läpinäkyvyyden varmistusta.

Hyviä käytäntöjä

  • Tutkimuksessa syntyvän aineistolle säilytysaika on tärkeä miettiä ja sopia sitä mukaan kuin aineistoa syntyy.
  • Muista tarkistaa kustantajan vaatimukset julkaisuun liittyvän aineiston säilyttämisajasta.
  • Muista tarkistaa rahoittaja- ja alakohtaiset suositukset.
  • Perinteisesti arkaluontoinen aineisto kehotetaan tuhoamaan tutkimushankkeen jälkeen. Nykyisen henkilötietolainsäädännön (GDPR) mukaan tämä ei kuitenkaan ole useinkaan tarpeen, mutta tutkittaville annettavassa informaatiossa tulee mainita tietojen säilytys ja arkistointi sekä mihin niiden kesto perustuu.
    • Helsingin yliopistolla on tarjolla neuvontaa turvallisten tallennusratkaisujen valintaan. Jos olet säilyttämässä pitkään arkaluonteista henkilötietoa, ota yhteyttä: datasupport@helsinki.fi
  • Näytteisiin liittyvä aineisto voidaan arkistoida biopankkiin.
  • Kansallisesti arvokkaille aineistoille on tarjolla Fairdata-PAS -palvelu aineistojen säilyttämiseksi kymmenistä satoihin vuosiin.
    • Lisätietoja HY:n FAIRdata-PAS palvelusta täällä.


Lisäohjeita

Five steps to decide what data to keep (DCC, UK)
HY:n asiakirjojen säilytysohje (Flamma)
Aineiston hävittäminen (Aineistonhallinnan käsikirja, Tietoarkisto)

Välillä bulletpointeissa on käytetty typografisena korosteena kursivointia välillä lihavointia - voidaanko yhtenäistää? - mikko

Kaikki epäloogisuudet voinee yhtenäistää! Luulen, että epähuomiossa jäänyt aikaisemmin.  -siiri








Tähän liittyen. However, GDPR does not require the destruction of data, but does require that participants need to be informed about data preservation and the basis of the duration of preservation. On olemassa arkaluontoista rekisteridataa, josta ei pystytä informoimaan henkilöitä, joitten data siinä on.  Ja osallistujilla voi olla este, joka tekee niille mahdottomaksi ymmärtää mistä on kyse vaikka pystyttäisi sinänsä informoimaan. Eli vähän eri muotoilu. Suomeksi on ympäripyöreämpi muotoilu, /Monica


6. Data management responsibilities and resources6. Aineistonhallintaa koskevat vastuut ja resurssitMUUTOSLOKI/KOMMENTTISARAKE

6.1 Who (for example role, position, and institution) will be responsible for data management (i.e., the data steward)?

6.1 Kuka (esim. tehtävä ja laitos) vastaa aineistonhallinnasta (ns. tietovastaava)?

Summarise and describe the roles and responsibilities here. Answer the following questions:

  • Who is responsible for data management tasks?
  • Who is responsible for data protection and information security as well as controlling them?

Tips for best practices

  • Are data management responsibilities allocated to one person, or is the whole research group involved?

Kerro aineistonhallintaan liittyvät roolit ja vastuut tässä kohdassa.  Vastaa seuraaviin kysymyksiin:

  • Kuka vastaa aineistonhallintaan liittyvistä tehtävistä?
  • Kuka vastaa aineiston tietosuojasta ja -turvasta sekä näiden valvonnasta?

Hyviä käytäntöjä

  • Onko aineistonhallinta tietyn henkilön vastuulla vai onko se koko tutkimusryhmän vastuulla?
  • Kuka vastaa siitä, että kaikki ovat saaneet tarpeellisen koulutuksen ja yhteisistä käytänteistä on sovittu?

Kuudes kohta on nyt jaettu kahteen kysymykseen seuraten kansallisen ohjeen rakennetta. Tarkistakaa, menikö jaottelu edes jotenkin kohilleen. - mikko

Minusta englanniksi mieluummin monitoring kuin controlling  toisessa who is responsible kohdassa/ Monica

Tätä ei käännetty: Kuka vastaa siitä, että kaikki ovat saaneet tarpeellisen koulutuksen ja yhteisistä käytänteistä on sovittu? / Monica


6.2 What resources will be required for your data management procedures to ensure that the data can be opened and preserved according to FAIR principles (Findable, Accessible, Interoperable, Re-usable)?

6.2 Mitä resursseja aineistonhallinta edellyttää, jotta voit varmistaa, että aineisto voidaan avata ja säilyttää FAIR-periaatteiden (ks. edellä) mukaan?

Describe what resources (time and workload) are needed for data management? The better the planning for data management in the beginning of the project, the less work is needed when data is opened and preserved.

Tips for best practices

  • Estimate whether expert help or an employee is needed for data management, data preservation, and data sharing tasks.
  • Give an estimate of how much time is needed for data documentation and cleaning to prepare the data (not results) to be opened: 1–2 h weekly, one day per month, 1–2 weeks before publishing, or some other time estimate.
    • Data documentation and cleaning means, for example, producing metadata (section 3.1), anonymising sensitive data, arranging data, transferring data etc.
    • It is recommended to keep documentation up to date throughout the project life cycle.
  • Specify your data archiving, opening, and publishing costs in the budget according to funder requirements.


Mitä resursseja (ajalliset & työmäärä) aineistonhallintaan tarvitaan? Mitä paremmin tutkimusaineiston hallinta on suunniteltu ja toteutettu jo tutkimushankkeen alussa ja sen aikana, sitä vähemmän työtä tarvitaan aineiston avaamisessa ja arkistoinnissa.

Hyviä käytäntöjä

  • Arvioi, edellyttääkö aineiston hallinnointi, säilyttäminen ja jakaminen asiantuntija-apua / palkattua työntekijää.
  • Anna arvio ajasta, joka menee data-aineiston (ei tulosten) siistimiseen ja dokumentointiin julkaisukuntoon. Esimerkiksi: siihen käytetään viikoittain aikaa 1-2 h, kuukaudessa päivä, 1-2 viikkoa ennen arkistointia tms.
    • Aineiston siistiminen ja dokumentointi tarkoittaa muun muassa metatiedon tuottamista (kohta 3.1), henkilötietoa sisältävän aineiston anonymisointia, aineiston valintaa, järjestelyä ja siirtämistä.
    • On suositeltavaa pitää dokumentointi ajan tasalla koko tutkimuksen elinkaaren ajan.
  • Erittele aineistonhallintakustannukset budjetissa rahoittajan ohjeiden mukaisesti.

Arvioi, edellyttääkö aineiston hallinnointi, säilyttäminen ja jakaminen asiantuntija-apua / palkattua työntekijää.→ vaikka tää on resurssikysymys ja sinänsä 6.2 niin tavallaan kuitenkin päälekkäinen tuon 6.1 kanssa. En tiedä kummassa tämä olisi järkeväpi olla. -siiri






Aika monissa DMP:ssä ei ole erityisiä kustannuksia merkitty aineistonhallintaan. Pitäisikö siksi tässä olle mahdolliset aineistonhallintakustannukset? : Markku


Lisäsin englanninkieliseen according to funder requirements koska suomenkielisessä on rahoittajan ohjeiden mukaisesti. / Monica