Page tree
Skip to end of metadata
Go to start of metadata

Tässä on viimeisin työversio HY:n aineistonhallinnan ohjeesta englanniksi ja suomeksi. Viimeisimmän julkaistun version löydät Zenodosta ja DMPTuulista.

University of Helsinki Datasupport

Introduction HY:n ohje

Kommentteja HY:n ohjeluonnoksesta

Motivation


Why should you manage your research data and write a data management plan (DMP)?

Your DMP should describe how you manage data during the whole research life cycle – as well as cover what happens after the active phase of the project. The DMP is a living document which should be updated as the research project develops.

Research data management and its planning (DMP) is an integral part of good research practices. By writing a DMP before your project starts, you will help minimise unexpected problems.

The invaluable advantages of data management planning include the following:

  • Reducing the risk of losing data
  • Saving time and money
  • Meeting funder and other policy requirements (such as GDPR)
  • Maintaining/ensuring data integrity
  • Ensuring that your measurements are reproducible
  • Helping you overcome complex ownership and user rights issues in advance

A clearly outlined DMP will also help you support open access in order to promote new discoveries and productive future collaborations.

In the DMP data is understood as a broad term including:

  • Data collected by various methods (such as surveys, interviews, measurements, imaging techniques etc.)
  • Data produced during the research (such as analysis results)
  • Research sources (such as various archive material)
  • Source code and software

Too often data cannot be shared or reused in research, teaching and learning at a later time because of poor data management planning at the beginning of a project.

Good luck with your DMP!

You can download this guidance from Zenodo.

Miksi tutkimusaineistojen ja -datan hallinta ja hallinnan suunnittelu on tärkeää?

Suunnitelmassa kuvataan kuinka tutkimusaineistoja hallitaan tutkimusprojektin aikana ja projektin aktiivivaiheen jälkeen. Sitä on päivitettävä tutkimusprojektin edetessä!

Tutkimusaineiston ja -datan hallinta sekä sen suunnittelu (Data Management Plan, DMP) ovat olennainen osa hyviä tutkimuskäytäntöjä. Ennen tutkimusprojektin alkua hyvin suunniteltu aineistonhallinta auttaa sinua välttymään monilta odottamattomilta ongelmilta.

Aineistonhallintasuunnitelma auttaa:

  • pienentämään aineistojen ja datan katoamisen riskiä,
  • säästämään aikaa ja rahaa,
  • täyttämään rahoittajien vaatimukset, seuraamaan organisaation, aineistonhallintapolitiikkaa ja noudattamaan EU:n yleistä tietosuoja-asetusta,
  • pitämään yllä ja turvaamaan aineiston eheyden,
  • varmistamaan tutkimuksen toistettavuuden,
  • selvittämään monimutkaisia omistajuus- ja käyttöoikeuskysymyksiä.

Selkeästi laadittu aineistonhallintasuunnitelma tukee myös avoimen tieteen toimintatapaa ja edistää uusien keksintöjen syntymistä ja tuloksellista yhteistyötä.

Tutkimusaineiston hallintasuunnitelmassa data ymmärretään laajasti ja se pitää sisällään:

  • eri menetelmillä kerätyn datan (kuten kyselyt, haastattelut, mittaukset, arvioinnit, kuvantamismenetelmät yms.)
  • tutkimuksen aikana tuotetun datan (kuten analysoitu data)
  • tutkimuksen lähdemateriaalin (esimerkiksi monimuotoinen arkistomateriaali)
  • lähdekoodit ja ohjelmistot

Huono aineistonhallintasuunnitelma on liian usein syynä siihen, että aineistoa ei voi jakaa tai käyttää uudelleen tutkimuksessa, opetuksessa tai oppimisessa.

Onnea aineistonhallintaan ja hallinnan suunnitteluun!

Voit ladata koko ohjeen myös Zenodosta.


Puuttuuko datan määritelmästä raakadata? Siis se, että kun esim. SMEAR-datasta otetaan palanen yksittäistä tutkimusta varten ja muokataan data analysoitavaan muotoon. Esim. muunnetaan laitteiden tuottamat mittayksiköt yleisesti käytössä oleviksi mittayksiköiksi. Pitäisikö siis mainita, jos  käyttämäsi data on osa laajempaa aineistoa.

1. General description of data = Aineiston yleiskuvaus

1.1 What kinds of data is your research based on? What data will be collected, produced or reused? What file formats will the data be in?

1.1 Millaiseen aineistoon tutkimuksesi perustuu? Millaista aineistoa kerätään, tuotetaan tai käytetään uudelleen? Missä tiedostomuodoissa aineisto on?


Consider your DMP as a part of your research plan. To avoid redundancy, refer to your research plan in your DMP and vice versa. Data analysis and methodology should be described in your research plan, not here.

Briefly describe what types of data you are collecting or producing. Also explain what kinds of existing data you will use, for example, the types of texts, images, photographs, measurements, statistics, physical samples or codes. If you collect and handle sensitive data, please read the guidance HERE.

Your answer to this question forms a general structure for the rest of the plan. Categorise your data in the following way and use the same categorisation in all the phases of your plan.

  1. Data collected for this project
  2. Data produced as an outcome of the process
  3. Previously collected existing data reused in this project

List the file formats used both during the research project and in archiving the data. Favour software and formats based on open standards to enable data reuse, interoperability and sharing.

Tips for best practices

  • Use a table or bullet points for a concise way of presenting
    • data types
    • file formats (for example, csv, .txt, .docx, .xslx, .tiff)
    • the software used (especially if the software is coded in your project)
    • other information
  • Clearly distinguish the data which is produced in this project from the data that has been produced earlier.

Aineistonhallintasuunnitelma on osa tutkimussuunnitelmaasi. Päällekkäisyyksien välttämiseksi voit viitata aineistonhallintasuunnitelmassa tutkimussuunnitelmaan ja päinvastoin. Kuvaa aineiston analysointi ja käytetyt menetelmät tutkimussuunnitelmassa.

Kuvaa tässä kohdassa lyhyesti, millaista aineistoa olet keräämässä tai tuottamassa. Selitä myös, millaista olemassa olevaa aineistoa aiot käyttää (esim. tekstejä, kuvia, valokuvia, mittaustuloksia, tilastoja, fyysisiä näytteitä tai koodia). Jos keräät ja käsittelet sensitiivistä dataa, lue ohjeet TÄÄLTÄ.

Vastauksesi tähän kohtaan muodostaa suunnitelman loppuosan perusrakenteen. Luokittele aineistosi esimerkiksi seuraavasti ja käytä samaa luokittelua kaikissa suunnitelman kohdissa:

  1. tätä tutkimusta varten kerättävä aineisto
  2. tutkimusprosessin tuloksena syntyvä aineisto
  3. aiemmin kerätty aineisto

Mainitse sekä tutkimushankkeen aikana että arkistoinnissa käytetyt tiedostomuodot. Suosi avoimiin standardeihin perustuvia ohjelmistoja ja tiedostomuotoja. Näin helpotat aineistojen uudelleenkäyttöä, yhteentoimivuutta ja jakamista.

Hyviä käytäntöjä

  • Käytä taulukkoa tai luetteloa esittämään
    • datatyypit
    • tiedostomuodot (esim. csv, .txt, .docx, .xslx ja .tiff)
    • ohjelmat (erityisesti hankkeessasi kehitetyt)
    • muut mahdolliset tiedot
  • Erottele selvästi nyt tuotettu data aikaisemmin tuotetusta.


Linkki malli DMP-kirjastoon olis tässä kiva.

  • Tulisiko tämä lisäohjeeseen? Linkataanko Zenodoon?

Datatuen työpajasta:

1.2 How will the consistency and quality of data be controlled?

1.2 Miten aineiston yhtenäisyys ja laatu varmistetaan?



 

Data quality control ensures that no data is accidentally changed and that the accuracy of data is maintained over its entire life cycle. Quality problems can emerge due to the technical handling, converting or transferring of data, or during its contextual processing and analysis.

Explain how the consistency and quality of data collection will be controlled and documented. This may include processes such as calibration, repeat samples or measurements, standardised data capture or recording, data entry validation, the peer review of data or representation with controlled vocabularies.

Tips for best practices

  • Transcriptions of audio or video interviews should be checked by someone other than the transcriber.
  • Digitisation of analog or physical material should be done with sufficient accuracy.
  • In all conversions, maintaining the original information content should be ensured.
  • Software that produces checksums should be used.

Aineiston laadunhallinnalla varmistetaan, että aineisto ei epähuomiossa muutu ja että aineisto pysyy virheettömänä koko sen elinkaaren ajan. Laatuongelmia voi syntyä aineistojen teknisen käsittelyn, konvertoinnin tai siirron vuoksi tai sisällön käsittelyn ja analyysin aikana.

Selitä, miten aineiston yhtenäisyys ja datan keruun laatu varmistetaan ja miten se dokumentoidaan. Laadunhallinta voi tarkoittaa mm. mittausvälineiden kalibrointia, moninkertaista mittaamista, havainnointia ja näytteidenottoa, standardoituja havainnointimenetelmiä ja -käytäntöjä, datan syötön validointia, datan vertaisarviointia tai datan kuvaamista asiasanastojen avulla.

Hyviä käytäntöjä

  • Äänitettyjen tai kuvattujen haastattelujen litteroinnit tulisi tarkistaa myös jonkun muun kuin alkuperäisen litteroijan.
  • Digtoitujen aineistojen tulee vastata riittävän tarkasti alkuperäisiä fyysisiä tai analogisia aineistoja.
  • Varmista että alkuperäinen tietosisältö säilyy, jos muunnat tietoja tai konvertoit niitä järjestelmästä toiseen.
  • Käytettävien ohjelmistojen tulisi laskea tarkistussummia.



  • Tehdäänkö tarkistussummista selite?


2. Ethical and Legal Compliance = Eettisten periaatteiden ja lainsäädännön noudattaminen

2.1 What ethical issues are related to your data management, for example, in handling sensitive data, protecting the identity of participants, or gaining consent for data sharing?

2.1 Mitä eettisiä seikkoja aineistosi hallintaan liittyy (esim. arkaluonteisten tietojen käsittely, tutkittavien identiteetin suojaaminen ja tietojen jakamista koskevan suostumuksen hankkiminen)?


Describe how you will maintain high ethical standards and comply with relevant legislation when managing your research data. Ethical issues must be considered throughout the whole research data life cycle.

For example, following the guidelines regarding informing research participants is considered an ethical requirement for most research. Moreover, if you are handling personal or sensitive information, describe how you will ensure privacy protection and data anonymisation or pseudonymisation.

Tips for best practices

  • If you collect and handle sensitive data, please read the guidance HERE.
  • Check whether an ethical review is required of your research project.
  • If your research is to be reviewed by an ethical committee, outline in your DMP how you will comply with the protocol (e.g., how to remove personal or sensitive information from your data before sharing it to ensure privacy protection).

Links to general guides

Kerro, miten täytät eettiset vaatimukset ja noudatat asiaankuuluvaa lainsäädäntöä tutkimusaineiston hallinnassa koko sen elinkaaren ajan.

Useimpia tutkimushankkeita koskee esimerkiksi eettinen vaatimus tutkittavien informointiin liittyvien ohjeiden noudattamisesta. Jos käsittelet henkilötietoja tai arkaluonteisia tietoja, kerro, miten suojaat tutkittavien yksityisyyden ja anonymisoit tai pseudonymisoit tiedot.

Hyviä käytäntöjä

  • Jos keräät ja käsittelet sensitiivistä dataa, lue ohjeet TÄÄLTÄ.
  • Tarkista edellytetäänkö tutkimukseltasi eettistä ennakkoarviointia.
  • Jos eettinen toimikunta antaa lausunnon tutkimuksestasi, kerro aineistonhallintasuunnitelmassa, miten noudatat toimintaohjeita (esim. miten henkilökohtaiset tai arkaluonteiset tiedot poistetaan aineistosta ennen sen jakamista, jotta yksityisyydensuoja voidaan varmistaa).

Lisäohjeita

Tää on kyllä vaan suomeksi, mutta pitäisköhän linkata silti ? https://www.vastuullinentiede.fi/ (MR)


Datatuen työpajan kommentit:

2.2 How will data ownership, copyright and Intellectual Property Right (IPR) issues be managed? Are there any copyrights, licenses or other restrictions which prevent you from using or sharing the data?

2.2 Miten aineiston omistajuuteen, tekijänoikeuksiin ja immateriaalioikeuksiin liittyviä asioita hallintaan? Estävätkö tekijänoikeudet, käyttöoikeudet tai muut rajoitukset aineiston käyttämisen tai jakamisen?

Describe who will own the data and how the ownership issues have been agreed upon. Describe who can issue permissions to (re)use it.

The University of Helsinki does not own the data researchers have collected, unless this has been clearly agreed upon.

Tips for best practices

  • Agreements on the ownership of the data have to be done inside the research group and between the research partners.

  • If the agreements have not been made, a complex situation with overlapping ownerships is created. The unclear situation can hinder the use of the data and the publication of results.

  • When you make agreements on the ownership of data, you prevent possible conflicts about the usage rights to the data.
  • "Principal investigators are responsible for concluding contracts on the ownership and user rights of research data at as early a stage as possible..." [University of Helsinki research data policy]
  • It is recommended to make all research data, code and software created within a research project available for reuse, e.g., under Creative Commons, GNU, MIT or another relevant license.
  • Consider the relevant funder, institutional or departmental policy on copyrights or IPR. It is often required (especially in EU funded research) that the ownership of data is transferred to the university.

Links to general guides

Kerro, kuka aineiston omistaa ja mitä omistajuudesta on sovittu. Kerro myös, kuka voi antaa luvan aineiston (uudelleen) käyttämiseen.

Helsingin yliopisto ei omista tutkijoiden keräämää aineistoa, ellei tästä ole erikseen selkeästi sovittu.

Hyviä käytäntöjä

  • Sopimukset datan omistajuudesta tulee tehdä tutkimusryhmän sisällä ja yhteistyökumppaneiden välillä.
  • Jos sopimuksia ei ole tehty, syntyy monimutkainen päällekkäisten omistajuuksien vyyhti. Epäselvä tilanne voi estää datan jatkokäytön ja tulosten julkaisemisen.
  • Sopimalla omistajuudesta, ennaltaehkäiset lisäksi mahdollisia datan käyttöön liittyviä riitatilanteita.
  • ”Vastuulliset tutkijat vastaavat siitä, että tutkimuksessa syntyvien aineistojen omistus- ja käyttöoikeuksia koskevat sopimukset tehdään mahdollisimman varhaisessa vaiheessa..." [Helsingin yliopiston tutkimusdatapolitiikka]
  • Tutkimusaineiston sekä kaikkien tutkimushankkeessa luotujen koodien ja ohjelmistojen tarjoaminen uudelleen käytettäviksi on suositeltavaa. Käytä tähän tarkoitukseen esimerkiksi Creative Commons-, GNU- tai MIT- tai muuta lisenssiä.
  • Ota huomioon rahoittajatahon, tutkimusorganisaation tai laitoksen tekijänoikeuksiin ja immateriaalioikeuksiin liittyvät ohjeet. Usein (erityisesti EU:n rahoittamassa tutkimuksessa) ehdoissa vaaditaan datan omistajuuden siirtämistä yliopistolle"

Lisäohjeita


Pitäisikö linkata myös tähän (siinä on nyt asiaa myös datasta)? http://libraryguides.helsinki.fi/oa/eng/license


Datatuen työpajan kommentit

  • Sopimusmalleja/peruslauseita?
  • Linkki arkaluonteisten ohjeeseen.
  • Pelotteluvideo tarvitaan
    Etsitään linkki omistajuuden siirtymisestä
  • Tekijänoikeudet ja immateriaalioikeudet eivät kaipaa oikeastaan selitettä, vaan linkin sivustolle, jossa on näistä lisää tietoa. - Jari

3. Documentation & metadata = Dokumentointi ja metatiedot

3.1 How will you document your data in order to make it findable, accessible, interoperable and re-usable for you and others?  What kind of metadata standards, README files or other documentation will you use to help others to understand and use your data?

3.1 Miten dokumentoit aineistosi, jotta se on löydettävissä, saavutettavissa, yhteentoimivaa ja uudelleen käytettävissä sekä itseäsi että muita varten?  Mitä metatietostandardeja, README-tiedostoja ja muuta dokumentaatiota käytät, jotta muut voivat ymmärtää ja käyttää aineistoasi?


The purpose, origin, time, location, creator, access conditions and terms of use of a data collection are explained in your documentation (that is metadata). In addition, describe for example, your file-naming conventions, version control and folder structure in your metadata. Also, explain, the terms, variables, codes, abbreviations, units of measurements in the documentation.

Tips for best practices

  • Describe the types of documentation that will accompany the data, for example README files code books, data dictionaries, questionnaires
  • Use research instruments which create standardised metadata formats automatically. Then your data can be moved from one manufacturer tool to another.
  • Repositories often require the use of a specific metadata standard. Check whether a discipline/community- or repository-based metadata schema or standard (i.e., preferred sets of metadata elements) exists that can be adopted.

Links to general guides

Aineiston kuvauksessa eli metatiedoissa kerrotaan esimerkiksi aineiston käyttötarkoituksesta, alkuperästä, sijainnista, tekijästä, pääsynhallinnasta ja käyttöehdoista. Metatiedoissa kuvataan lisäksi tiedostojen nimeämiskäytännöt, versionhallinta ja kansiorakenne. Selitä kuvauksessa myös termit, muuttujat, koodit, lyhenteet ja mittayksiköt.

Hyviä käytäntöjä

  • Luettele dataan liitettävät kuvailudokumentit, esim. README-tiedostot, koodikirjat, datasanakirjat, kyselylomakkeet.
  • Käytä tutkimusvälineitä ja mittauslaitteita, joiden luomat metatiedot ovat automaattisesti standardien mukaisia. Tällöin aineistosi on siirrettävissä eri valmistajien työkalusta toiseen.
  • Arkistot edellyttävät usein tietyn metatietostandardin käyttämistä. Tarkista, onko käytettävissä ala-, yhteisö- tai arkistokohtaista metatietomallia tai -standardia.

Lisäohjeita


Datatuen työpajan kommentit

  • Sanastoon selitykset & ohjeeseen linkit seuraavista:
    • readme.txt-tiedosto
    • koodikirja
    • datasanakirja
    • metatiedot (suomeksi)
    • Versionhallinnan selite ei ehkä riitä, mielummin sivu, jossa annetaan esimerkkejä käytännöiksi. Tai sitten lisätään selitteeseen esimerkit vaikka wikistä ja githubista. Ehkä voisi linkittää oppaaseen?
    • Samoin metadatastandardi.

4. Storage and backup during the research project = Tallentaminen ja varmuuskopiointi tutkimushankkeen aikana

4.1 Where will your data be stored, and how will it be backed up?

4.1 Minne aineistosi tallennetaan ja miten se varmuuskopioidaan?

Describe here, where you will store and backup your data during your research project. Opening, publishing and archiving your data after your research project has ended is explained in Section 5.

Consider who will be responsible for backup and recovery. If there are several researchers involved, create a plan with your collaborators and ensure safe transfer between participants.

Tips for best practices

  • Use storage services provided and maintained by University of Helsinki IT services.
  • Does your project have sufficient storage space. If not, please contact Helpdesk tel. + 358 (0)2 941 55555 or helpdesk@helsinki.fi
  • Don't use cloud services to store sensitive data.
  • Use OneDrive for Business instead of commercial cloud services (such as Google Drive) that are not supported by IT services.
  • Remember to state your intention to specify your data management costs in the budget.

Links to general guides

Kerro tässä kohdassa, minne aineisto tallennetaan ja varmuuskopioidaan tutkimushankkeen aikana. Aineiston avaaminen, julkaiseminen ja arkistointi tutkimushankkeen päätyttyä kuvataan kohdassa 5.

Kerro, kuka vastaa tietojen varmuuskopioinnista ja palauttamisesta. Jos mukana on useita tutkijoita, tee suunnitelma yhteistyökumppaniesi kanssa ja varmista tietojen turvallinen siirto osallistujien välillä.

Hyviä käytäntöjä

  • Käytä Helsingin yliopiston tietotekniikkakeskuksen tallennuspalveluita.
  • Selvitä, onko projektillasi riittävästi tallennuskapasiteettia. Lisää levytilaa saat ottamalla yhteyttä Helpdeskiin puh. 02 941 55555 tai helpdesk@helsinki.fi
  • Älä tallenna pilvipalveluihin arkaluonteista aineistoa.
  • Käytä HY:n OneDrive for Business -pilvipalvelua ulkopuolisten palveluiden (esim. Google Drive) sijaan.
  • Muista kertoa suunnitelmassa, että aiot eritellä aineistonhallintakulut budjetissa.

Lisäohjeita







4.2 Who will be responsible for controlling access to your data, and how will secured access be controlled?

4.2 Kuka valvoo pääsyä aineistoon ja miten suojattua pääsyä aineistoon valvotaan?

Create a brief data security plan where you describe your processes of how you access and handle the data safely.

Tips for best practices

  • Use personal or shared network drive  to control who can access and use your data. Personal and shared network drives are also backed up.
  • Access controls should always be in line with the level of confidentiality involved.
  • If you collect and handle sensitive data, please read the guidance HERE.

Links to general guides

Tee lyhyt aineiston turvallisuussuunnitelma, jossa kuvaat miten haet, käsittelet ja tallennat dataa turvallisesti.

Hyviä käytäntöjä

  • Käytä henkilökohtaista tai jaettua verkkolevytilaa. Näin saat hallittua aineiston käyttöoikeuksia ja lisäksi aineistosi on automaattisesti varmuuskopioitu.
  • Kiinnitä huomiota pääsynhallintaan erityisesti, jos käsittelet arkaluonteista aineistoa.
  • Jos keräät ja käsittelet sensitiivistä dataa, lue ohjeet TÄÄLTÄ.

Lisäohjeita



5. Opening, publishing and archiving the data after the research project = Aineiston avaaminen, julkaiseminen ja arkistointi tutkimushankkeen päätyttyä

 

5.1 What part of the data can be made openly available or published? Where and when will the data, or its metadata, be made available?

5.1 Mikä osa aineistosta voidaan asettaa avoimesti saataville tai julkaista? Missä ja milloin aineisto tai siihen liittyvät metatiedot asetetaan saataville?

If your data or parts of it cannot be opened, explain why. The openness of research data promotes its reuse. Too often data can't be shared because of poor data management planning at the beginning of the research project.

Tips for best practices

  • “As a rule, research data produced under the auspices of the University of Helsinki and related to published research results are open and available for shared use. The discoverability and citability of research data must be ensured.” [University of Helsinki research data policy]
  • Publish your data in a data repository. If you can not open your data, you can publish a description (i.e., the metadata) of your data without making the data itself openly available
    • Check funder, disciplinary or national recommendations for data repositories.
    • Check re3data.org to find a repository for your data.
    • Early selection of a specific data-sharing repository helps you prevent unpleasant surprises at the end of your research when you deposit your data.
    • Use repositories or publishers which provide persistent identifiers (e.g. DOI, URN) to enable access to the data via a persistent link .
  • It is recommended to make all research data, code and software created within a research project available for reuse under Creative Commons, GNU, MIT or another relevant license.
    • A CC0 waiver is recommended for opening research data and metadata.

Links to general guides


Jos aineistoasi ei voida avata kokonaan tai osittain, perustele miksi. Tutkimusaineiston avoimuus edistää aineiston uudelleenkäyttöä. Liian usein tutkimusaineistojen jakaminen ei onnistu, koska aineistonhallinnan suunnittelu on laiminlyöty tutkimusprojektin alussa.

Vinkkejä hyvistä käytännöistä

  • ”Helsingin yliopiston piirissä tuotettu, julkaistuihin tutkimustuloksiin liitetty tutkimusdata on lähtökohtaisesti yhteiskäyttöistä ja avointa. Aineiston löydettävyydestä ja viitattavuudesta on huolehdittava.” [Helsingin yliopiston tutkimusdatapolitiikka]
  • Julkaise aineistosi asianmukaisessa arkistossa. Jos et voi avata dataa, julkaise kuitenkin tutkimusaineiston metatiedot.
    • Tarkista oman alasi sekä rahoittajan antamat arkistosuositukset
    • Etsi sopiva arkisto osoitteesta re3data.org.
    • Valitse sopivat data-arkistot, repositoriot ja datapankit aineistojesi jakamista ja säilytystä varten jo tutkimuksen alkuvaiheessa. Huolehdi myös, että aineistosi täyttää valitsemasi arkiston asettamat vaatimukset.
    • Valitse pysyviä tunnisteita (DOI, URN) käyttävä data-arkisto, repositorio tai datapankki.
  • Tutkimusaineiston sekä kaikkien tutkimushankkeessa luotujen koodien ja ohjelmistojen tarjoaminen uudelleen käytettäviksi on suositeltavaa. Käytä tähän tarkoitukseen esimerkiksi Creative Commons-, GNU- tai MIT-lisenssiä.
    • Suosittelemme datan avaamiseen CC0:a, jolla luovut tekijänoikeudestasi dataan. Hyvä tieteellinen käytäntö kuitenkin edellyttää tekijän mainitsemista.

Lisäohjeita


Datatuen työpajan kommentit

  • Lisää metatietoihin linkki (suomekkielinen selite puuttuu)
  • Selite termiin repositoriot. (Lisätään oppaaseen?l.
  • Julkaisemisella vs. avoimeksi saattamisella. (Selitteet oppaaseen)

5.2 Where will data with long-term value be archived, and for how long?

5.2 Mihin pitkällä aikavälillä arvokkaat tiedot arkistoidaan ja kuinka pitkäksi ajaksi?

Briefly describe what data to archive and for how long – as well as what data to dispose of after the project. Describe the access policy for the archived data.

Tips for best practices

  • Check funder, disciplinary or national recommendations for data archives.

Links to general guides

Kuvaa lyhyesti, mitkä tiedot arkistoidaan ja kuinka pitkäksi ajaksi sekä mitkä tiedot hävitetään hankkeen päätyttyä. Kuvaa arkistoitujen tietojen saatavuutta koskevat periaatteet.

Vinkkejä hyvistä käytännöistä

  • Muista tarkistaa rahoittajan omat, alakohtaiset tai kansalliset arkistosuositukset.

Lisäohjeita



5.3 Estimate the time and effort required for preparing the data in order to publish or archive it.

5.3 Arvioi, kuinka paljon aikaa ja työtä tarvitaan aineiston valmistelemiseen julkaisua tai arkistointia varten.


Publishing data can require a lot of preparation, for instance selecting, organising and transferring the data. It also takes time and effort to produce metadata, describe the data and anonymise personal data. Determine whether you need help from an expert to manage, preserve and share your data.

The better you plan your data management already in the beginning of your research project, the less work you need to do when you open and share your data.

Tips for best practices

  • Specify your data archiving, opening and publishing costs in the budget.

Aineistojen julkaiseminen voi edellyttää paljon valmistelua, esimerkiksi datan valintaa, järjestelyä ja siirtämistä. Aikaa ja työtä voidaan tarvita myös metatiedon tuottamiseen, datan kuvailuun ja henkilötietoja sisältävän datan anonymisointiin. Arvioi, edellyttääkö aineiston hallinnointi, säilyttäminen ja jakaminen asiantuntija-apua.

Mitä paremmin tutkimusdatan hallinta on suunniteltu ja toteutettu jo tutkimushankkeen alussa ja sen aikana sitä vähemmän työtä tarvitaan dataan avaamisessa.

Vinkkejä hyvistä käytännöistä

  • Erittele aineistonhallintakustannukset budjetissa.

http://opendatahandbook.org/