Aineiston kuvaaminen ja metadata

Last modified by hpkoivul@helsinki_fi on 2024/02/07 06:49

Tutkimusaineiston sisällön, keruun ja muuttujien huolellinen kuvailu on edellytys aineiston käyttökelpoisuuden säilymiselle. Ilman kuvailevaa tietoa eli metadataa tutkimusaineisto on vain merkityksetön kokoelma yksittäisiä tiedostoja, numeroita ja merkkejä. Lisäksi hyvin tehty kuvailu helpottaa tutkimusaineiston löytämistä. Tutkimusaineiston perustietojen huolellinen ja kattava kuvaus (esimerkiksi julkaisun liitteessä) on tärkeä luotettavuuden osoitus myös tutkimustulosten raportoinnissa.

Metadatan tallennus

Jokaiselle tutkimusaineistolle kannattaa luoda oma hakemisto, johon tallennetaan sekä itse tutkimusaineistot että kuvailutiedot. Kuvailutiedot voi tallentaa esimerkiksi tekstitiedostona tai jonkun metadataformaatin mukaisesti. Osa kuvailutiedosta sisältyy yleensä myös varsinaiseen datatiedostoon (esimerkiksi muuttujien selitteet tai aineistoyksikön tiedot).

Erityisesti silloin, kun kuvailtavia aineistoja tai kuvailutietoja on paljon, metadata kannattaa tallentaa jonkun metadataformaatin mukaisesti tietokantaan. Tietokantamuotoinen metadata mahdollistaa nopeat haut ja erilaiset raportoinnit. Pitkäaikaissäilytykseen kannattaa valita rakenteistettu xml-tiedosto (huomioi myös aineistojen fyysinen säilyvyys)

Tutkimusaineistosta tallennetaan soveltuvin osin seuraava metadata: