Aineistojen metatiedon tallennus

Last modified by Anniina Kuusijärvi on 2024/02/12 14:39

Englanninkielinen sivu: Entering collection metadata

Suomen luonnontieteellisten kokoelmien ja tietoaineistojen metatietoja (kuvailutietoja) kirjataan Kotkaan. Tämän ohjeen tarkoituksena on antaa suuntaviivoja miten erilaisia kokoelmia, tietoaineistoja yms. kannattaa kirjata. Ohjetta voi ja kannattaa päivittää sen perusteella mikä todetaan käytännössä toimivaksi. Metatietojen laadun parantaminen on jatkuva prosessi.

Kirjaamisessa kannattaa pitää mielessä ketkä tietoja käyttävät ja mihin tarkoitukseen. Kokoelmien ja tietoaineistojen metatietoja ylläpidetään seuraavista syistä:

  • Jotta kokoelmien haltijat sekä ulkopuoliset tutkijat tietäisivät millaisia aineistoja on olemassa (nimi, kuvaus, sisältö (taksonit, aika, paikka), miten niitä voi käyttää (käyttöoikeudet) ja keneltä kysyä lisää (vastuuhenkilö)). Tieto aineistoista edistää niiden hyödyntämistä ja vaikuttavuutta.

  • Julkisuuslaki määrää että yleisön saatavilla on tieto viranomaisten tietoaineistoista ja niiden käyttöoikeuksista.

  • Lajitietokeskuksen tietojärjestelmät tarvitsevat tietoja aineistojen ominaisuuksista ja omistajista, jotta tiedot voitaisiin esittää yleisölle, tutkijoille ja viranomaisille laji.fi -portaalissa oikein.

    • Lajitietokeskuksen Aineistopyyntöjärjestelmä PYHA käyttää metatietoje esimerkiksi välittääkseen aineistopyynnöt oikeille vastuuhenkilöille.
  • Datan jakaminen muihin portaaleihin/datan kerääjille, kuten GBIF:lle, vaatii ajantasalla olevan metatiedon välittämisen datan mukana

Miten kokoelmat jaotellaan

Kotkan periaatteena on että jokainen näyte kuuluu täsmälleen yhteen kokoelmaan. Siksi ei pidä luoda kokoelmia, jotka ovat osittain päällekkäisiä . Esim. ei ”Suomen höttimönkiäiset” ja ”Höttimönkiäsitietokanta” –nimisiä kokoelmia, mikäli sama näyte voisi kuulua molempiin.

Kannattaa välttää tietojärjestelmään perustuvan kokoelman luomista . Mieluummin siis ”Suomen höttimönkiäiset”-kokoelma, jonka lisätiedoissa kerrotaan että ”näytteistä 80% on tallennettu Höttimönkiäistietokantaan.”

Koska kokoelmat järjestetään hierarkkisesti, kannattaa tähdätä siihen että näytteet liitetään aina alimman mahdollisen tason kokoelmiin. Esim. jos kokoelmahierarkia on seuraava:

  • Taka-Hikiän museon kokoelma
    • Taka-Hikiän museon eläintieteellinen kokoelma
      • Taka-Hikiän museon hyönteiskokoelma
        • Taka-Hikiän museon perhoskokoelma

 

…ei höttimönkiäisnäytteitä kannata liittää ylempiin kokoelmiin 1-3, vaan luoda niille oma ”Höttimönkiäiskokoelma” Hyönteiskokoelman alaisuuteen.

Alemmille kokoelmille voi kirjata tietoja, jotka tarkentavat tai ylikirjoittavat ylempien kokoelmien tietoja .  Jos ylä- ja alakokoelmien tiedot (esim. käyttöoikeudet) ovat ristiriitaisia, seurataan alimpaan kokoelmaan kirjattuja tietoja.

Erilliseksi kokoelmaksi kannattaa kirjata jokainen kokonaisuus, jolla jokin seuraavista täyttyy:

  • Jota on historiallisesti ja vakiintuneesti käsitelty omana kokoelmanaan muuallakin kuin organisaation sisällä, esim. tieteellisissä julkaisuissa.

  • Jolla on oma virallinen ja vakiintuneesti käytetty lyhenne tms. tunnus.

  • Josta vastaa eri tiimi (eli ei usean tiimin yhteisvastuulla olevia kokoelmia.)

  • Jota säilytetään pysyvästi ja selkeästi muista erillään (esim. omassa varastohuoneessa.)

  • Jonka näytteet on numeroitu oman mallin mukaan. (esim. jos kahdella aineistolla on käytetty päällekkäisiä numeroita, kannattaa ne erotella omiksi kokoelmikseen.)

  • Joka on järjestetty muista selvästi poikkeavalla tavalla

  • Jotka on tallennettu suhteellisen pysyvästi eri tietojärjestelmiin. (älä kuitenkaan luo tietojärjestelmästä omaa kokoelmaansa, vaan tietojärjestelmän sisältämästä aineistosta)

  • Jonka käyttöoikeudet/rajoitukset eroavat selkeästi muista. (Huomaa kuitenkin että myös yksittäisiin näytteisiin voi liittää käyttörajoituksia, joten esim. uhanalaisia lajeja ei pidä jakaa omaksi kokoelmakseen.)

Yhdessä muiden kanssa kannattaa pitää:

  • Jos erillisten kokoelmien tietojen kirjaaminen ja ylläpito tuntuu liian työläältä (esim. jos yksi vastuuhenkilö vaihtuu, ei hänen nimeään ja yhteysosoitetta pitäisi tarvita vaihtaa kymmenen kokoelman tietoihin)

  • Yhdessä säilytettävät aineistot (esim. museolle lahjoitetut aineistot, jotka hajautetaan museon kokoelman sekaan, kannattaa kirjata tähän museokokoelmaan ja kirjata lahjoitus esim. tageiksi.)

  • Jos kokoelmien välinen raja on häilyvä, eikä ole selkeää mihin kokoelmaan mikäkin näyte kuuluu (esim. kuuluuko mahdollinen tyyppinäyte tyyppikokoelmaan vai yleiskokoelmaan?)

  • Jos aineiston rajaus muuttuu ajan mittaan (ei esim. uhanalaisten lajien kokoelmaa)

  • Jos ainoa syy uuden kokoelman luomiseksi on tarve voida hakea näytetiedot tietokannasta erilleen (tähän kannattaa käyttää tagia.)

Kokoelmien lisäksi näytteitä voidaan jaotella kokonaisuuksiin tagien avulla. Yhdellä näytteellä voi olla useita tageja. Esim. ”Matti Meikäläisen lahjoituskokoelma” tai ”FiRI-hankkeessa digitoidut näytteet”. Näytteitä voidaan myös hakea muiden ominaisuuksien, esim. maan, lahkon tai tyyppinäytestatuksen perusteella.

Miten tallentaa

Pakolliset kentät on merkitty violetilla.

Basic information

Owner of record (tietueen omistaja):  Organisaatio, joka omistaa metadatatietueen ja jonka jäsenet voivat editoida tietoja.

Name of the collection in Finnish and English (Kokoelman nimi, ruotsinkielinen nimi ei ole pakollinen): Kuvaava, muista aineistoista erotteleva nimi. Kokoelman nimen tulee aueta myös muille kuin oman tiimin jäsenille. (Niinpä kokoelman nimi ei voi olla "Pohjois-Fennoskandia", ellei se todellakin koostu kokoelmasta pohjoisia fennoskandioita. "Pohjois-Fennoskandian jäkälät" tms. olisi oikeampi.) On myös syytä huomata, että Kotkaan tallennetaan tietoa nimenomaan kokoelmista, joten tämän kohdan tulisi olla nimenomaan kokoelman eikä esim. kokoelmasta kertovan tietokannan nimi.

Vaikka kokoelma on osa muita kokoelmia ylempänä hierarkiassa, kokoelman omistavan organisaation nimi tulee sisällyttää alempien kokoelmien nimiin, jotta nimi pysyy yksilöllisenä. Esim. "Taka-Hikiän museon Pohjois-Fennoskandian jäkälät" erottuu muista "Pohjois-Fennoskandian jäkälät" -kokoelmista muissa Kotkaa käyttävissä organisaatioissa.

Collection code (kokoelman koodi): tämä täytetään vain, jos kokoelmalla on olemassaoleva, vakiintunut, virallinen lyhenne. Uusia lyhenteitä ei tarvitse keksiä.

Laji.fi:ssä kokoelman koodi (collection code) lisätään automaattisesti kokoelman nimen perään sulkeissa, jos se on täytetty Kotkan metatiedoissa.

Collection type (kokoelman tyyppi): Onko kyseessä esim. museon näytekokoelma, elävä puutarhakokoelma tai jotain muuta

Description (kuvailu): Suomenkielisen nimen ja kuvailun tulee olla ymmärrettävä suurelle yleisölle. Englanninkielisen nimen ja kuvailun voi kirjoittaa enemmän tutkijoiden näkökulmasta, esim. käyttäen vakiintuneita ammattitermejä, jos kuvailu ei yleiskielellä onnistu.

Is part of (Osa kokoelmaa): Mikäli kokoelma on osa jotain toista kokoelmaa, valitse tästä ylempi kokoelma.

(Publisher short name (julkaisijan lyhytnimi): tämä on admin-kenttä, joka on näkyvillä vain ylläpitäjille. Käytetään julkaistaessa dataa.)

Coverage and methods

Taxonomic coverage (Taksonominen kattavuus): Anna alin madollinen yhteisen taksonin tieteellinen nimi, esimerkiksi heimo tai lahko. Kattavuudeksi voi merkitä esimerkiksi "Biota", jos aineisto sisältää havaintoja tai näytteitä laajasti kaikenlaisesta elollisesta.

Temporal coverage (Ajallinen kattavuus): Anna yksinkertaisia, koneluettavissa olevia vuosilukuja muodossa alkuvuosi - loppuvuosi. (esim: "1860 - 1910"). Jos tarkkaa tietoa ei ole, anna hyvä veikkaus. Tässä kentässä ei tarvitse erikseen selittää, että data ei ole välttämättä täysin tarkkaa. Jos kokoelman kartunta on yhä käynnissä, jätä loppuvuosi pois (esim. "1970 - ").

Geographic coverage (Maantieteellinen kattavuus): Anna tähän mahdollisimman selkeä nimi pienimmästä yhteisestä alueesta, jota kokoelma käsittelee. Käytä mieluiten kokoelman itsensä käyttämiä tai ajanmukaisia termejä (esim. kokoelman, jonka ajallinen kattavuus olisi "1950 - 1970" maantieteellinen kattavuus voisi olla "the Soviet Union"). Jos kokoelma sisältää havaintoja eri puolilta maailmaa, voi maantieteellinen kattavuus olla "World".

Coverage basis (kattavuus): ytimekäs määritelmä kokelmalle, jos se ei käy ilmi kokoelman nimestä. Esim. "Suomen talvilinnut"

Methods (menetelmät): aineiston kartuttamiseen/keräämiseen käytetyt standardoidut menetelmät, joita on käytetty prosessin eri vaiheissa. Esim. keruumentelmä, kartoitusmenetelmä, välineet, työkalut, ohjelmistot.

Copyrights and permissions for use

Publisher name (en) (Julkaisijan nimi englanniksi): Datan julkaisevan instituution tai organisaation nimi (käytetään julkaistaessa dataa sekundaarisesti primäärijärjestelmän ulkopuolelle). JOs tätä ei ole täytetty kokoelmalle tai sen yläkokoelmille, näytetään juklaisijana "FinBIF" dataa jaettaessa (esim. CETAF RDF). (Tämä kenttä oli aiemmin copyright owner).

License for use: Millä lisenssillä dataa voi käyttää. Kaikki aineistot ovat Lajitietokeskuksen aineistopolitiikan mukaisesti ns. avointa dataa. Lisenssi on useimmiten Creative Commons Nimeä 4.0. Tästä voidaan poiketa, mikäli toisesta lisenssistä on erikseen sovittu Lajitietokeskuksen kanssa. Katso lisätietoa Lajitietokeskuksen aineistopolitiikasta.

Valittavina vaihtoehtoina ovat:

  • Creative Commons Zero (CC0): Käyttö on vapaata eikä aineistoon tarvitse viitata, mikä helpottaa suurten aineistomäärien käyttöä.
  • Creative Commos Attribution (CC-BY):  Käyttö on vapaata, mutta ainiestoon täytyy viitata omistajan määrittelemällä tavalla.
  • Public domain: Tämä koskee aineistoja, joiden tekijänoikeudet eivät ole enää voimassa, ja joiden käytämiseksi ei siksi ole mahdollista vaatia lisenssin noudattamista.
  • All rights reserved: Tätä käytetään harvoissa erikoistapauksissa, kun aineiston omistajan kanssa ei ole sovittu lisenssien käytöstä. On erikseen harkittava otetaanko tällaisia tietoja lainkaan mukaan Lajitietokeskuksen järjestelmiin. (Esimerkki: Muiden museoiden tai yksityshenkilöiden omistamat näytteet, jotka ovat käyneet Luomuksessa määritettävänä, ja silloin tallennettu Kotkaan.)

Lisätietoa Creative Commons -lisensseistä

Secure level (karkeistustaso): Määrää mille tasolle tiedot karkeistetaan, ellei niitä ole karkeistettu muilla perusteilla, kuten sensitiivisten lajien luettelon perusteella tai yksittäisiä näytteitä tai havaintoja salaamalla. Tasot ovat yhteneväiset sensitiivisten havaintojen karkeistustasojen kanssa. Oletuksena ei salauksia.

Valinta on perusteltava "Basis for concealment or quarantine" -kentässä. Salausperusteen koskettava koko aineistoa. "Aineisto sisältää havaintoja myös uhanalaisista lajeista" ei ole riittävä perustelu koko aineiston salaamiselle.

Quarantine in years: Tässä määritellään karanteeniaika vuosina. Karanteeniaikana aineistoa käsitellän ikään kuin se olisi karkeistettu 100x100 km2 tasolle. Viranomaiset näkevät tarkat havainnot Viranomaisportaalissa. Muut voivat tehdä aineistopyynnön, jonka aineiston omistaja hyväksyy tai hylkää.

Valinta on perusteltava "Basis for concealment or quarantine" -kentässä. Luomuksen aineistopolitiikka rajaa karenssiajan enintään neljään vuoteen.

Basis for concealment or quarantine: Peruste salaukselle ja/tai karanteenille (esim. tutkimushankkeen nimi), peruste mahdollisille poikkeuksille aineistopolitiikasta. Pakollinen jos Secure level tai Quarantine käytössä.

Special terms for data use (erityisehdot datan käytölle): Vapaamuotoinen kuvaus datan käyttöön liittyvistä erityisistä ehdoista, esim. rajauksia kaupalliseen käyttöön tms.

Accessibility to public (yleisön saavutettavuus): Kenttää käytetään puutarhojen alueille, kertoo onko yleisöllä pääsy ko. puutarhan alueelle vai ei.

(Allowed for DW statistics: tämä on admin-kenttä, joka on näkyvillä vain ylläpitäjille. Kertoo, onko aineisto käytettävissä tietovaraston tilasto-endpointeille)

(Download request handler: tämä on admin-kenttä, joka on näkyvillä vain ylläpitäjille. Ylläpitäjät täyttävät tähän aineistoon kohdistuvien aineistopyyntöjen käsittelystä vastaavan henkilön MA-tunnisteen. Tyypillisesti sama henkilö kuin Person responsible. Jos tätä ei täytetä, käytetään ylemmän kokoelman tietoa. Toisteinen kenttä. )

(Collection DOI from GBIF: tämä on admin-kenttä, joka on näkyvillä vain ylläpitäjille. DOI-tunniste, jonka aineisto saa kun se on julkaistu GBIF-portaalissa.)

(Share to GBIF: tämä on admin-kenttä, joka on näkyvillä vain ylläpitäjille. Jaetaanko data GBIF:lle vai ei. Annetaan sen kokoelman tunniste, jonka alla data jaetaan)

Size

Size (approx.) (Koko, arvio): Arvio aineiston koosta (havaintojen, näytteiden tai tietueiden määrä) lukuna. Selostusta voi lisätä notes-kenttään. Käytetään esim. Luomuksen digitointitilastoja laskettaessa (digistat.luomus.fi)

% digitised (approx.) (% digitoitu, arvio): Arvio osuudesta, joka aineistosta on digitoitu/tallennettu tietokantaan tai tiedostoitu. Selostusta voi lisätä notes-kenttään.

Amount of type specimens (approx) (Tyyppinäytteiden määrä, arvio): arvio tyyppinäytteiden lukumäärästä kokoelmassa. Selostusta voi lisätä notes-kenttään.

Additional information

Location of data and backups (datan ja varmuuskopioiden sijainti):  Tässä kätevintä olisi syöttää tietojärjestelmän nimi, jossa digitoitu data sijaitsee (esim. "Kotka", "Vihko"). Jos data sijaitsee vaikkapa ulkoisella kovalevyllä, tästä kuvauksesta on hyötyä vain jos datan voi sen perusteella löytää. Esim "taulukko omalla korpulla" ei ole hyödyllinen, mutta "excel-taulukko kokoelma.xls Kaarina Kuraattorin verkkolevykansiossa" on jo huomattavasti käyttökelpoisempi.

Location of collection (kokoelman sijainti): Kokolman fyysisten näytteiden sijainti. Talon tai huoneen numeron tarkkuudella pitäisi riittää. 

Person responsible (vastuuhenkilö): Henkilö, joka vastaa kokoelmasta, jolla on valta päättää kokoelman kartuttamisesta, säilytyksestä sekä kokoelmatiedon julkaisemisesta. Anna nimi muodossa "Sukunimi, Etunimi". 

Contact email (yhteyssähköposti)Aineiston yhteyshenkilön sähköpostiosoite. Sähköposti voi olla henkilökohtainen tai yleinen yhteysosoite, josta tavoittaa aineiston vastuuhenkilön. Täytä toimivassa muodossa @-merkkiä käyttäen.

Citation recommendation (viittaussuositus): Suositus millaisella lähdeviitteellä aineistoon tulisi viitata esim. tieteellisissä artikkeleissa. Tämä näytetään aineistoja käyttäville henkilöille.

Language (kieli): datassa pääasiassa käytetty kieli.

URL: Jos kokoelmasta on lisätietoa verkossa, lisää tähän osoite. (Esim. Talvilintulaskennan etusivu, jolla kuvataan menetelmät ja linkitetään tuloksiin, tai Mannerheimin kokoelman historiikki.)

Collection quality (kokoelman laatu): Kokoelman sisältämän datan laadun arviointi kolmessa luokassa. Kts. lisätietoa Kokoelmien laatuluokitus.

Data quality description (datan laadun kuvailu): vapaamuotoinen kuvaus datan laadusta, selityksiä ja syitä valitulle laatuluokalle, tunnetut virheet jne.

Notes about the data (muistiinpanoja datasta): Päiväkirjamaisia merkintöjä tai muistiinpanoja aineistoa koskien, esim. tehdyt korjaukset jne. Huomaa, että lomakkeella on erikseen kenttä muistiinpanoille näistä metatiedoista.

Metadata on this metadata

Status of metadata -kenttä täytetään toistaiseksi manuaalisesti sen mukaan mitä tietoja täytetty (EI VIELÄ AUTOMATISOITU)

  • preliminary - needs improvement  = vain pakolliset kentät täytetty
  • satisfactory - could be improved=  pakollisten lisäksi täytetty muutamia muita kenttiä
  • comprehensive = useimmat kentät on täytetty
  • hidden - this metadata should not be used = tämä vaihtoehto valitaan tilanteessa, jossa metadata ei ole käytössä eikä sen haluta näkyvän julkisesti, mutta se täytyy kuitenkin säilyttää eikä sitä voida poistaa kokonaan.

Notes (muistiinpanot): mitä tahansa lisätietoa mihin tahansa muuhun lomakkeen kenttään liittyen. Huomaa, että aineistoa itseään koskeville muistiinpanoille on oma kenttänsä.