Copy of Entering collection data/Kokoelmatietojen tallennus (Copy)
Suomen luonnontieteellisten kokoelmien ja tietoaineistojen metatietoja (kuvailutietoja) kirjataan Kotkaan. Ohjeiden puuttuessa tietoja on kirjattu epäyhdenmukaisilla tavoilla. Tämän ohjeen tarkoituksena on antaa suuntaviivoja miten erilaisia kokoelmia, tietoaineistoja yms. kannattaa kirjata. Ohjetta voi ja kannattaa päivittää sen perusteella mikä todetaan käytännössä toimivaksi.
Kirjaamisessa kannattaa pitää mielessä ketkä tietoja käyttävät ja mihin tarkoitukseen. Kokoelmien ja tietoaineistojen metatietoja ylläpidetään, jotta
Kokoelmien haltijat sekä ulkopuoliset tutkijat tietäisivät millaisia aineistoja on olemassa (nimi, kuvaus, sisältö (taksonit, aika, paikka), miten niitä voi käyttää (käyttöoikeudet) ja keneltä kysyä lisää (vastuuhenkilö)). Tieto aineistoista edistää niiden hyödyntämistä ja vaikuttavuutta.
Julkisuuslaki määrää että yleisön saatavilla on tieto viranomaisten tietoaineistoista ja niiden käyttöoikeuksista.
Lajitietokeskuksen tietojärjestelmät tarvitsevat tietoja aineistojen ominaisuuksista ja omistajista, jotta tiedot voitaisiin esittää yleisölle, tutkijoille ja viranomaisille laji.fi -portaalissa oikein.
Miten kokoelmat jaotellaan
Kotkan periaatteena on että jokainen näyte kuuluu täsmälleen yhteen kokoelmaan. Siksi ei pidä luoda kokoelmia, jotka ovat osittain päällekkäisiä . Esim. ei ”Suomen höttimönkiäiset” ja ”Höttimönkiäsitietokanta” –nimisiä kokoelmia, mikäli sama näyte voisi kuulua molempiin.
Kannattaa välttää tietojärjestelmään perustuvan kokoelman luomista . Mieluummin siis ”Suomen höttimönkiäiset”-kokoelma, jonka lisätiedoissa kerrotaan että ”näytteistä 80% on tallennettu Höttimönkiäistietokantaan.”
Koska kokoelmat järjestetään hierarkkisesti, kannattaa tähdätä siihen että näytteet liitetään aina alimman mahdollisen tason kokoelmiin . Esim. jos kokoelmahierarkia on seuraava:
1) Taka-Hikiän museon kokoelma
2) Eläintieteellinen kokoelma
3) Hyönteiskokoelma
4) Perhoskokoelma
…ei höttimönkiäisnäytteitä kannata liittää ylempiin kokoelmiin 1-3, vaan luoda niille oma ”Höttimönkiäiskokoelma” Hyönteiskokoelman alaisuuteen.
Ylemmille kokoelmille ei tarvitse kirjata kovin tarkkoja tietoja , koska näytteisiin liittyvät tiedot (esim. käyttöoikeudet, kokoelman vastuuhenkilö) otetaan kuitenkin alimman kokoelman tiedoista. Arvion näytelukumäärästä voi kirjata ylemmille kokoelmille, koska tilastot lasketaan vain alimpien kokoelmien tiedoista. (EI VIELÄ)
Alemmille kokoelmille voi kirjata tietoja, jotka tarkentavat tai ylikirjoittavat ylempien kokoelmien tietoja . Jos ylä- ja alakokoelmien tiedot (esim. käyttöoikeudet) ovat ristiriitaisia, seurataan alimpaan kokoelmaan kirjattuja tietoja.
Erilliseksi kokoelmaksi kannattaa kirjata jokainen kokonaisuus, jolla jokin seuraavista täyttyy:
Jota on historiallisesti ja vakiintuneesti käsitelty omana kokoelmanaan muuallakin kuin organisaation sisällä, esim. tieteellisissä julkaisuissa.
Jolla on oma virallinen ja vakiintuneesti käytetty lyhenne tms. tunnus.
Josta vastaa eri tiimi (eli ei usean tiimin yhteisvastuulla olevia kokoelmia.)
Jota säilytetään pysyvästi ja selkeästi muista erillään (esim. omassa varastohuoneessa.)
Jonka näytteet on numeroitu oman mallin mukaan. (esim. jos kahdella aineistolla on käytetty päällekkäisiä numeroita, kannattaa ne erotella omiksi kokoelmikseen.)
Joka on järjestetty muista selvästi poikkeavalla tavalla
Jotka on tallennettu suhteellisen pysyvästi eri tietojärjestelmiin. (älä kuitenkaan luo tietojärjestelmästä omaa kokoelmaansa, vaan tietojärjestelmän sisältämästä aineistosta)
Jonka käyttöoikeudet/rajoitukset eroavat selkeästi muista. (Huomaa kuitenkin että myös yksittäisiin näytteisiin voi liittää käyttörajoituksia, joten esim. uhanalaisia lajeja ei pidä jakaa omaksi kokoelmakseen.)
Yhdessä muiden kanssa kannattaa pitää :
Jos erillisten kokoelmien tietojen kirjaaminen ja ylläpito tuntuu liian työläältä (esim. jos yksi vastuuhenkilö vaihtuu, ei hänen nimeään ja yhteysosoitetta pitäisi tarvita vaihtaa kymmenen kokoelman tietoihin)
Yhdessä säilytettävät aineistot (esim. museolle lahjoitetut aineistot, jotka hajautetaan museon kokoelman sekaan, kannattaa kirjata tähän museokokoelmaan ja kirjata lahjoitus esim. datasetiksi.)
Jos kokoelmien välinen raja on häilyvä, eikä ole selkeää mihin kokoelmaan mikäkin näyte kuuluu (esim. kuuluuko mahdollinen tyyppinäyte tyyppikokoelmaan vai yleiskokoelmaan?)
Jos aineiston rajaus muuttuu ajan mittaan (ei esim. uhanalaisten lajien kokoelmaa)
Jos ainoa syy uuden kokoelman luomiseksi on tarve voida hakea näytetiedot tietokannasta erilleen (tähän kannattaa käyttää datasettiä.)
Kokoelmien lisäksi näytteitä voidaan jaotella kokonaisuuksiin datasettien avulla. Yksi näyte voi kuulua useaan datasettiin. Esim. ”Matti Meikäläisen lahjoituskokoelma” tai ”FiRI-hankkeessa digitoidut näytteet”. Näytteitä voidaan myös hakea muiden ominaisuuksien, esim. maan, lahkon tai tyyppinäytestatuksen perusteella.
Miten tallentaa
Pakolliset kentät on merkitty punaisella.
Name of the collection (Kokoelman nimi): Kuvaava, muista aineistoista erotteleva nimi. Kokoelman nimen tulee aueta myös muille kuin oman tiimin jäsenille. (Niinpä kokoelman nimi ei voi olla "Pohjois-Fennoskandia", ellei se todellakin koostu kokoelmasta pohjoisia fennoskandioita. "Pohjois-Fennoskandian jäkälät" tms. olisi oikeampi.) On myös syytä huomata, että Kotkaan tallennetaan tietoa nimenomaan kokoelmista, joten tämän kohdan tulisi olla nimenomaan kokoelman eikä esim. kokoelmasta kertovan tietokannan nimi.
Ylempien kokoelmien nimiä ei pidä toistaa nimessä, jos kokoelma on sellaisiin liitetty. Jos "Fennoskandian jäkälät" -kokoelma kuuluu "Hikiän luonnontieteellisen museon kokoelmat" -kokoelmaa, ei Hikiä-nimeä tarvitse siinä toistaa.
Description (kuvailu): Suomenkielisen nimen ja kuvailun tulee olla ymmärrettävä suurelle yleisölle. Englanninkielisen nimen ja kuvailun voi kirjoittaa enemmän tutkijoiden näkökulmasta, esim. käyttäen vakiintuneita ammattitermejä, jos kuvailu ei yleiskielellä onnistu.
Abbreviation (Lyhenne): Käytä tätä vain, jos kokoelmalla on jo käytössä oleva virallinen tai vakiintunut lyhenne. Uusia ei kannata keksiä. Juuritason kokoelmille tähän on täytetty lyhyessä muodossa aineistojen omistaja, jotta mm. beta.laji.fi-sivun tilastosivulla saadaan eroteltua eri organisaatioiden alaiset aineistot.
Is part of (Osa kokoelmaa): Mikäli kokoelma on osa jotain toista kokoelmaa, valitse tästä ylempi kokoelma.
Taxonomic coverage (Taksonominen kattavuus): Anna alin madollinen yhteisen taksonin tieteellinen nimi, esimerkiksi heimo tai lahko. Kattavuudeksi voi merkitä esimerkiksi "Biota", jos aineisto sisältää havaintoja tai näytteitä laajasti kaikenlaisesta elollisesta.
Temporal coverage (Ajallinen kattavuus): Anna yksinkertaisia, koneluettavissa olevia vuosilukuja muodossa alkuvuosi - loppuvuosi. (esim: "1860 - 1910"). Jos tarkkaa tietoa ei ole, anna hyvä veikkaus. Tässä kentässä ei tarvitse erikseen selittää, että data ei ole välttämättä täysin tarkkaa. Jos kokoelman kartunta on yhä käynnissä, jätä loppuvuosi pois (esim. "1970 - ").
Geographic coverage (Maantieteellinen kattavuus): Anna tähän mahdollisimman selkeä nimi pienimmästä yhteisestä alueesta, jota kokoelma käsittelee. Käytä mieluiten kokoelman itsensä käyttämiä tai ajanmukaisia termejä (esim. kokoelman, jonka ajallinen kattavuus olisi "1950 - 1970" maantieteellinen kattavuus voisi olla "the Soviet Union"). Jos kokoelma sisältää havaintoja eri puolilta maailmaa, voi maantieteellinen kattavuus olla "World".
Copyright owner: Aineiston omistajan nimi englanniksi. Kenttä täytetään vain jos tämä ei selviä yläkokoelmien tiedoista (esim. "University of Oulu" tai "Luomus").
License for use: Millä lisenssillä dataa voi käyttää. Kaikki aineistot ovat Lajitietokeskuksen aineistopolitiikan mukaisesti ns. avointa dataa. Lisenssi on useimmiten Creative Commons Nimeä 4.0. Tästä voidaan poiketa, mikäli toisesta lisenssistä on erikseen sovittu Lajitietokeskuksen kanssa. Katso lisätietoa Lajitietokeskuksen aineistopolitiikasta: http://cms.laji.fi/wp-content/uploads/2015/11/Suomen-Lajitietokeskuksen-Aineistopolitiikka.pdf
Valittavina vaihtoehtoina ovat:
- CC-Zero: Käyttö on vapaata eikä aineistoon tarvitse viitata, mikä helpottaa suurten aineistomäärien käyttöä.
- CC-BY: Käyttö on vapaata, mutta ainiestoon täytyy viitata omistajan määrittelemällä tavalla.
- Public domain: Tämä koskee aineistoja, joiden tekijänoikeudet eivät ole enää voimassa, ja joiden käytämiseksi ei siksi ole mahdollista vaatia lisenssin noudattamista.
- All rights reserved: Tätä käytetään harvoissa erikoistapauksissa, kun aineiston omistajan kanssa ei ole sovittu lisenssien käytöstä. On erikseen harkittava otetaanko tällaisia tietoja lainkaan mukaan Lajitietokeskuksen järjestelmiin. (Esimerkki: Muiden museoiden tai yksityshenkilöiden omistamat näytteet, jotka ovat käyneet Luomuksessa määritettävänä, ja silloin tallennettu Kotkaan.)
Secure level (karkeistustaso): Määrää mille tasolle tiedot karkeistetaan, ellei niitä ole karkeistettu muilla perusteilla, kuten sensitiivisten lajien luettelon perusteella tai yksittäisiä näytteitä tai havaintoja salaamalla. Tasot ovat yhteneväiset sensitiivisten havaintojen karkeistustasojen kanssa. Oletuksena ei salauksia.
Valinta on perusteltava "Basis for concealment or quarantine" -kentässä. Salausperusteen koskettava koko aineistoa. "Aineisto sisältää havaintoja myös uhanalaisista lajeista" ei ole riittävä perustelu koko aineiston salaamiselle.
Quarantine in years: Tässä määritellään karanteeniaika vuosina. Karanteeniaikana aineistoa käsitellän ikään kuin se olisi karkeistettu 100x100 km2 tasolle. Viranomaiset näkevät tarkat havainnot. Muut voivat tehdä aineistopyynnön, jonka aineiston omistaja hyväksyy tai hylkää.
Valinta on perusteltava "Basis for concealment or quarantine" -kentässä. Luomuksen aineistopolitiikka rajaa karenssiajan enintään neljään vuoteen.
Basis for concealment or quarantine: Peruste salaukselle ja/tai karanteenille (esim. tutkimushankkeen nimi), peruste mahdollisille poikkeuksille aineistopolitiikasta. Pakollinen jos Secure level tai Quarantine käytössä.
Location of data: Ainakin alkuvaiheessa Kotkassa on luettelo myös kokoelmista, joiden näytteiden tietoja ei ole vielä syötetty Kotkaan vaan ne ovat olemassa jossakin erillisessä järjestelmässä. Tällaisessa tilanteessa tallennetaan kokoelman tietoihin, missä kyseinen data sijaitsee. Tässä kätevintä olisi syöttää tietojärjestelmän nimi, jossa digitoitu data sijaitsee (esim. "Kotka"). Jos data sijaitsee vaikkapa mikrotietokoneella, tästä kuvauksesta on hyötyä vain jos datan voi sen perusteella löytää. Esim "taulukko omalla korpulla" ei ole hyödyllinen, mutta "excel-taulukko kokoelma.xls Kaarina Kuraattorin verkkolevykansiossa" on jo huomattavasti käyttökelpoisempi.
Location of collection: Kokolman fyysisten näytteiden sijainti. Talon tai huoneen numeron tarkkuudella pitäisi riittää.
Person responsible: Henkilö, joka vastaa kokoelmasta, jolla on valta päättää kokoelman kartuttamisesta, säilytyksestä sekä kokoelmatiedon julkaisemisesta. Anna nimi muodossa "Sukunimi, Etunimi".
Contact email: Aineiston yhteyshenkilön sähköpostiosoite. Sähköposti voi olla henkilökohtainen tai yleinen yhteysosoite, josta tavoittaa aineiston vastuuhenkilön. Täytä toimivassa muodossa @-merkkiä käyttäen.
Citation recommendation: Suositus millaisella lähdeviitteellä aineistoon tulisi viitata esim. tieteellisissä artikkeleissa. Tämä näytetään aineistoja käyttäville henkilöille. Voidaan jättää tyhjäksi, jos viittaaminen on selkeää aineiston muiden tietojen (etenkin omistaja-organisaatio, nimi ja lyhenne) perusteella tyyliin "Luomus - Vascular Plant Collection (H)".
URL: Jos kokoelmasta on lisätietoa verkossa, lisää tähän osoite. (Esim. Talvilintulaskennan etusivu, jolla kuvataan menetelmät ja linkitetään tuloksiin, tai Mannerheimin kokoelman historiikki.)
Data quality: Kokoelman sisältämän datan laadun arviointi "tähdillä". Korkeampi luokitukseen päästäkseen pitää täyttää kaikkien alempien tasojen laatuvaatimukset.
- NA = Kokoelma ei sovellu arvioitavaksi, esim. koska on juurikokoelma, joka ei sisällä näytteitä
- 1 tähti = Ei laatuvaatimuksia: tietoja kerätään keneltä tahansa, luotettavuutta ei arvioitu, voi sisältää mitä tahansa (esim. Löydös)
- 2 tähteä = Tietoja kerätään kevyesti tunnistetuilta henkilöiltä (esim. rekisteröityminen vaaditaan), väärinkäyttötapauksia tai virheitä poistetaan kun niitä huomataan. (esimerkki: Hatikka, koululaisnäytteet)
- 3 tähteä = Kertyviä tietoja tarkistetaan systemaattisella tavalla osaavien harrastajien toimesta, mutta virheet voivat jäädä huomaamatta, ja etenkin tuoreet tiedot voivat sisältää virheitä (esimerkki: Tiira)
- 4 tähteä = Tietoja kerätään vain tunnetuilta henkilöiltä (esim. henkilö on tuttu, erikseen hyväksytty osallistujaksi, pankkitunnistettu tms.), kaikki tiedot tarkistetaan ja korjataan systemaattisella tavalla osaavien harrastajien toimesta, uusia tietoja ei lisätä ilman tarkistusta (esimerkki: harrastajien kokoelmat)
- 5 tähteä = Kaikki tiedot ovat ammattilaisen kirjaamia tai tarkistamia. (esimerkki: ammattilaisten kokoelmat, museokokoelmat)
- n = (uusia luotettavuustasoja voidaan luoda tarvittaessa, esim. vertaisarvioiduille tiedoille tms.)
Status of metadata -kenttä päivittyy automaattisesti sen mukaan mitä tietoja täytetty (EI VIELÄ AUTOMATISOITU)
- preliminary = vain pakolliset kentät täytetty
- satisfactory = pakollisten lisäksi täytetty size, digitized ja type specimens, location of data, location of collection, data quality, citation recommendation
- good = edellisten lisäksi täytetty methods, coverage-kentät (3 kpl)
- excellent = edellisten lisäksi täytetty ruotsinkielinen nimi ja kuvaus, language
Tarvitaanko suositusta jaottelusta kotimaisiin ja ulkomaisiin kokoelmiin? Nyt tässä on vaihtelua Luomuksen sisällä: joissakin tiimeissä tämä jaottelu on toteutettu dataseteillä (esim. Eläinkuntatiimi), joissakin kokoelmilla (Sienitiimi; Fennoscandiae orientalis ja externi -kokoelmat).