Copy of Observations in FINBif data warehouse/Havaintojen tallennus Lajitietokeskuksen tietovarastoon (Copy)
Suomen Lajitietokeskuksen Laji.fi-portaalissa pääsee käsiksi niihin havaintoihin, jotka on koottu Lajitietokeskuksen tietovarastoon. Tietovaraston data on ns. sekundääridataa, eli kopioita erilaisissa primäärijärjestelmissä olevista aineistoista. Jos jollakin aineistolla ei ole primäärijärjestelmää, jossa sitä ylläpidettäisiin, voidaan se tallettaa johonkin Lajitietokeskuksen primäärijärjestelmään julkaisemista varten.
Muuttumattomat havaintoaineistot voidaan tallettaa Kotka-kokoelmienhallintajärjestemään tämän ohjeen mukaisesti. (Kokoemanäytteiden tallentamisesta on erillinen ohje.) Myöhemmin havainto- ja tutkimusaineistojen tallentamiseen luodaan niille paremmin mukautettuja tallennusvälineitä.
Huomaa erityisesti että kun aineisto on viety Lajitietokeskukseen primäärijärjestelmään, sitä ei enää saa muokata muualla, vaan muokkaukset tehdään aina primääridataan.
Vaiheet yleisesti:
- Aineiston talletuksesta sovitaan Lajitietokeskuksen kanssa. Ota yhteyttä osoitteeseen info@laji.fi. Aineistojen käsittelyssä noudatetaan Lajitietokeskuksen aineistopolitiikkaa.
- Aineiston metatiedot toimitetaan Lajitietokeskukselle
- Aineisto tallennetaan Excel-taulukoksi
- Aineisto muunnetaan Kotkan formaattiin
- Tietueille annetaan yksilölliset tunnisteet
- Aineisto validoidaan
- Aineisto toimitetaan Lajitietokeskukselle tallennusta varten
Metatietojen toimitus
Jokaisesta aineistosta tarvitaan vähintään seuraavat tiedot. (Tarkempia ohjeita kokoelmatietojen tallennuksesta)
- Omistaja-organisaatio
- Ylempi kokoelma, jonka osa aineisto on (esim. "Organisaation NN seurantahankkeiden aineistot")
- Nimi suomeksi ja englanniksi
- Kuvaus suomeksi ja englanniksi (muutama lause)
- Tyyppi (havaintoja, näytteitä, seuranta-aineisto, puutarhakokoelma, kirjallisuustietoja, sekalaisia)
- Datan käyttölisenssi (aineistopolitiikan mukainen ellei muuta sovittu)
- Vastuuhenkilön nimi
- Vastuuhenkilön sähköpostiosoite
- Aineiston laaturavio (1-5 tähteä, ks. Copy of Entering collection dataKokoelmatietojen tallennus (Copy))
Toimita tiedot Lajitietokeskukseen tallennusta varten.
Aineisto saa sen jälkeen yksilöllisen aineistotunnisteen, jolla siihen voi viitata. Aineistoa varten luodaan myös nimiavaruustunniste, jonka avulla tietueille voidaan luoda yksilölliset tunnisteet. Tästä on tarkempi ohje alempana.
Aineiston tallennus Excel-taulukoksi
A) Aineisto muunnetaan Kotkan formaattiin
- Lataa itsellesi Excel-tallennuspohja: Excel-generaattorilla , tai luo itsellesi monipuolisempi pohja
- Täytä pohja datalla tai luo vastaava Excel-tiedosto datalähteestäsi.
- Kaikkien kenttien tulee olla tekstimuodossa (jotta Excel ei muokkaisi dataa itsekseen)
- Excel-tiedoston ensimmäinen sarake on oleellinen ja vaikuttaa siihen miten kukin sarake tulkitaan.
- Sarakkeiden järjestys on vapaa.
- Pakolliset sarakkeet on merkitty punaisella, muut ovat vapaaehtoisia.
- Ks. lisää ohjeita tallentamisesta ja tarkat kenttäkohtaiset ohjeet
- Kirjaa Kokoelma-sarakkeeseen Lajitietokeskukselta saatu aineistotunniste
B) Tietueille annetaan yksilölliset tunnisteet
Jokaisella Kotkaan tallennettavalla havainnolla pitää olla yksilöllinen tunniste. Tunnisteen tarkoitus on yksilöidä havainto.
Kotka käyttää tunnisteita, jotka ovat ns. HTTP-URI-standardia. Esimerkki tällaisesta tunnisteesta on http://tun.fi/JAB.123 Tässä JAB on nk. "nimiavaruustunniste" ja 123 juokseva numero. HTTP-URI -tunnisteet ovat maailmanlaajuisesti yksilöllisiä. (Tunniste toimii lisäksi myös www-osoitteena, josta saa lisätietoja havainnosta.)
- Tarkemmin tunnisteista (näytenäkökulmasta)
- Luettelo varatuista nimiavaruustunnisteista
Tunnisteen kirjaamiseksi toimi näin:
- Kirjaa aineiston oma nimiavaruustunniste tallennuspohjan sarakkeeseen MyNamespaceID käyttäen etuliitettä "tun:", esimerkiksi "tun:JAB". (tun: kertoo että tunnisteen alkuosa on muotoa http://tun.fi.)
Anna havainnoille numero jommalla kummalla tavalla:
- Anna havainnoille juokseva numero sarakkeeseen MyObjectID, pitäen itse kirjaa minkä numeron olet viimeksi käyttänyt
- Käytä sarakkeessa MyObjectID datalähteen valmiita tunnistenumeroita tms. koodeja. Nämä eivät saa sisältää välilyöntejä, pisteitä, kauttaviivoja tai risuaitoja (#), eivätkä muutkaan erikoismerkit ole suotavia.
Voit myös jättää tunnisteiden luomisen Lajitietokeskukselle, mutta tällöin validointivaihe varoittaa tunnisteiden puutteesta.
C) Aineisto validoidaan
- Validoi data Kotkan validaattorilla osoitteessa https://kotka.luomus.fi/tools/import.
- Jos dataa on paljon (kymmeniä tuhansia), kannattaa niistä valita satunnainen otos validoitavaksi systemaattisten virheiden löytämiseksi.
- Jos datassa on virheitä, korjaa ne ja validoi uudelleen.
- Tarvittaessa kysy neuvoa osoitteesta kotka@luomus.fi
Aineiston toimitus Lajitietokeskukselle
Toimita Excel-tiedoston Lajitietokeskukselle, joka tallentaa datan Kotkaan. Jos tiedot ovat arkaluontoisia, voidaan tiedot toimittaa esim. henkilökohtaisesti.
--------------------------------------------------------------------
Ohjeita Lajitietokeskukselle
Muistilista Lajitietokeskukselle tallennusta varten:
- Anna kullekin tallennuserälle datasettitunniste
- Vie tallennuspohja Kotkaan import-toiminnolla
- Kirjaa datan Kotkaan transaktiona, mikäli siitä halutaan pitää tarkemmin kirjaa.
- Testaa
- Tiedota aineiston toimittajaa prosessin valmistumisesta
- Arkistoi mahdolliset sopimukset