FMNH2008 käsikirja

Last modified by hpkoivul@helsinki_fi on 2024/02/07 06:49

FMNH2008 skeman soveltamisen yleiset periaatteet

FMNH2008 on muunnos kokoelmatietojen siitämiseen kehitetystä ABCD-skemasta (Access to Biological Collections Data) eli tietomallista. Kaikki aineiston tiedot sovitetaan tietomalliin, jossa on mahdollista luokitella aineisto useamman tason hierarkioiksi. Ylimmän tason aineistokohtainen metadata muodostetaan EML-profiilin (Ecological Metadata Language) mukaan ja varsinainen aineisto jaetaan tarpeen mukaan eriin (DataSet), joita koskevat samat (aineiston sisällä mahdollisesti vaihtelevat) keruutiedot. FMNH2008-skemassa on huomioitu erityisesti havaintoaineiston tallettamiseen liittyvät haasteet, mutta sen mukaisesti voidaan yhtä hyvin tallettaa myös kokoelma-aineistoja tai muuta ekologista tutkimusmateriaalia. Alkuperäisen ABCD-skeman kaikki tiedot on sidottu kokoelmayksilöön (Unit), jolloin koko tiedostoa tai havaintoerää koskeva menetelmä, paikka ja olosuhdetieto täytyi toistaa jokaisen yksikön kohdalla erikseen. FMNH2008 skemassa nämä "keruutiedot" voi antaa yhteisesti koko erälle ja tarvittaessa yksilöidysti tarkemmin myös yhdelle Unitille kerrallaan.

EML - Ecological metadata

Koko aineistoa koskevat metatiedot annetaan EML-muodossa, siten että niitä voi hakea GBIF:n dataportaalin kautta ja ne kirjautuvat myös LTKM:n aineistoportaalissa (vaikka itse aineisto ei olisikaan julkinen).

GML - Geospatial metadata

Paikkatietojen tallettamisessa tulisi huomioida myös INSPIRE-direktiivin velvoitteet paikkatietojen metatiedon julkisuudesta. Päivitetty JHS 162 suositus muotoilee paikkatietojen välittämiseen tarvittavat metatiedot, jotka annetaan GML-muodossa (Geological Metadata Language). Vanhoissa aineistoissa suosituksen noudattaminen on usein mahdotonta, silloin olisi toivottavaa eritellä alkuperäiset tiedot mahdollisimman kattavasti siten, että mukana säilyy alkuperäinen tieto käytetystä koordinaattijärjestelmästä sekä annetujen koordinaattien tarkkuudesta (sekä muista talletuksessa noudatetuista käytännöistä).

Paikkatietojen tallettamisessa on lisäksi tärkeää huomioida alkuperäisen tiedon mahdollismman tarkka dokumentoiminen. Alkuperäinen (etikettiin tai muuhun alkuperäisaineistoon kirjattu) paikannimistö on syytä säilyttää ja sen rinnalla pitää yllä nykyistä versiota uusista paikannimistä, esim. muuttuneesta kuntanimestä. Uutta aineistoa tuotettaessa tulee kirjata metatietoihin aineistossa käyetyn paikannimistön lähdeviite (esim. maannimistössä ISO 3166 standardi) ja kieli. LTKM:n tietojärjestelmien hauissa pyritään tulevaisuudessa käyttämään ontologiapohjaista paikannimistöä, joka mahdollistaa muuttuneiden paikannimien hakemisen eri aikakausilta. Paikannimiä eri aikakausilta voi hakea jo nyt yksitellen Suomen Ajallisen Paikkatieto-ontologian (SAPO) Onkipaikka-palvelusta. Globaalit paikannimet löytyvät ...

Muut muuttujat

Varsinainen aineisto syötetään FMNH2008 (ja samalla Darwin Core:n) mukaisina muuttujina xml-muotoon. Silloin kun skemasta ei löydy paikkaa muuttujalle, voidaan käyttää MeasurementOrFact ja sen Parameter muuttujaa, joko Dataset- tai Unit-tasolla. Parameter nimenä käytetään mahdollisuuksien mukaan jotakin määriteltyä sanastoa ja arvojoukko tai muuttujan yksikkö dokumentoidaan (myöhemmin ilmoitettavalla tavalla). 

Havainto tai aineistoerää koskevat faktat tai "mittaustiedot" talletetaan Gathering/MeasurementOrFact tai Unit/Gathering/MeasurementOrFact kohtiin. Parameter määrittelee muuttujan (sarakenimi) ja LowerValue arvon, mikäli kyseessä ei ole arvoväliä. Aina, kun on mahdollista pyritään käyttämään standardoitua sanastoa, jotka voidaan määritellä metadatassa kohdassa eml-protocol module.

Aineistoerää koskevat tiedot

  • Tiedosto(nimi) ja versiointi(numero? järjestelmästä)
  • Aineiostoerää (Dataset-taso) koskeva metadata (eri tasot eri kohtiin skeemaa)

DataSets/DataSet

Units/Unit

  • Unit = Aineiston perusyksikkö tai "rivi", sisältää yhteen havaintoon tai kokoelmayksilöön liittyvät tiedot
  • RecordBasis-elementin arvo kokelmanäytteillä on "PreservedSpecimen"
  • Notes-elementtiin voi jättää alkuperäiset merkinnät

UnitGUID

Ensimmäistä XML-tidostoa työstetttäessä käytetään <UnitDUID>?</UnitDUID>. Tällöin tietovarastokantaan syötettäessä ?-merkin tilalle generoituu pysyvä GUID. Kahdessa eri DataSet-erässä EI saa olla samaa GUIDia!

TechnicalContacts

ContentContacts

Metadata

  • Representation-elementin language-attribuutti on pakollinen. Ko. arvo ei viittaa itse dokumentin kieleen vaan metadatan kieleen, jona voimme käyttää aluksi suomea, jolloin siinä voi olla arvona "fi"
  • Version/Major-elementin arvoksi alussa 1. Numero muttuu sitten kun arkistoituja dokumentteja päivitetään
  • RevisionData-elementtiin tulee kaksi aikaleimaa sekunnin tarkkuudella. Ekassa versiossa DateCreated ja DateModified ovat sama arvo. Tarkan kellonajan voi ravistaa hihasta, kunhan päiväys on oikea
  • SourceID-elementtiin tulee kuvatiedoston nimen alkuosa. Erän tunniste loppuun lisätyn aakkosten kirjaimen kanssa tulee Title-elementtiin
  • DateText-elementtiin tulee näytteenoton päiväys. Epämääräiset ilmaukset tulkitaan sopivasti. Esim. "omkring 10 juni" voitaisiin tulkita +-10 päivää eli 1-20.6
  • NamedAreas-elementtiin kirjataan paikannimet. Jos ei ole selvää, minkätyyppinen paikannimi on kyseessä, AreaClass-elementin voi jättää pois
  •  

SourceInstitutionID

  • LTKM tai Luomus? Rekisteröinti kansainvälisesti?

SourceID

  • Uniikki nimeämiskäytäntö
    • Esim. Kladikirjan kuvanumeron alku-aakkostus (sivun sisällä alkavan keruuerän kirjain)

NamedCollectionsOrSurveysNamedCollectionOrSurvey

  • Erän tunnus (Esim. LSID-nimiavaruuden tunniste-)

http://digit.luomus.fi/node/

DataSet/Metadata/

  • TaxonomicTerm (esim. Coleoptera)

Gathering/Code

Aineiston tai keruuerän sisäinen numerointi

Alempia Unit:eja koskeva aikatieto (Ajanjakso)

  • Date text (mm. Fieljournal käyttää tätä muotoa)
  • Time Zone
  • ISODate Time Begin
  • Day Number Begin
  • Time Of Day Begin
  • ISODate Time End
  • Day Number End
  • Time Of Day End
  • Period Explicit (koskeeko havainnoiti koko ajanjaksoa)

Gathering/Agents

Miten merkitään museonäytteissä alkuperäinen kerääjä ja/tai jälkikäsittelijä (esim. digitoija)?

Owner

Nimet kirjataan "Sukunimi, Etunimi" muodossa

Units/Unit/

  • UnitGUID
  • CollectorsFieldNumber

Metadata/ContentMetadata

Paikkatieto ja koordinaatit

Koordinaattien merkitseminen

Gathering/SiteMeasurementOrFact/MeasurementOrFactAtomized

  • <Parameter> valitaan koordinaatiston tyyppi CoordinatesLatLong tai CoordinatesGrid.
  • Pakollinen <LowerValue> sisältää varsinaisen koordinaatin muodossa... (Miten merkataan ja varmistetaan että lat ja long ovat oikein päin? => XXX,YYY ja ns. MapInfo ongelma globaaleissa aineistoissa)
  • <Accuracy> tiedon tarkkuudesta tai muun huomautuksen, esim. myöhemmin muunneltu, ristiriitainen ect. (Kastikan huomautuskoodit soveltuvin osin?) Miten erotetaan useampi eri huomautus? Esim. myöhemmin korjattu tai ristiriitainen?
  • <AppliesTo> Target/Observer
  • <UnitOfMeasurement>
    • FI KKJ27
    • WGS84
    • ??? Mitä muita?

Paikannimet

Unit/NamedAreas/NamedArea

  • <AreaClass>Country</AreaClass>
  • <AreaName>Finland</AreaName>

Lista AreaClass yksiköistä:

  • Undefined
  • BiologicalProvince
  • ContinentOcean
  • Country
  • County
  • Island
  • IslandGroup
  • StateProvince
  • StreetAddress
  • Suburb
  • Village
  • WaterBody
  • WaterBodyPart
  • Other

Nimistö

Havainnon määritystieto

Havainnolle "lennossa" annettu lajinimi talletetaan Unit/MeasurementsOrFacts/MeasurementOrFact/MeasurementOrFactAtomised siten, että:

  • <Parameter>*InformalNameString</Parameter>*
  • Pakollinen <LowerValue>Tieteellinen lajinimi</LowerValue>

Näyteyksilön määritys tai minkä tahansa määrityksen korjaus

Myöhemmin määritetyt tai näytteiden "muutettavissa olevat" määritykset kirjataan aikaisemmin Unitin alla skemassa olevaan

  • Identifications/Identification kohtaan, jossa voidaan eritellä tarkemmin itse määritystapahtumaa ja myöhemmin tehtyjä muutoksia.
    • Result/TaxonIdentified/ Tieteellinen nimi (NULL kohdat tyhjäksi)
    • Identifier/PersonName/FullName Sukunimi(etuliite), Etunimet
    • Notes UnsertainIdentification ja VerifiedIdentification (Mitä eri statuksia tarvitaan ja mihin ne lisätään eri tasoilla? => Sovelletaan valmiiksi mietittyjä Kastikan huomautuskoodit?)

Kansankieliset nimet??

Ympäristömuuttujat

  • Biotooppi/Habitaattiluokitukset
    • Valmiiksi määritellyt
      • MH Yleispiirteinen habitaattiluokitus
      • Eunis
      • CORINE
      • IUCN luokitusta varten Suomen kattava
    • Omat
      • Voiko muodostaa omia hierarkioita? Onko niistä hyötyä?
  • Biotope/MeasurementsOrFacts/MeasurementOrFactAtomised
    • Parameter
      • Oma Biotooppiluokitus (miten ilmaistaan?)
      • LowerValue varsinainen "arvo" auki kirjoitettuna
      • Kieli?
  • Gathering/Biotope/ClassificationScheme

Määrälliset tai laadulliset muuttujat

  • MeasurementOrFact

Aineiston keruuseen liittyvä tieto

  • Gathering/Agents/GatheringAgent
    • Käytetäänkö text vai eriteltyä muotoa?
  • Gathering/Method
    • Alkuperäisellä kielellä vai skemassa määritellyin tiedoin?