Paikkatieto
Vanhoihin museonäytteisiin on tyypillisesti merkitty paikkatietona vain keruupaikan sanallinen kuvaus, joka voi vaihdella tarkasta hyvinkin epämääräiseen. Paikkatietojen sisältö ja luonne vaihtelee huomattavasti eri laitosten ja tutkimusalojen välillä (Wieczorek ym. 2004) sekä riippuen näytteen iästä (Utriainen ym. 2006 ja omat havaintoni). Jotta paikkatietoa voitaisiin käsitellä automaattisesti GIS-ohjelmilla (esim. sijoittaa kartalle tai tehdä paikkatietoon pohjautuvia analyysejä), tarvitaan tieto paikan koordinaateista. Koordinaattien avulla paikka voidaan määritellä yksiselitteisesti, kunhan huomioidaan myös koordinaattijärjestelmäja datum (Wieczorek 2001b, Wieczorek ym. 2004, Chapman & Wieczorek 2006).
Koordinaattijärjestelmä ja datum
Termien koordinaattijärjestelmä (coordinate system), koordinaattireferenssijärjestelmä (coordinate reference system), datum (datum) ja ellipsoidi (ellipsoid) määritelmät menevät päällekkäin ja vaihtelevat hieman lähteestä riippuen (esim. Wieczorek ym. 2004, Kuittinen 2006, Maanmittauslaitos 2006, Spencer ym. 2006, Saarenmaa ym. 2008, U.S. Navy julkaisuaika tuntematon) tai jopa saman lähteen sisällä (esim. Chapman & Wieczorek 2006). Tässä käytetään Wieczorekin ym. (2004), Spencerin ym. (2006) ja Wieczorekin ja Chapmanin (2006) käyttämää määritelmää. Määritelmä on yksinkertaistus todellisuudesta, mutta riittää digitoinnin tarpeisiin. Tässä määritelmässä luonnon ja koordinaattien välillä on vain kaksi väliporrasta: datum ja koordinaattijärjestelmä.
Koordinaattijärjestelmiä ovat mm. astekoordinaatisto (eli maantieteellinen koordinaatisto), UTM sekä suomalaiset yhtenäis- ja peruskoordinaatistot. (Chapman & Wieczorek 2006, Maanmittauslaitos 2006, Spencer ym. 2006). Näistä astekoordinaatit ovat suositeltavimpia, koska niitä voi käyttää kaikkialla maailmassa. Astekoordinaatit voidaan ilmoittaa kolmessa eri muodossa:
Astekoordinaatit voidaan ilmoittaa kolmessa eri muodossa:
- desimaaliasteina, lyhenne dd (decimal degrees)
- asteina ja desimaaliminuutteina, lyhenne ddm (degrees, decimal minutes)
- asteina, minuutteina ja desimaalisekunteina, lyhenne dms (degrees, minutes, seconds)
Desimaaliasteet ovat suositeltavimpia, koska niiden käsittely on teknisesti helpompaa (vähemmän lukuarvoja) ja tätä muotoa käytetään useimmin GIS-ohjelmissa (Spencer ym. 2006).
Koska maapallo ei ole täsmälleen pallomainen, koordinaattijärjestelmät perustuvat maapallon pinnanmuotoja kuvaavalle matemaattiselle mallille, jonka datum käytännössä ilmoittaa (Wieczorek ym. 2004, Kuittinen ym. 2006, Maanmittauslaitos 2006). Eri puolilla maailmaa on käytössä erilaisia datumeja, joiden perusteella määritetyt koordinaatit eroavat toisistaan huomattavasti (Wieczorek 2001b, Wieczorek ym. 2004, Chapman & Wieczorek 2006, Spencer ym. 2006, U.S. Navy julkaisuaika tuntematon). Eroavuudet vaihtelevat sijainnin mukaan. Esimerkiksi datumien NAD27, NAD83 ja WGS84 välillä on 0-3552 metrin virhe, riippuen paikasta (Wieczorek ym. 2004). Jotta tällaista virhettä ei syntyisi, myös datum tulee merkitä myös muistiin.
Astekoordinaateissa yleisesti käytettäviä datumeita ovat mm. yleismaailmallinen WGS84 ja yhdysvaltalainen NAD27 (Wieczorek ym. 2004). WGS84 on suositeltavin datum, koska GPS-laitteiden toiminta perustuu siihen (Saarenmaa ym. 2008). Tällöin koordinaattimuunnoksista ei synny virheitä (Spencer ym. 2006, Chapman & Wieczorek 2006). Suomalainen EUREF-FIN -datum eroaa WGS84:sta suurimmillaankin alle metrin, joten käytännössä sitä voidaan pitää WGS84:n kanssa yhteneväisenä (Kuittinen ym. 2006, Maanmittauslaitos 2006, Maanmittauslaitos 2007).
Muistiin on siis merkittävä
- Koordinaatit mahdollisimman tarkasti
- Koordinaattijärjestelmä
- Datum, jos se ei selviä koordinaattijärjestelmästä (esimerkiksi yhtenäiskoordinaattien datum on aina Kansainvälinen 1924, astekoordinaateilla käytettäviä datumeja on vähintään kymmeniä)
Esimerkiksi Helsingin Luonnontieteellisen museon sijainti voidaan ilmoittaa näin (koordinaatit Maanmittauslaitoksen Kansalaisen karttapaikasta 4.4.2008):
- 6675106 3385345 (järjestelmä: yhtenäiskoordinaatisto)
- 6673680 2551873 (järjestelmä: peruskoordinaatisto)
- 6672304 385222 (järjestelmä: EUREF-FIN metrit/ETRS-TM35FIN, datum: EUREF-FIN)
- 60.171288 24.934433 (järjestelmä: dd, datum: Kansainvälinen 1924)
- 60.171458 24.931278 (järjestelmä: dd, datum: EUREF-FIN)
- 60° 10' 17.25'' 24° 55' 52.602'' (järjestelmä: dms, datum: EUREF-FIN)

Kuva 11: Karttaan on merkitty koordinaattien 60.171458 24.931278 osoittama paikka. Piste A saadaan, jos koordinaatit tulkitaan EUREF-FIN-koordinaateiksi ja piste B jos koordinaatit tulkitaan Kansainvälinen 1924 -datumin mukaisiksi kartastokoordinaateiksi. Ero voi olla merkittävä, jos koordinaatteja käytetään pienialaisen kohteen (esim. yksittäinen puunrunko) etsimiseen. (Pohjakartta Openstreetmap, käyttö Creative Commons Attribution-Share Alike 2.0 Generic -lisenssillä. Pisteiden sijainnit Kansalaisen karttapaikasta 4.4.2008)
Omien havaintojeni ja Ritva Talmanin (keskustelu, 27.3.2008) mukaan koordinaattijärjestelmää ja datumia ei yleensä ole merkitty näytteiden yhteydessä oleviin koordinaatteihin. Niiden käyttö olisi kuitenkin suositeltavaa (näytteiden yhteydessä tai metatiedoissa), ainakin jos koordinaateilla esitetään tarkka keruupaikka (kuten Saarenmaa ym. (2008) suosittelevat).
Georeferencing: koordinaatit vanhoihin näytteisiin
Koordinaatit voidaan selvittää jälkikäteen paikannimen perusteella. Prosessia, jossa koordinaatit selvitetään, kutsutaan englanninkielisellä nimellä georeferencing. Tässä työssä käytän termiä georeferointi. Esittelen pääpiirteet Wieczorekin ym. (2004), Spencerin ym. (2006) ja Wieczorekin ja Chapmanin (2006) esittelemistä biologisten näytteiden georeferointiohjeista. Ohjeet kattavat valtaosan näyte-, havainto- ja ekologisten aineistojen erilaisista paikkakuvauksista. Ohjeet ovat ensimmäiset perusteelliset ohjeet kuvailevien paikkatietojen georefereoimiseksi ja ovat käytössä tai niitä ollaan ottamassa käyttöön museonäytteiden georeferoinnissa useissa paikoissa ympäri maailmaa (Wieczorek ym. 2004, Spencer ym. 2006). Spencer ym. (2006) suosittelevat että georeferointi aloitettaisiin tärkeimmistä näytteistä, kuten tyyppinäytteistä.
Georeferointiprosessi etenee vaiheittain seuraavasti:
- Luokittele paikkakuvaus
- Määritä
- koordinaatit ja datum
- laajuus
- maksimivirhe
- Dokumentoi prosessi
Paikkakuvauksen luokittelu ja koordinaattien määritys
Ensin täytyy arvioida, voiko paikkakuvausta muuttaa koordinaateiksi. Näytettä ei pidä georeferoida, jos paikkakuvaus on epämääräinen tai selvästi virheellinen, sitä ei voida paikantaa, tai se koskee vangittua eläintä tai viljeltyä kasvia (Chapman & Wieczorek 2006, Spencer ym. 2006). Wieczorek (2001b) sekä Chapman ja Wieczorek (2006) esittävät perusteellisen luokituksen erilaisista paikkakuvauksista ja niiden georeferoinnista.
Georeferoinnissa tulee käyttää paikkakuvauksen tarkinta mahdollista osaa. Esim. kuvauksen "Vantaanjoen ylittävä rautatiesilta, Savela, Helsinki" koordinaatit tulee ottaa sillan kohdalta. Jos siltaa ei voida paikantaa, paikannetaan seuraavaksi tarkin paikkakuvaus (esim. Savela) tai niiden yhdistelmä (esim. Savelassa oleva Vantaanjoen osa) (Chapman & Wieczorek 2006, Spencer ym. 2006). Tietolähteinä kannattaa mahdollisuuksien mukaan käyttää karttoja tai paikannimiluetteloita siltä ajalta, jolloin näyte on kerätty. Paikannimet voivat siirtyä tai niiden rajat ja nimet muuttua.
Prosessi voidaan automatisoida helpommin, jos pienempi tarkkuus riittää. Esimerkiksi jos on käytettävissä kuntien keskipisteiden koordinaatit ja laajuusmitat siltä ajalta jolta näytteet on kerätty, ja kunta on nimetty näytteissä, voidaan tämän perusteella määrittää karkea sijainti automaattisesti. Tätä menetelmää käytetään mm. Luonnontieteellisen keskusmuseon Hatikka -järjestelmässä koordinaatittomien havaintojen sijoittamisessa karttapohjalle kuntanimen perusteella (Tapani Lahti, keskustelut 2006-2007).
Keruualueen laajuus
Koska sanallinen tieto paikasta ei useinkaan ole aivan tarkka, koordinaattien esittämä pistemäinen sijainti ei kerro koko totuutta. Tarvitaan siis tapa esittää sijaintitiedossa mahdollisesti piilevä epätarkkuus tai se, että koordinaatit ovat tarkat. Jos epätarkkuuden suuruutta ei tiedetä, ei tunneta myöskään koordinaattien käyttökelpoisuutta erilaisissa analyyseissä (Wieczorek ym. 2004).
Yksinkertainen ja käytännöllinen tapa ilmoittaa koordinaattien epätarkkuus on esittää koordinaattien lisäksi säde, jonka määräämän ympyränmuotoisen alueen sisältä näyte on varmasti kerätty. Ympyrän laajuus (extent) mitoitetaan niin suureksi että alkuperäinen keruualue tulee varmasti sen sisälle (Wieczorek ym. 2004, Chapman & Wieczorek 2006). Esimerkiksi jos paikka on ilmoitettu ainoastaan kunnan nimenä, voidaan tästä laskea Kauniaisten kunnalle laajuudeksi muutama kilometri ja Enontekiön kunnalle satoja kilometrejä. Kun laajuus on tiedossa, voidaan aineistoista suodattaa pois ne näytteet, joiden paikkatieto on liian epätarkkaa tekeillä oleviin analyyseihin (Wieczorek ym. 2004).
Monimutkaisempi mutta tarkempi tapa keruualueen ilmaisemiseen on piirtää vapaamuotoinen monikulmio ja merkitä muistiin sen kulmien koordinaatit. Monet näytetietokannat eivät kuitenkaan mahdollista tällaisen tiedon tallentamista. Lisäksi tiedon tallentaminen on hidasta ja käsittely teknisesti monimutkaista, eikä näin tarkkaa paikanmääritystä välttämättä tarvita usein. Monikulmioiden käyttöön mentäneen kuitenkin tulevaisuudessa (Chapman & Wieczorek 2006, Spencer ym. 2006). Jos sijainti tällöin halutaan esittää pistemäisesti esim. ikonin avulla, täytyy monikulmiosta joka tapauksessa määrittää pistemäinen sijainti. Myös epätarkkuudelle täytyisi tällöin määrittää indeksi, jotta tarvittaessa tarkat tiedot voitaisiin automaattisesti poimia analyyseihin epätarkempien joukosta.
Georeferoinnissa voitaisiin myös periaatteessa määrittää alue useiden monipulmioiden ryhmänä, jos paikannimi voi tarkoittaa useaa paikkaa. Tällä tavalla saataisiin digitoitua tarkimmalla mahdollisella tavalla esimerkiksi käsite "Pyhäjärvi, Suomi" (suomessa on Kansalaisen karttapaikan mukaan 48 Pyhäjärvi-nimistä paikkaa (25.3.2008)).
Virhearviointi
Tuntemattoman koordinaattijärjestelmän ja datumin lisäksi virheitä georeferointiprosessissa aiheuttavat yleisimmin seuraavat tekijät (Chapman & Wieczorek 2006, Spencer ym. 2006):
- etäisyysmitan ja suunnan epätarkkuus
- georeferoinnissa käytettävän kartan mittakaava
- kartalta katsottavien koordinaattien epätarkkuus
Georeferointiohjeiden (Wieczorek 2004, Chapman & Wieczorek 2006, Spencer ym. 2006) ja etikettisuositusten (Wheeler ym. 2001) perusteella vaikuttaa siltä, että englanninkielisessä maailmassa on yleistä ilmaista keruupaikka suuntana ja etäisyytenä nimetystä paikasta (esim, "5 mi NE of Portal, AZ"). Tällöin keruupaikan sijaintitiedon tarkkuus riippuu suoraan suunnan ja etäisyyden tarkkuudesta.
Kaikki virheet lasketaan yhteen, jolloin saadaan selville maksimivirhe (maximum error distance). Tämän voi suoraan laskea yhteen laajuusarvon kanssa. Helpoimmin maksimivirheen voi määrittää Georeferencing-laskukoneen avulla (Wieczorek 2001a, Chapman & Wieczorek 2006). Se määrittää matemaattisesti em. virhelähteiden aiheuttamat maksimivirheet käyttäjän antamien tietojen perusteella. Käyttäjän täytyy kuitenkin ensin poimia tiedot näytteestä ja muista lähteistä (esim. kartoilta tai paikannimihakemistoista) ja arvioiden niiden tarkkuudet. Maksimivirheet voi myös laskea itse Wieczorekin ym. (2004) sekä Chapmanin ja Wieczorekin (2006) ohjeiden mukaan.
Dokumentointi
Georeferointiprosessin dokumentointi on tärkeää, jotta tuloksia ja niiden laatua voidaan myöhemminkin arvioida ja tietolähteisiin palata. Prosessin aikana on dokumentoitava tehdyt tulkinnat ja käytetyt menetelmät (Wieczorek ym. 2004, Chapman & Wieczorek 2006).
Paikkatiedon tallennus
Kaikki georeferoinnissa saadut tiedot eivät mahdu pienille näyte-etiketeille, mutta ne voidaan helposti liittää näytetietokantaan. Chapman ja Wieczorek (2006) suosittelevat että tietokannassa olisi ainakin seuraavat kentät:
- Koordinaatit desimaalimuodossa
- Datum
- Laajuusarvio
- Laajuuden mittayksikkö
- Koordinaatit alkuperäisessä muodossa
- Alkuperäinen koordinaattijärjestelmä
- Tieto onko georeferointi varmistettu
- Käytetyt varmistusmenetelmät
- Käytetyt georeferointimenetelmät
- Käytetyt lähteet
- Alueellinen osuvuus (spatial fit)
- Kuka tehnyt georeferoinnin
- Milloin georeferointi tehty
- Kommentit georeferointiprosessista
Alueellinen osuvuus on lukuarvo väliltä 0-1, joka kertoo kuinka paljon oikea keruualue sekä tulkittu laajuuden ja maksimivirheen määrittelemä ympyränmuotoinen alue vastaavat toisiaan (Chapman ja Wieczorek 2006).
Tyyppinäytteiden georeferointi käytännössä
Tyyppinäytteillä paikkatieto on tärkeää jos halutaan kerätä lisää näytteitä tyyppipaikalta, esimerkiksi neotyypiksi (ICZN 1999, keskustelu 10.3.2008, Gunilla Ståhls). Paikkatieto voi olla merkittävää myös silloin, jos tyyppinäyte on kerätty eri paikasta kuin kaikki muut ko. lajin näytteet (keskustelu 15.2.2008, Olof Biström). Tämä antaisi aiheen epäillä virhettä näytteiden määrityksessä tai paikkatiedossa itsessään. Muuten tyyppinäytteillä paikkatieto on samanarvoista kuin muillakin näytteillä (keskustelu 10.3.2008, Gunilla Ståhls). Koordinaatteina oleva paikkatieto muodostuu erityisen hyödylliseksi vasta kun aineisto on riittävän suuri, jolloin sitä voidaan käyttää analyyseissä (keskustelu 15.2.2008, Olof Biström).
Vanhojen näytteiden paikkatieto on usein hyvin epätarkkaa (keskustelut 5.3.2007 ja 11.2.2008, Jyrki Muona, esimerkkejä Muonan (2000) julkaisussa). Mannerheimin kokoelmassa ainoa paikkatieto jää usein valtion tasolle tai on vaikeasti tulkittava (esim. "Ind.or.", ks. lisää liitteestä 4). Kokoelmassa ei myöskään ole käytetty suunta- ja etäisyyspohjaisia paikkakuvauksia. Saattaa olla, että suomalaisissa näytteissä käytetään yleisestikin pelkkiä paikannimiä suuntien ja etäisyyksien sijasta. Tämä merkitsisi että paikannimet pitäisi tulkita laajemmin kuin Chapmanin ja Wieczorekin (2006) ja Wieczorekin (2004) ohjeet neuvovat.
Näiden syiden takia georeferointi ei ole välttämätöntä tyyppinäytteitä digitoinnin yhteydessä. Tästä syystä näytetietoluettelossa (Liite 3) on mukana em. kenttien sijasta vain georeferointitiedon peruskentät: koordinaatit, järjestelmä, datum, laajuus ja metatiedot. Georeferointi voidaan tehdä myöhemmin, kun käytössä on valmiiksi digitoitu aineisto. Tällöin georeferointia voidaan tehdä liukuhihnatyönä, jolloin se voi sujua nopeammin ja virheettömämmin (Chapman 2005b). Georeferointia voidaan tehdä myös vain tarvittaessa näyte kerrallaan. Työssä kannattaa käyttää tervettä järkeä. Ohjeita voi soveltaa, jos se on tilanteessa selkeästi tarpeen (Chapman & Wieczorek 2006), esimerkiksi, jos näytteiden kerääjä on käyttänyt paikannimiä vapaamuotoisemmin kuin ohjeissa oletetaan. Laskettaessa laajuutta hyvin epätarkalle paikkakuvaukselle (esim. "Brasilia") koordinaattien epätarkkuudesta johtuvista virheitä ei kannata välittää vaan lisätä laajuuteen esimerkiksi viisi kilometriä, joka kattaa kaikki virheet. Kaikki poikkeavat menetelmät tulee kuitenkin dokumentoida.