Tunnisteet
Jotta näytteet ja niitä vastaavat digitoidut tiedot voitaisiin luotettavasti yhdistää, on kukin näyte merkittävä yksilöllisesti. Tämä tehdään liittämällä näytteisiin yksilöllinen tunnistenumero- tai merkkijono (tai lyhyemmin tunniste). Näytetietoja voidaan käsitellä myös ryhminä. Erityisesti hyönteisnäytteiden tietoja käsitellään usein ryhminä ajan säästämiseksi, koska aineistot ovat monesti suuria (Mayr & Ashlock 1991). Tällöin yhdeltä paikalta yhtä aikaa kerättyjen näytteiden näytetiedot tallennetaan tietokantaan yhtenä tietueena ja ryhmälle voidaan antaa yhteinen tunniste.
Nimeä kantavista tyypeistä holo-, lekto- ja neotyyppi ovat aina yksi yksilö. Siksi jokainen niistä on digitoitava yksilönä ja tarvitsee siten oman tunnisteensa. Syn-, para ja paralektotyypeillä tätä kannattaa arvioida tapauskohtaisesti.
Tunniste voi yksinkertaisimmillaan olla kokoelman sisäinen juokseva numero. Tästä voi kuitenkin aiheutua ongelmia, jos aiemmin erillään olleita kokoelmia käsitellään yhdessä: sama tunniste voi olla kahdella näytteellä, jolloin niihin liittyvät tiedot menevät sekaisin. Jotta tunnisteita voitaisiin käyttää näytteiden yksilöimiseen luotettavasti kaikissa tilanteissa, tunnisteiden on oltava yksilöllisiä koko maailman mittakaavassa (etenkin tyyppinäytteitä käytetään paljon kansainvälisesti). Tällaisten tunnisteiden luomiseen on olemassa useita tekniikoita, joista LSID-standardi (Life Sciences Identifier) on erityisen käytetty biologiassa (TDWG 2006a, b). Digitoidessani näytteitä liitin niihin LSID-tunnisteentekstinä ja viivakoodina (Kuva 6). Se toimii samalla merkkinä että näyte on digitoitu. 
Kuva 6: Julodis faldermannin lektotyyppi Mannerheimin kokoelmasta ja sen etiketit. Viivakoodietiketissä on näytteen LSID-tunniste. Punainen etiketti kertoo että tämä näyte on designoitu lektotyypiksi. Nimen ja vuosiluvun (Volkovitsh 1993) perusteella voi etsiä artikkelia, jossa designaatio on tehty.
Tunnisteiden monta roolia: tyhmät ja älykkäät tunnisteet
Tunnisteen (engl. identifier) tarkoituksena on toimia kohteensa nimenä. Kohde voi olla lähes mikä tahansa todellinen tai abstrakti asia, mutta ajatellaan tässä kohteena yksittäistä museonäytettä. Kun nimi on yksilöllinen, eli kun kahdella näytteellä ei ole samaa nimeä, kaikki tietävät aina täsmällisesti mistä museonäytteestä puhutaan. Nimen avulla näyte voidaan luotettavasti yhdistää tietoihin, jotka siitä on tallennettu tietokantaan (esim. keruupaikka, päivämäärä jne...).
Nimen pitäisi olla yksilöllinen koko maailman mittakaavassa (engl. globally unique). Tämä on oleellista silloin kun tietoja eri museoiden kokoelmista käytetään yhdessä, kuten nykyään yhä enemmän tehdään. Muuten voi käydä että kaksi eri museota käyttää samaa tunnistetta (esim. A1574) omista näytteistään. Maailman mittakaavassa yksilöllisten tunnisteiden luomiseksi on olemassa useita erilaisia menetelmiä. Nimenä toimimisen lisäksi tunnisteella ei tarvitse olla mitään muuta tehtävää.
Tämä olisi kaikkein yksinkertaisinta. Käytäntö ei kuitenkaan ole näin yksinkertainen. Aikaisemmin tunnisteista ei tehty maailmanlaajuisesti yksilöllisiä, vaan pidettiin vain huolta että yksilöllisyys säilyy kokoelman, museon tms. pienen organisaation sisällä.
Lisäksi tunnisteita ei ole käytetty pelkästään nimeämiseen, vaan niihin on myös sisällytetty tietoa näytteestä, kuten sen sijainnista, lajiryhmästä tai säilöntätavasta. (En osaa sanoa onko tämä ollut alkujaan tarkoituksellista, vai muodostunut käytännöksi muuten vain.)
Hypoteettinen tunniste FLEPK244324 voisi tarkoittaa suomalaisten (F = Finland) perhosten (LEP = Lepidoptera) kuivanäyte (K = Kuiva) kokoelman näytettä numero 244324. Näytenumero voi osoittaa esim. järjestystä, jossa näytteet on tallennettu kokoelmaan.
Tällaista tietoa sisältävää tunnistetta kutsutaan ns. älykkääksi tunnisteeksi. Tunnisteen älykkyys tuo kuitenkin mukanaan ongelmia. Mitä tehdään jos huomataan että löytöpaikkatiedoissa on virhe ja perhosta ei ollutkaan löydetty Suomesta? Mitä tehdään jos luokittelu muuttuu ja ko. yksilöä ei enää luetakaan perhoseksi? Mitä tehdään jos näyte säilötäänkin uudelleen märkänäytteeksi? Pitäisikö tunnistetta tällöin muuttaa, vai säilytetäänkö vanha tunniste, vaikka se välittääkin virheellistä tietoa? Jos tunniste muuttuu, miten taataan että tieto uudesta tunnisteesta (eli käytännössä suositeltavasta synonyymistä) päätyy kaikkialle? Tunniste voi olla painettuna tutkimusartikkeleihin, tallennettuna erilaisiin tietokantoihin eri puolilla maailmaa, kirjattuna muistiinpanoihin jne... Käytännössä tietoa myös vanhasta tunnisteesta täytyisi ylläpitää loputtomiin, jotta kukaan ei törmäisi umpikujaan sitä seuratessaan.
Näiden ongelmien takia nykyään suositaan (erityisesti tietojärjestelmissä) tyhmiä tunnisteita, eli tunnisteita, jotka eivät sisällä tietoa näytteestä. Tunniste voi olla vaikka satunnainen merkkijono, koska se ei itsessään sisällä mitään tietoa näytteestä. Sen avulla vain liitetään näyte ja sen tiedot toisiinsa. Kaikki tieto näytteestä on tallennettuna muualle, olipa se sitten kokoelmatietokanta, Excel-taulukko, paperikortisto, muistivihko tai tieteellinen julkaisu.
Tämän takia on hyvin suositeltavaa, että älykkäitä tunnisteita vältettäisiin aina kun mahdollista. Tähän tähdätään myös LTKM:n LSID-tunnisteidenkäytössä.
Myös jo olemassa olevia, ennen älykkäinä toimineita tunnisteita tulisi käsitellä jatkossa ikään kuin ne olisivat tyhmiä.