Excel-tallennuspohjat ja tiedon tuonti Excelistä

Last modified by Anniina Kuusijärvi on 2024/05/14 14:44

Englanninkielinen sivu: Excel templates and import

Yleisiä neuvoja ja niksejä

Näytetietojen tallennus excel-importilla on käytännöllistä etenkin tallennettaessa suuria määriä näytteitä, joilla on keskenään samankailtaiset tiedot. Datan söyttämiseksi taulukkoon luodaan tyhjä tallennuspohja Kotkan työkalulla tai jos data on jo taulukossa, se tulee muuntaa Kotkan kanssa yhteensopivaan formaattiin. Lisää tietoa datan muokkauksesta: Data cleaning and transformation

Excel geberator -työkalulla tehty tallennuspohja sisältää kaikki oikeat käytettävissä olevat vaihtoehdot pudotusvalikoihin. Jotta tallennuspohja sisältäisi kaikki viimeisimmät kentät ja vaihtoehdot, kannattaa ottaa Kotkasta uusi tallennuspohja aika-ajoin.

Voi olla kätevää pitää yhtä tyhjää Excel-tallennuspohjaa, jossa on kaikki mahdolliset kentät/sarakkeet, lähteenä oikeille kenttäotsikoille. Otsikkoja voi joutua lisäämään esim. kun ottaa dataa ulos Kotkasta editoitavaksi Excelissä tai kun muokkaa vanhaa taulukkoa Kotkan formaattiin.

Excel-tallennuspohja

Excel-tallennuspohjalla on kaksi otsikkoriviä. Ensimmäinen otsikkorivi on tärkeä, se josta Kotka lukee mihin kenttään mikäkin tieto menee importissa. Ensimmäisellä otsikkorivillä käytetään tietokannan avainarvoja tai ns. tietokantanimiä, ja niistä myös ilmenee Kotkan hierarkinen rakenne. Esim. MYCollectionID -sarakkeeseen tallennetaan kokoelman tunniste, johon näyte liitetään ja MYGathering[0][MYUnit][0][MYIdentification][0][MYTaxonRank] tarkoittaa ensimmäisen identifikaation taksonomista määritystasoa.

Toisteisia elementtejä kuten määrityksiä, lisätään käyttäen otsikoiden numeroita hakasulkeissa (laskenta alkaa nollasta). Esim. MYGathering[0][MYUnit][0][MYIdentification][1][MYTaxonRank] olisi toinen määritys ensimmäisessä unitissa ja MYGathering[0][MYUnit][1][MYIdentification][1][MYTaxonRank] olisi toinen määritys toisessa unitissa.  Jos näytteillä on useita määrityksiä, uniteja tai preparaatteja, Excel-taulukosta voi tulla leveä ja mutkikas, kun useat sarakkeet joudutaan toistamaan.

Toinen otsikkorivi on vapaaehtoinen ja voi sisältää mitä tahansa tekstiä, joka auttaa hahmottamaan mikä sarake on mikäkin.

Sarakkeiden järjestystä voi muuttaa muiden sarakkeiden osalta, paitsi kahden ensimmäisen. NamespaceID tulee aina olla ensimmäinen sarake ja ObjectID toinen. Tarpeettomat, tyhjäksi jäävät sarakkeet voi poistaa, paitsi pakolliset sarakkeet. Kun dataa eksportoidaan Kotkasta, tulee taulukkoon yksi pakollinen sarake lisää: MZDateEdited. Tämä sarake on syytä jättää rauhaan, antaa sen olla niin kuin se oli eksportissa, älä editoi sen sisältöjä äläkä poista saraketta. MZDateEdited -sarakkeen perusteella Kotka katsoo, onko takaisin importoitavia näytteitä muokattu Kotkassa sillä aikaa, kun ne on olleet Excelissä muokattavana. Import epäonnistuu eikä dataa voida tallentaa importista, jos sitä on muokattu Kotkassa silläaikaa. Näin vältytään ylikirjoittamasta Kotkaan tehtyjä muutoksia. Älä myöskään poista taulukosta dataa sisältäviä sarakkeita, vaikka et muokkaisi niiden sisältöjä (tämä saattaa aiheuttaa tiedon ylikirjoittumisen tyhjäksi).

Import

Import-työkalu löytyy Kotkan yläpalkin valikosta, Tools-valikosta. Importissa valitaan näytteiden datatyyppi, tietueiden omistaja (muita muuttaa jos kuulut useaan organisaatioon), selataan tiedosto hakemistosta ja valitaan oikea taulukko (sheet). Tavallista importia, joka sisältää esikatselun, voidaan käyttää maksimissaan 5000 näyteriviä sisältävälle tiedostolle. Suurta importia ilman esikatselua voidaan käyttää maksimissaan 10 000 näytteelle kerralla. Klikataan Validate and preview. Tässä saattaa kestää hetki riippuen datamäärästä. Esnin Kotka tekee muutamia tarkistuksia (esim. tiedoston sarakeotsikoihin) ja jos vastaan tulee kriittisiä virheitä jo tässä vaiheessa, esikatselua ei näytetä. Jos mahdollista, import etenee esikatseluvaiheeseen.

Esikatselussa Kotka näyttää mahdolliset virheet ja huomautukset, jos datassa on jotain ongelmia. Sarake "Errors" näyttää sellaiset virheet, jotka estävät tallennuksen (esim. puuttuvat pakolliset tiedot) ja sarake "warnings" näyttää virheet, jotka eivät estä tallennusta mutta jotka on hyvä korjata jos suinkin mahdollista. Taulukon rivit järjestetään esikatselussa oletuksena niin, että virheitä sisältävät rivit nousevat taulukossa ylimmäksi. Virheitä sisältävät solut korostetaan punaisella. Lisää validoinneista: *Näytedatan tallennus#*Näytedatantallennus-Validoinnit

Joskus Kotka ilmoittaa, että dataa ei voida tallentaa, koska se sisältää virheitä ("data is missing and can't be empty"), mutta mitään ei korosteta punaisella. Useimmiten tässä tapauksessa on kyse siitä, että jokin pakollinen sarake (esim. Record type) puuttuu tiedostosta, eikä sitä voida korostaa koska sitä ei ole olemassa. Korjaa virheet ja yritä importoida data uudelleen. Kun Kotka sanoo: "Validation successful, you can go ahead and save the data", klikkaa save ja Kotka alkaa prosessoida Excel-tiedostoa. Tässä voi kestää hetken, etenkin jos tiedosto on iso ja jos jonossa on jo muita importeja. Voit jättää sivun ja palata siihen aina Tools-valikostaLast saved Excel. 

Kun tallennus on valmis, tarkista aina importoitujen näytteiden lista epäonnistuneiden tallennusten varalta.

Vertailu webbilomakkeisiin

Katso Specimen web forms ja "Comparisons to Excel import".