Metadatan massamuokkaus

Last modified by Samu Kytöjoki on 2025/02/04 07:02

Information
Alkuperäinen ohje

Tämä ohje perustuu DSpacen viralliseen dokumentaatioon osoitteessa

https://wiki.lyrasis.org/display/DSDOC7x/Batch+Metadata+Editing

Johdanto

DSpacessa on toiminto, jonka avulla voi luoda metadumpin kokoelman tai yhteisön metatiedoista csv-tiedostona.

Heldan metadatan massamuokkaus on nopeinta ja helpointa tehdä metadatadumppia muokkaamalla.

Prosessi

  1. Asiakas ilmoittaa metadatan massamuokkaustarpeesta Heldan ylläpidolle ja pyytää metadatadumpin muokattavaksi.
  2. Heldan ylläpito luo metadatadumpin ja toimittaa sen asiakkaalle.
  3. Asiakas tekee metadatadumppiin tarvittavat muutokset ja toimittaa muokatun metadatadumpin takaisin Heldan ylläpidolle.
  4. Heldan ylläpito palauttaa metadatadumpin Heldaan jolloin muutokset siirtyvät Heldaan.

Heldan ylläpito tekee palautetulle metadatadumpille yksinkertaisen sanity checkin ennen kuin tiedot palautetaan Heldaan.

Metadatadumpin rakenne

Metadatadumppi on csv-tiedosto, jonka erottimena käytetään puolipilkkua (;). Metadatadumpissa on yksi otsikkorivi ja useita datarivejä:

csv esimerkki
id;collection;dc.title;dc.contributor.author;dc.date.issued
12345678-1a2b-3c4d-5e6f-123456789000;10138/13;Testiotsikko;Kytöjoki, Samu;2021-09-01
12345678-1a2b-3c4d-5e6f-fff123456789;10138/13;Toinen Testi;Piipponen, Jussi||Kytöjoki, Samu;2022

Tiedoston ensimmäinen rivi on otsikkorivi, joka ilmaisee mitä Dublin Core -metadatakenttiä tässä tiedostossa on. Muut tiedoston rivit sisältävät kukin yhden tietueen metatiedot.

Kaikilla kentillä (poikkeuksena id ja action) voi olla useita arvoja. Tällöin eri arvot on eroteltu toisistaan metadatadumpissa kahdella peräkkäisellä pystyviivalla (||).

Kentillä id ja collection on erityismerkitys:

  • Kenttä id on tietueen sisäinen tunnistenumero Heldan tietokannassa. Sen täytyy olla aina tiedoston ensimmäinen sarake. Tämän kentän arvoa ei voi muokata.
  • Kenttä collection sisältää kokoelman handle-numeron, johon tietue kuuluu Heldassa. Sen täytyy olla aina tiedoston toinen sarake. Tällä kentällä voi olla useita arvoja.

Metadatadumpin muokkaus

Metadatadumpin muokkaamiseen voi käyttää taulukkolaskentaohjelmia kuten Microsoft Excel tai LibreOffice Calc. Suosittelemme muokkaukseen LibreOffice Calcia.

Metadatadumpin voi avata myös tekstieditorissa, jolloin metadatadumppiin on helpompi tehdä tietynlaisia muutoksia.

Jos ei halua muokata jotakin tiettyä metadatakenttää, koko sarakkeen otsikoineen voi poistaa metadatadumpista. Tällöin kyseiseen metadatakenttään ei tule muutoksia.

Metadatan lisäys

Jos haluat lisätä metatiedon olemassa olevaan tietueeseen, lisää uusi arvo kyseisen tietueen rivin soluun, joka vastaa tätä metadatakenttää.

Jos haluat lisätä kokonaan uuden metadatakentän, lisää metadatadumppiin uusi sarake, jonka otsikoksi tulee uuden kentän nimi.

Metadatan poisto

Tyhjennä se solu, jonka tiedot haluat poistaa, mutta jätä sarakkeen otsikko ennalleen.

Metadatan muokkaus

Muuta kyseisen tietueen rivillä tähän metatietoon liittyvän solun sisältö uudeksi arvoksi.

Tietueen lisäys

Metadatadumpin avulla voi luoda kokonaan uuden tietueen lisäämällä metadatadumppiin uuden rivin, jonka id on plus-merkki add.

Kenttä collection jätetään tällöin tyhjäksi ja tietueen tiedot syötetään rivin muihin soluihin.

Tietueen poisto

Tietueen voi poistaa pysyvästi Heldasta lisäämällä metadatadumppiin uuden sarakkeen, jonka otsikko on action.

Poistettavien tietueiden riveille merkitään sarakkeeseen action arvo expunge.