Tietoarkkitehtuuri

Last modified by zmiku@kyamk_fi on 2024/01/16 08:10

"Tieto on pysyvämpää kuin organisaatiorakenteet, prosessit tai yksittäiset tietojärjestelmät. Koko nykyaikainen yhteiskunta perustuu tiedon jäsentyneeseen hallintaan. Tietoarkkitehtuurinäkökulma huolehtii tiedon jäsentyneestä ja yhdenmukaisesta käsittelystä eri tietojärjestelmissä ja ratkaisuissa." (Mika Karjalainen, Silver Planet Oy)

Tietoarkkitehtuurin tavoitteena on luoda pysyviä rakenteita erilaisten tietovarantojen ja tietojen yhteentoimivuuden kehittämiselle. Kirjastojen toimintaympäristössä metatietojen laajamittainen yhteiskäyttö edellyttää semanttista yhteentoimivuutta eli sopimista yhteisistä metatietomäärityksistä (tietomalleista / skeemoista / formaateista), sanastoista, luokituksista ja tunnisteista sekä yhteisiä pelisääntöjä niiden käytöstä ja noudattamisesta. Näistä tekijöistä muodostuu kokonaisarkkitehtuurin linjauksia tukeva metatietoarkkitehtuuri.

Julkisen hallinnon tietoarkkitehtuurissa metatieto on määritelty seuraavasti:

"Metatieto on tietoa tiedosta. Se voi olla kuvailevaa, hallinnollista tai rakenteellista. Kuvaileva metadata kertoo dokumentista ja sen sisällöstä (esimerkiksi tekijä, nimeke ja aihe). Hallinnollinen metadata kuvaa dokumentin käyttöoikeudet, tekniset ominaisuudet (kuten tiedoston koko ja -formaatti, esimerkiksi PDF) ja mahdolliset pitkäaikaissäilytykseen liittyvät piirteet, kuten migraation (tietoaineiston siirron) yhteydessä tapahtuneet muutokset. Tietoarkkitehtuurin yhteydessä metatiedolla on laaja merkitys. Metatiedon avulla voidaan kuvata laajuudeltaan erikokoisia kohteita yksittäisistä sisältöyksiköistä kokonaisiin tietovarantoihin. Metatietoa käytetään muunmuassa todisteena tehdyistä toimenpiteistä, tiedon haussa, tallentamisessa, yhdistämisessä, elektronisten aineistojen pitkäaikaissäilytyksen tukena sekä työnkulun ohjauksessa. Metatiedon käyttäjiä voivat olla sekä ihmiset että koneet. Järjestelmiin tallennetun metatiedon pohjana ovat metatietomääritykset (metatietoformaatit tai metatietoskeemat), joiden tulisi perustua kansainvälisiin ja kansallisiin standardeihin ja suosituksiin. Tunnettuja metatietomäärityksiä ovat esimerkiksi kirjastojen MARC 21 (http://www.kansalliskirjasto.fi/extra/marc21/) sekä yleiskäyttöinen Dublin Core (http://www.dublincore.org/)."

Saman dokumentin mukaan

"Tietovaranto on toiminnan tarpeista johdettu ja hallinnollisista syistä määritelty tietojen kokonaisuus, jotta tiedot ovat paremmin hallittavissa. Tietovaranto kattaa yhteisesti hallinnoidun joukon tietoja, joista muodostuu looginen kokonaisuus. Tietovarannon tietojen hallinta on organisoitu ja vastuutettu yhdelle toimijalle. Tietovarannon omistajuus sekä kehittämis- ja ylläpitovastuut on määritelty ja dokumentoitu. Tietovaranto voi olla fyysisesti keskitetty tai hajautettu."

Jotta asiakas käytännössä löytää kirjastosta tarvitsemansa aineiston, esimerkiksi tietyn kirjan tai lehden, täytyy se ensin kuvailla metatietoja hyödyntäen tietokantaan/tietovarantoon. Kirjastoaineiston kuvailun tuloksena syntyy tarkoituksenmukainen tiedonhakuympäristö, jossa käyttäjä voi metatietoihin kohdistuvien hakujen avulla löytää, tunnistaa, valita ja saada käyttöönsä tietoa ja erilaisia kirjastoissa saatavilla olevia aineistoja.

Tulevina vuosina tulee kansainvälisellä tasolla tapahtumaan suuria muutoksia, jotka vaikuttavat Suomenkin kirjastoissa tuotettavan kuvailevan metatiedon muotoon ja rakenteeseen. Semanttisen yhteentoimivuuden aikaansaamiseksi nykyisestä tietuesidonnaisesta tiedontallennuksesta luovutaan ja siirrytään kohti itsenäisten, koneluettavien tietoelementtien tallennusta (ns. funktionaalinen tietomalli). Uusi itsenäisistä, mutta toisiinsa linkitettävistä tietoelementeistä koostuva rakenteistettu metatieto edistää kirjaston tuottaman metadatan käytettävyyttä globaalissa verkossa ja eri tietojärjestelmissä. Metatiedon yhteiskäytön tavoitteena on

  • avoin tuotantoympäristö, jossa voi hyödyntää nykyistä joustavammin avoimia sanastoja, rekisterejä ja valmiita metatietosettejä osaksi kuvailua
  • ideaalissa metatietomaailmassa kunkin maan avoimet metatietovarannot luovat aukottoman toisiinsa linkittyvien metatietojen verkoston eikä metatietoja tarvitse kopioida tietokannasta toiseen
  • informaatioketjun eri toimijoiden – mm. julkaisijoiden, kirjastojen, tutkijoiden – lisääntyvä yhteistyö metatiedon linkittämisessä tulee tehostamaan metatiedon tuotantoa ja luomaan uusia näkökulmia tietoon (Seppälä, 2011).

RDA-standardi, sen suomenkielinen versio ja kansallinen sovellusohje (RDA Toolkit) toimii kuvailijan web-pohjaisena työkaluna osana kuvailujärjestelmää. Kuvailussa tulee myös voida hyödyntää erilaisia kansainvälisiä ja kansallisia tietovarantoja. Metatietovarannoissa tallennetaan ja ylläpidetään tietoja. Niistä saadaan mm. kuvailussa käytettävät yhdenmukaiset termit ja ilmaukset valmiina ja ne ovat helposti käytettävissä. Termeille ja ilmauksille on annettu pysyvät tunnisteet.

Tällaisia tietovarantoja ovat mm:

  • tunnisterekisterit
  • RDA-kuvailuun liittyvät uudet standardit  ISTC, ISNI
  • auktoriteettirekisterit, nimitiedot ISNI, VIAF
  • asiasanastot ja ontologiat
  • luokitukset
  • 'metadatarekisterit' (termit, fraasit), Open Metadata Registry
  • toisten maiden kansallisbibliografiat metatietovarantoja
  • muiden kuvailevan metatiedon tuottajien tietovarannot

Käytännössä : uudet ISBD- kuvailusäännöt otettiin käyttöön vuonna 2012, RDA- kuvailustandardi tullaan ottamaan käyttöön näillä näkymin vuosina 2014- 2015 ja lähivuosina myös useissa kirjastojärjestelmissä käytössä oleva MARC 21 -tiedontallennusformaatti tullaan korvaamaan uudella formaatilla. Uuden formaatin käyttöönoton aikataulu on toistaiseksi vielä täsmentymättä, sillä uudistamistyötä tehdään kansainvälisellä tasolla Kongressin kirjaston johdolla.

yhteisten tietokantojen mahdollisuudet ja tarpeet (bibliografiset, kokoelma-, asiakas-, ...tietokannat)

Sisällönkuvailussa siirrytään yhteisten sanastojen käyttöön.

Noudatetaan funktionaalista kuvailua eli FRBR-mallia toteuttava RDA-kuvailustandardi.

Tietoa FRBR (Functional Requirements for Bibliographic Records) -tietomallista ja RDA (Resource Description and Access) -kuvailustandardista:

Metatiedon hyvä laatu edistää tiedonsaantia, helpottaa ja tehostaa tiedonhakua.

Suomalainen julkaisutuotanto näkyy ja on löydettävissä kansainvälisissä ja kansallisessa tiedonhakuympäristössä.

Kuvailussa noudatetaan kansainvälisiä ja kansallisia kuvailun periaatteita.

RDA-kuvailun ohjeita ja periaatteita noudattamalla luodaan yhdessä metatietoa, joka on yhteiskäyttöistä, johdonmukaista, tarkoituksenmukaisesti jäsentynyttä, käyttäjän tarpeista lähtevää ja web-ympäristössä toimivaa. Tavoitellaan;taloudellisuutta ja joustavuutta monenlaisten aineistojen kuvailuun

Aineistoa kuvaavat entiteetit:

  • teos - ekspressio - manifestaatio - kappale
  • henkilö - suku - yhteisö
     kuvaillaan attribuutein ja luodaan tarvittavat hakutiedot
     Teoksen aiheet kuvataan
     Entiteettien väliset suhteet kuvataan.

Tunnisterekisterien ylläpito ja tunnisteprosessien työkalut, tunnistepalvelu

- ISBN, ISSN, ISNI, ISTC...

- URN

Järjestelmän tulee tukea kuvailussa käytettyjä eri formaatteja "mapping framework" , sisäänrakennetut siirtymät / yhteensopivuus formaatista toiseen (konversiot?) (esim. Onix -> Marc, Marc-> Onix , tai Usemarconin korvaava, DublinCore-yhteensopivuus, Marcformaateista -> RDA:ta tukevaan formaattiin)

2. AINEISTOJEN KÄYTÖNHALLINTA (MK ja PF)

Aineistojen käytönhallinnassa tarvittavia tärkeimpiä tietojoukkoja ovat asiakastiedot, käyttötapahtumatiedot (mm. lainaus, uusiminen, varaus, palautus) sekä käyttötapahtumista mahdollisesti syntyvät maksutiedot.

Asiakastiedot

Asiakastiedot koostuvat henkilön tai organisaation nimestä, henkilötunnuksesta ja/tai muusta tunnistetiedosta, syntymäajasta, yhteystiedoista (osoite/osoitteet, sähköposti, puhelinnumero), kirjasto- tai muun kortin numerosta sekä asiakkaan rooli-, tilastointi- ja käyttöoikeustiedoista. Lisäksi asiakastietoihin liittyy myös asiakkuuteen liittyvät huomautukset.

Asiakastietojen siirrot muista järjestelmistä kirjaston asiakasrekisteriin

Asiakkaiden perustiedot pitäisi voida siirtää Väestörekisterikeskuksen tietokannasta kirjaston asiakasrekisteriin. Tavoitteena on, että kaikilla kirjastoilla olisi yhteinen asiakasrekisteri, jolloin tiedot tallennettaisin vain kertaalleen. VRK.sta siirrettäisiin seuraavat tiedot: asiakkaan etunimet, sukunimi, henkilötunnus, osoitetiedot sekä puhelinnumero. Yhteistä asiakasrekisteriä käytettäessä asiakkalla olemassa olevan kirjastokortin tunnisteen tulisi olla saatavissa myös muissa kirjastoissa asiakkuutta luotaessa. Asiakastietojen osalta, VRK:sta siirrettävän osoitteen lisäksi, pitäisi pystyä tallentamaan myös väliaikaisia osoitteita ja muita yhteystietoja -> tavoitettavuus esim. toisella paikkakunnalla tapahtuvan opiskelun aikana.

Tiedot asiakkaan roolista (opiskelija, henkilökuntaa, tutkija yms) tulisi voida siirtää organisaatioiden omista opiskelija-ja henkilökuntarekistereistä. Kysymys: Voiko hakea myös attribuuttina hakemistopalveluista esim. shibbolethin välityksellä tunnistautumisen yhteydessä? Asiakkuus kirjastossa pitäisi voida asettaa oletuksellisesti vanhentumaan määräaikaisesti esimerkiksi opintohallintojärjestelmästä saatavan oletetun valmistumisajan perusteella.

Käyttötapahtumatiedot

Käyttötapahtumatiedot koostuvat esim. lainaus,- uusinta- ja palautustapahtumissa syntyvistä tiedoista eli asiakastiedosta, niteestä, tapahtuma-ajasta ja -paikasta, eräpäivästä, operaattorista, niteen tilasta ja uusintakertojen määrästä sekä varausten tiedoista eli asiakastiedoista, niteestä, tapahtuma-ajasta ja -paikasta, operaattorista, niteen tilasta, varauksen voimassaoloajasta, varauksen alkamisajasta, noutopaikasta, varausjonotiedoista ja varauksen muuttamis- tai perumistiedoista sekä mahdollisesta varausmaksusta.

NCIP (Circulation Interchange Protocol) määrittää kirjastojärjestelmien välisessä yhteistyössä ja järjestelmien sisäisissä toiminnoissa tarvittavia olioita, viestejä sekä palveluita. Lisäksi standardi sisältää toimintoja myös e-aineistojen käytön hallintaan.

SIP2, SRU/W jne.

PAIA (Patron Account Information API) on esitys ohjelmointirajapinnaksi, jonka tarkoituksena on tarjota parempi saatavuus asiakastiedoille mm. asiakasliittymille.

Lainatietoja muista järjestelmistä siirrettäessä olisi siirtotiedoissa oltava ainakin kentät: "asiakkaan tunniste; niteen tunniste; nykyinen eräpäivä". Lisäksi olisi huomioitava eräpäivän ylittymisestä aiheutuvat maksut sekä "kadonneet" niteet. Mahdollisesti myös lainatapahtumaan liittyvät laskurit (uusinnat jne.)

Aineistojen käyttöön liittyvät tunnisteet

- asiakkaiden tunnistuksessa käytössä kortinviivakoodi/asiakasnumero tai muu tunniste

- lainattavilla kappaleilla niteiden tunnisteet, jotka voivat olla joko viivakoodi tai RFID-tunnistetarra

- kirjastojen ja niiden kokoelmien tunnukset

- tietokantaosoitteet

Maksutiedot

Maksutiedot koostuvat maksun tyypistä, niistä aineisto- ja asiakastiedoista, joihin maksu kohdistuu, maksun määrästä ja tilasta sekä maksutapahtumatiedosta.

Maksutietojen siirrot kirjastojärjestelmästä taloushallinnon järjestelmiin laskutusta ja perintää varten

EDI:

TIEKE Tietoyhteiskunnan kehittämiskeskus : EDIFACT -tietoa

EDI (Electronic Data Interchange) on standardoitu tiedonsiirtomenetelmä tietojärjestelmien välillä. Järjestelmien väliseen viestintään on kehitetty EDIFACT -syntaksi (ISO9735) : Introducing UN/EDIFACT

Hyvä kooste standardeista: Cynthia Hodgson - The RFP Writer’s Guide to Standards for Library Systems