00. Johdatus asiasanoitukseen, luokitukseen ja tämän oppaan käyttöön
Mitä sisällönkuvailu on?
Sisällönkuvailu on kuvailtavan aineiston käsittelemien aiheiden ottamista tiedonhaun piiriin, jotta tiedonhakija voi löytää itselleen relevantin aineiston kattavasti ja helposti. Kuvailijan tuleekin aina tarkastella kuvailemiaan aineistoja käyttäjäkunnan tarpeet huomioiden. Laadukas sisällönkuvailu tarjoaa mahdollisuuden lähestyä aineistoa sekä yleisemmällä että tarkemmalla tasolla hyödyntäen sekä luokitusten että asiasanastojen tarjoamia mahdollisuuksia (ks. myös Suomen yliopistokirjastojen neuvoston sisällönkuvailun asiantuntijaverkoston Aineistot esiin laadukkaalla sisällönkuvailulla -julkilausuma).
Aiemmin käytettävissämme ollut Sisällönkuvailuohje Marc 21 -formaattia varten oli luonteeltaan formaatin sovellusohje. Käsillä oleva opas taas lähestyy kuvailun kohteita vastakkaisesta suunnasta, aiheittain, ja huomioi asiasanastot, ontologiat, luokitukset ja muut kuvailun välineet yhtenäisenä kokonaisuutena.
Asiasanoituksen käyttö sisällönkuvailussa
Sisällönkuvailtaessa asiasanoilla etuna on se, että käytettyjen termien sisältö on ainakin jossain määrin tuttu asiakkaille. Asiakkaiden hakiessa sanahaulla he hyödyntävät huomaamattaan aineiston otsikossa, mahdollisesti tallennetussa sisällysluettelossa ja sanallisissa huomautuksissa olevien käsitteiden lisäksi myös sisällönkuvailijan aineistolle antamia asiasanoja ja ontologiatermejä.
Sisällönkuvailtavan aineiston aihealueet kannattaa huomioida asiasanastoa valittaessa. Kannattaa käyttää asiasanastoja, joita edelleen päivitetään. Hierarkkiset sanastot ohjaavat sekä sisällönkuvailijaa että tiedonhakijaa paremmin oikeiden termien käyttöön kuin pelkät sanalistat. Jos käytetään URI-tunnisteen omaavia asiasanoja tai ontologiatermejä, niin mahdolliset termimuutokset voidaan tehdä takautuvasti koneellisesti.
Sisällönkuvailtaessa asiasanoin ensisijaiset sanastot ovat
YSO – yleinen suomalainen ontologia, ALLFO – allmän finländsk ontologi eli YSO – General Finnish Ontology (kaikki alat; ei sisällä maantieteellisiä nimiä) ja YSO-paikat, ALLFO-orter eli YSO Places (maantieteelliset nimet). Huomaa: Aiemmin käytössä olleet YSA – yleinen suomalainen asiasanasto ja sen ruotsinkielinen vastine Allärs – allmän tesaurus på svenska ovat poistuneet käytöstä samoin kuin vapaan indeksoinnin sanaryhmät, ja YSOn asiasanoiksi saa tietokantaan tallentaa vain sanastossa auktorisoidut sanat. Jos tarvittavaa asiasanaa tai maantieteellistä nimeä ei löydy sanastosta, sitä kannattaa ehdottaa lisättäväksi Ehdota uutta käsitettä YSOon -lomakkeella.
Aineiston lajityyppiä/muotoa kuvailtaessa ensisijainen sanasto on
SLM – suomalainen lajityyppi- ja muotosanasto eli FGF – finländsk genre- och formlista.
YSOn lisäksi asiasanoin kuvailtaessa voi käyttää ainakin seuraavia kotimaisia ja ulkomaisia asiasanastoja ja ontologioita:
AFO – luonnonvara- ja ympäristöontologia (luonnonvara- ja ympäristöala)
Agrovoc – Multilingual Agricultural Thesaurus (maatalous, metsätalous, ravitsemustiede, kalastus, eläinlääketiede)
Cab Thesaurus 2014 (maatalous, metsätalous, ravitsemustiede, kalastus, eläinlääketiede)
FAST – Faceted Application of Subject Terminology (kaikki alat)
Kauno – Kaunokki-ontologia (fiktioaineisto). Huomaa: Aiemmin käytössä ollut Kaunokki/Bella – fiktiivisen aineiston sanasto lakkautetaan loppuvuodesta 2019, eikä sen käyttöä enää suositella.
Library of Congress Subject Headings: Library of Congress Authorities ja The Library of Congress Linked Data Service (kaikki alat)
Medical Subject Heading (MeSH) ja sen suomennos FinMeSH (lääketiede)
Svenska ämnesord (kaikki alat), käytetään vain täydentämään YSOa
Luettelo Marc 21 -formaatissa hyväksytyistä asiasanastoista ja ontologioista löytyy alkukielisen formaatin sivuilta (Subject Heading and Term Source Codes). Suomalaisia sanastoja ja ontologioita on julkaistu Finto – suomalainen asiasanasto- ja ontologiapalvelu -portaalissa.
Asiasanoituksessa tulee välttää eri sanastoista otettujen keskenään samaa tarkoittavien samankielisten termien käyttöä ja asiasanaketjujen rakentamista. Riippumatta kuvailtavan aineiston kielestä voidaan kuitenkin käyttää erikielisiä asiasanoja. On myös asiasanastoja joiden rakenteeseen ja/tai indeksointikäytäntöön kuuluvat ketjut, esimerkeinä LCSH, MeSH ja Svenska ämnesord.
Asiasanastoa käytettäessä on aina varmistettava voimassaolevasta sanastosta asiasanan oikea muoto. Termien tarkistaminen asiasanastoista on välttämätöntä, koska tietokantaan on voitu tallentaa sanastoon kuulumattomia asiasanoja ja näin virheellisen muodon käyttö kumuloituu, vaikka haettaisiinkin aikaisemmin tallennettuja asiasanoja omasta tietokannasta.
Sanastoista voi olla käytettävissä erikielisiä versioita. Vaikka kirjastossa indeksoitaisiinkin vain esim. suomen- tai ruotsinkielisellä YSOlla, voivat julkaisun sisältöä kuvaavat termit tietokannassa olla eri kielillä, sillä linkitetyn datan maailmassa kehittyneet tiedonhakujärjestelmät mahdollistavat keskenään sillattujen termien hakemisen kielestä riippumatta. Siksi kopioitaessa tietueita eri tietokannoista (Melinda, Libris, WorldCat jne.) saadut varsinkin englanninkieliset asiasanat on hyvä jättää tietueisiin.
Luokituksen käyttö sisällönkuvailussa
Luokituksen avulla kuvailtavasta aineistosta pyritään muodostamaan asioiden keskinäisiä suhteita osoittavia luokkia, liittämään toisiinsa asioita, joilla on läheinen yhteys ja samalla erottamaan toisistaan asioita, joilla ei ole läheisiä yhteyksiä. Näiden suhteiden ilmaisemiseksi luokituksissa käytetään keinotekoista ilmaisujärjestelmää, nk. notaatiota.
Luokituksen suurimpia etuja on, että yksittäinenkin luokka sisältää hierarkkisissa luokitusjärjestelmissä huomattavan paljon tietoa tiivistetysti. Esimerkiksi YKL-luokalla 98.3123 ("Historia—Muiden maiden historia—Amerikan historia—Pohjois-Amerikka—Yhdysvallat—V. 1861-1945") voidaan ilmaista seitsemällä merkillä sama sisältö kuin mihin tarvittaisiin minimissään sitä vastaavat YSO-asiasanat "historia", "Yhdysvallat" ja "1861-1945" tms. Lisäksi luokituksia on mahdollista hakea myös aiheen laajemmalla tasolla: tässä tapauksessa myös haut 9*, 98*, 98.3* jne. kohdistuvat kyseisen luokan sisältävään aineiston; asiasanoilla kuvailtaessa aineisto ei kuitenkaan olisi löydettävissä esimerkiksi termillä "Pohjois-Amerikka" – ainakaan ennen kuin haun laajennus saadaan toimimaan asiasanoissa.
Luokitus antaa asiakkaalle kuvan siitä mitä aihealueita käsittelevää materiaalia on saatavilla, ja luokitusta voidaan käyttää selailun apuvälineenä. Yksi luokituksen vahvuus on kieliriippumattomuus. Tiedonhaussa luokitusta voidaan käyttää hyväksi haun laajentamiseen tai tarkentamiseen tarpeen mukaan.
Luokitusta käytetään kirjasto- ja tieteenalakohtaisesti joko yksistään tai asiasanojen ja/tai ontologioiden lisäksi. Luokitusta on suositeltavaa käyttää erityisesti tekniikan ja luonnontieteiden aloilla, joilla ei ole käytettävissä sopivia asiasanastoja tai ontologioita.
Yleisimpiä Suomessa käytettyjä luokituksia, joita myös tässä oppaassa käytetään esimerkkeinä, ovat:
DDC eli Deweyn kymmenluokitus (maksullinen WebDewey) (kaikki alat)
GFDC eli Metsäalan kymmenluokittelu (maksuttomat GFDC – metsäalan kymmenluokittelu / Metsäalan kymmenluokitus (lyhennetty versio) vuodelta 2016 ja Skoglig decimalklassifikation (förkortad version) vuodelta 2017) (metsätiede)
KKAA eli Kokoelmakartan aihealueluokitus (tämän oppaan Liite 5: Kokoelmien kuvailun aihealueet (Kokoelmakartta)) (kaikki alat)
LCC eli Kongressin kirjaston luokitus (maksullinen Classification Web / maksuttomat Library of Congress Classification PDF Files helmikuulta 2019 ja ainoastaan filosofian, psykologian, teologian, uskontotieteen oikeustieteen, taiteet, yleisbibliografiat ja kirjastotieteen kattava LC Classification
LCCO eli Kongressin kirjaston aihealueluokitus (maksuton Library of Congress Classification Outline) (kaikki alat)
LOOVS eli Løøvin luokitus (maksuton Løøvs klassifikationssystem) (saamelaiskirjallisuus)
MSC (tunnetaan myös lyhenteellä "AMS") eli Mathematical Subject Classification (maksuton Mathematics Subject Classification – MSC2020) (matematiikka)
NLM eli National Library of Medicine -luokitus (maksuton NLM Classification) (lääketiede)
RILM eli Répertoire International de Littérature Musicale -luokitus (maksuton RILM Classification System) (musiikintutkimus)
UDK eli Yleinen kymmenluokittelu (maksuton, lyhennetty, 52-kielinen ml. suomi Universal Decimal Classification Summary ja suomenkielinen Supistettu UDK / laajempi lyhennetty suomenkielinen laitos: Helsinki: Tietopalveluseura, 1985) (kaikki alat)
YKL eli Yleisten kirjastojen luokitusjärjestelmä (maksuton YKL – yleisten kirjastojen luokitusjärjestelmä) (kaikki alat)
Luettelo Marc 21 -formaatissa hyväksytyistä luokituksista löytyy alkukielisen formaatin sivuilta (Classification Scheme Source Codes).
Aineiston sisällönkuvailu käytännössä I: sanallinen "prosessikaavio"
Kukin tallentava organisaatio päättää, mitä luokituksia, asiasanastoja ym käyttää ja kuinka tarkasti kuvailee. Työn peruskulku yksinkertaisimmillaan, vain "kiinteämittaiset kentät" ja muut asianomaiset Marc 21 -formaatin kentät sekä YSO ja SLM huomioiden:
Aineiston lajityyppi/muoto 1. Lajityyppi/muoto
Määrittele kuvailtavan aineiston lajityyppi/muoto, ellei luetteloija jo ole sitä tehnyt: onko kyse tietoaineistosta (esimerkiksi hakuteos, väitöskirja) vai fiktioaineistosta (esimerkiksi peli, runokokoelma, sävellys)? Kummassakin tapauksessa tallenna 006- ja 008-kenttien asianomaisille merkkipaikoille tarpeelliset lajityyppiä/muotoa vastaavat koodit. Tallenna 655-kenttään SLM:stä (kaunokirjallisuuden osalta vaihtoehtoisesti Kaunosta/Kaunokista) valitut aineiston lajityyppiä/muotoa parhaiten vastaavat asiasanat.
Kohderyhmä 2. Kohderyhmä
Tutki, onko aineisto tarkoitettu tietylle kohderyhmälle. Jos on, ja pidät tiedon ilmaisemista tarpeellisena, tallenna se ainakin merkkipaikkaan 008/22 (tai 006/02) ja tarpeen tullen myös kenttään 385 tai 521.
Aineiston käsittelemä nimetty henkilö, yhteisö tai tapahtuma (3. Aiheena henkilö, 4. Aiheena yhteisö ja 5. Aiheena tapahtuma)
Tutki, käsitteleekö aineisto yhtä tai useampaa yksilöitävissä olevaa henkilöä, yhteisöä ja/tai tapahtumaa. Jos käsittelee (esimerkiksi elämäkerrat, organisaatiohistoriikit), tallenna näiden ensisijaiset hakutiedot 600-, 610-, 611- ja/tai 647-kenttiin.
Aineiston käsittelemä teos (6. Aiheena teos)
Tutki, käsitteleekö aineisto yhtä tai useampaa yksilöitävissä olevaa teosta. Jos käsittelee (esimerkiksi teosanalyysit, kirja- tai elokuva-arvostelut), tallenna näiden ensisijaiset hakutiedot 600-, 610-, 611- ja/tai 630-kenttiin.
Aineiston käsittelemä/kattama aika (7. Aiheena aika)
Tutki, käsitteleekö aineisto yhtä tai useampaa määriteltävissä olevaa vuotta, vuosikymmentä, vuosisataa tai pidempää ajanjaksoa. Jos käsittelee, tallenna tieto kenttään 648. Vuotta tarkemman ajan voi tarpeen mukaan tallentaa kenttään 045.
Aineiston käsittelemä paikka (8. Aiheena paikka)
Tutki, käsitteleekö aineisto yhtä tai useampaa määriteltävissä olevaa paikkaa. Jos käsittelee, tallenna tieto YSO-asiasanoin kenttään 651.
Aineiston käsittelemät muut aiheet (9. Muut aiheet)
Tutki, käsitteleekö aineisto muita aiheita tai jo nimettyjä aiheita tietystä kuvailemisen arvoisesta näkökulmasta. Jos käsittelee, tallenna tieto kontrolloidun asiasanaston asiasanoin kenttään 650. Tutki lisäksi, onko tarvetta määritellä aineiston käsittelemä henkilö, yhteisö, tapahtuma, teos, aika ja/tai paikka myös yleisemmällä, ei-yksilöidyllä tasolla (esimerkiksi Jean Sibelius myös asiasanalla säveltäjät); jos on, tallenna tieto kontrolloidun asiasanaston asiasanoin kenttään 650.
Aineiston luomisaika (11. Luomisaika), tekijän ominaisuudet (13. Tekijän ominaisuudet) sekä aineistossa käytetyt tutkimusmenetelmät (10. Tutkimusmenetelmät) ja muut kuvailun kannalta yllä mainitsemattomat seikat (kirjallisuuspalkinnot ym)
Tutki, onko aineistolla vielä joitakin ominaisuuksia, jotka myös pitäisi saada haun piiriin. Jos on, merkitse ne asianmukaisiin kenttiin: luomisaika tarkasti kenttään 046 ja vuosikymmenen tarkkuudella kenttään 388 (huomaa: ei 648), luomispaikka kenttään 370 (huomaa: ei 651), tekijän ominaisuudet kenttään 386, käytetyt tutkimusmenetelmät kenttään 567, teoksen saamat palkinnot kenttään 586 jne.
Muista myös luokitusjärjestelmien käyttö osana sisällönkuvailua: lisää asianmukainen luokka (yksi tai useampi) 0XX-kenttään (tai -kenttiin), mikäli organisaatiosi käyttää luokitusta.