Skip to end of metadata
Go to start of metadata

English version of this page.

Tietoa aineistoista: Kettunen, Pääkkönen ja Koistinen (2016): http://journal.fi/inf/article/view/59433 .

 

Aineistopaketit sisältävät Kansalliskirjaston digitoiman sanomalehti- ja aikakauslehtiaineiston sivukohtaiset XML-tiedostot (1771–1910). Aineisto on jaettu vuosikymmenittäin ja vuosittain kansiorakenteeseen, jossa on yksi XML-tiedosto jokaista sivua kohti. XML-tiedosto (esimerkki) sisältää: 

 

Käyttöehdot

Katso http://digi.kansalliskirjasto.fi/terms  Käyttäjät eivät saa välittää tekijänoikeuden alaista digitaalista aineistoa eteenpäin ilman oikeudenhaltijan lupaa.

 

Aineistopakettien rakenne

 

Archive:  nlf_ocrdump_v0-2_newspapers_1771-1870.zip
  Length      Date    Time    Name
---------  ---------- -----   ----
        0  02-29-2016 09:19   1771-1870/
        0  02-29-2016 09:19   1771-1870/fin/
        0  02-29-2016 09:12   1771-1870/fin/1861/
     4682  02-06-2016 13:02   1771-1870/fin/1861/kk-ocr.xsd
     5716  02-06-2016 13:02   1771-1870/fin/1861/1457-4519_1861-01-01_0_001.xml
   133732  02-06-2016 13:02   1771-1870/fin/1861/1457-4519_1861-01-01_0_002.xml
   199296  02-06-2016 13:02   1771-1870/fin/1861/1457-4519_1861-01-01_0_003.xml
    38717  02-06-2016 13:02   1771-1870/fin/1861/1457-4519_1861-01-01_0_004.xml

 

Tiedostonimen rakenne

1771-1870/fin/1775/1457-4683_1775-09-01_0_001.xml  
Vuosiväli/kieli/vuosi/ISSN_ilmestymispvm_NRO_sivunumero


Latausvinkkejä

Voit jatkaa keskeytynyttä latausta : 

wget -c URL  
curl -C -

 

Palaute

Kysymyksiä tai muuta palautetta aineistopaketeista voi laittaa digin 'Palaute'-toiminnon avulla. Kiitos!

 

Aineistoihin viittaaminen

Toivomme, että viittaat aineistopaketteihin esimerkiksi näin:

Kansalliskirjasto (2017), Digitoitujen sanomalehtien ja aikakauslehtien aineistopaketit, 2017. Kansalliskirjasto. https://digi.kansalliskirjasto.fi/opendata/submit (TODO!)

 

Kysymyksiä ja vastauksia

K: Kuinka saan tietyn nimekkeen (lehden) kaikki tiedostot? Mistä tiedän mistä paketeista se löytyy?

V: Voit tarkistaa yksittäisen lehden julkaisuvuodet ja tiedot Digin Lehdet-näkymästä. Tämän jälkeen lataa tarvittavat paketit tai niiden osat.

 

K: Hukkasin latauslinkkini, mitä teen? Latauslinkkini vanheni, mitä teen?

A: Täytä kyselylomake uudestaan ja valitse haluamasi aineistot uudestaan, saat uuden latauslinkin.

 

 

Lähteitä

Pääkkönen, T., Kervinen, J., Nivala, A., Kettunen, K., & Mäkelä, E. (2016). Exporting Finnish Digitized Historical Newspaper Contents for Offline Use. D-Lib Magazine, 22(7/8). http://doi.org/10.1045/july2016-paakkonen
Kettunen, K., Pääkkönen, T., & Koistinen, M. (2016). Kansalliskirjaston digitoitu historiallinen lehtiaineisto 1771–1910: sanatason laatu, kokoelmien käyttö ja laadun parantaminen. Informaatiotutkimus, 35(3), 3–14. http://ojs.tsv.fi/index.php/inf/article/view/59433
 

 

Sovelluksia

Löydät pari apuskriptiä Githubista, joilla esimerkiksi voit yhdestä XML-tiedostosta poimia pelkän tekstin.

 

 

Save

Save

Save

Save

Save

Save

Save

Save

Save

Save

Save

Tallenna

Tallenna

Tallenna

Tallenna

Tallenna

Tallenna

  • No labels