O arhivu

Čemu arhiviranje spleta?

Narodna in univerzitetna knjižnica zbira, hrani, varuje in ohranja pisno kulturno in znanstveno dediščino slovenskega naroda ter omogoča uporabo svojih zbirk tako domačim kot tujim uporabnikom. Z vsakokratnim pojavom novih medijev ali nosilcev informacij smo morali tudi v knjižnicah poskrbeti za te nove vrste gradiva in jih obravnavati z enako mero odgovornosti, kot je veljala tradicionalnim nosilcem. Svetovni splet je že nekaj časa prostor, na katerem se pojavljajo najrazličnejše publikacije z vseh področij človekovega ustvarjanja, tako znanstveno raziskovalnega kot kulturno umetniškega, poleg tega pa je to tudi prostor komunikacije, izmenjave informacij in znanja, povezovanja ter vzpostavljanja najrazličnejših odnosov med posamezniki ali skupinami posameznikov.

Ko govorimo o nacionalni ali svetovni kulturni dediščini, ne moremo več izključiti tega obsežnega in kompleksnega prostora, ki je pri produkciji in pretoku znanja danes že v precejšnji meri nadomestil klasične mehanizme in poti. S stališča bibliotekarske stroke se kulturne dediščine lotevamo predvsem z vidika trajnega ohranjanja in trajnega omogočanja uporabe, zato smo se v knjižnicah morali soočiti tudi z izzivi ohranjanja spletnih mest, tako njihove vsebine kot tudi specifične strukture, ki je že sama po sebi vredna ohranitve za prihodnje rodove. Zajemanje in arhiviranje vsebin na spletu sta dejavnosti, ki ju izvajajo predvsem nacionalne ali regionalne knjižnice in sta v skladu z njihovim poslanstvom logična nadgradnja zbiranja, obdelave, hranjenja in dajanja v uporabo klasičnih publikacij na fizičnih nosilcih.

Kaj je arhiviranje spleta?

Pri arhiviranju vsebin na spletu gre za sistematično zajemanje in arhiviranje določenih delov svetovnega spleta. Spletna mesta zajemamo s pomočjo posebnih aplikacij za samodejni zajem (bolj poznane pod imeni kot so spletni roboti ali pajki). Zajamemo in shranimo jih na tak način, da ohranijo vse notranje povezave med posameznimi stranmi in datotekami znotraj spletišča. Arhivirano spletno mesto je v idealni situaciji enako izvirniku na živem spletu in omogoča tudi enako uporabo.

Pri vsakem zajemu je možno določiti obseg shranjene vsebine glede na globino in širino. Lahko napravimo le posnetek prve strani spletišča ali pa posežemo globlje na drugi, tretji ali najgloblji nivo. Glede na širino lahko zajamemo le strani in pripadajoče datoteke na eni domeni ali pa razširimo zajem na nekatere druge domene, ki k celoti spletišča, kot jo doživlja uporabnik morda, prispevajo pomembnejši del vsebine.

Na podlagi praktičnih izkušenj institucij, ki izvajajo to dejavnost, lahko glede na obseg ločimo dva pristopa k zajemanju – selektivnega in celostnega. Pri prvem zajemamo določeno število izbrani spletišč, ki jih skušamo zajeti čim bolj popolno. Ta pristop mnogi imenujejo tudi tematsko zajemanje, saj so izbrana spletna mesta pogosto s področja neke specifične tematike ali pa pokrivajo določen dogodek (npr. volitve). Pri celostnem zajemanju pa gre za shranitev celotne nacionalne domene ali podobno velikega kosa spleta.

Ker se vsebine na spletu neprestano spreminjajo, tudi zajeme posameznega spletnega mesta izvajamo kontinuirano z različnimi frekvencami. Ta je odvisna od pogostosti spreminjanja spletnega mesta, njegove velikosti in od kapacitete strojne opreme, ki jo imamo na voljo. Uporabnik arhiva lahko zato dostopa do različnih verzij spletnih mest, kot so bile arhivirane skozi čas.

Kaj vsebuje spletni arhiv?

Arhiv vsebuje spletna mesta, ki smo jih v NUK shranjevali od leta 2008. Trenutno je v arhivu shranjenih čez 1000 spletnih mest, v glavnem s področij javne uprave, visokega šolstva, znanosti, kulture in tudi nekatere serijske publikacije v spletni obliki.

Kljub temu, da ima na podlagi Zakona o obveznem izvodu publikacij NUK možnost shranjevati vse spletne strani, ki imajo značaj slovenike, lahko zaradi omejenih sredstev zdaj shranjujemo le majhen vzorec slovenskega spleta. Nabor spletnih mest postopoma širimo. V začetnem obdobju pa smo se po zgledih iz tujine najprej lotili zgoraj navedenih področij. V prihodnosti nameravamo izbor razširiti v skladu z lastnimi zmožnostmi.

Praviloma je vsako spletno mesto zajeto večkrat z določeno frekvenco. Zato so posamezni zajemi v arhivu urejeni po datumu, uporabnik pa si lahko izbere, katero različico spletnega mesta si bo ogledal. Večino spletnih mest zajemamo dvakrat letno, manjši del pa štirikrat letno in enkrat mesečno. V nekaterih primerih pokrivanja časovno omejenih dogodkov (npr. volitve) smo določen izbor spletnih mest zajemali tedensko ali dnevno.

Česa arhiv ne vsebuje?

Arhiviranje vsebin na spletu zaradi tehničnih lastnosti samega spleta skoraj nikoli ni popolno. Čeprav se postopki zajemanja neprestano razvijajo in izpopolnjujejo obstajajo segmenti spleta, ki jih je nemogoče učinkovito zajeti in shraniti. Naš cilj je shraniti vsako spletno mesto v celoti, vendar je potrebno upoštevati, da to ni vedno možno. Kljub temu da je uporaba arhiviranih spletnih mest enaka uporabi živega spleta, so nekatere funkcionalnosti spletnih strani v arhivu omejene ali jih preprosto ni:

  • vsebin, ki so na spletu dostopne ob registraciji z uporabniškim imenom in geslom, arhiv praviloma ne vsebuje;
  • dinamično generirane vsebine, ki je na živem spletu dostopna s poizvedbo v bazi, robotski program ne more zajeti, ker ne more izpolnjevati iskalnih polj;
  • spletni arhiv še ne vsebuje pretočnih avdio in video vsebin. Postopke za zajem tovrstnih vsebin še razvijamo, trenutno pa še ni na voljo standardiziranih rešitev;
  • nekatera spletna mesta so zaradi specifične izvedbe zajeta pomanjkljivo, kar pomeni, da lahko manjkajo nekateri oblikovni ali (redkeje) vsebinski elementi.

Po vsakem zajemu opravimo tudi preverbo kakovosti. Načeloma velja, da shranimo tiste zajeme, pri katerih je ohranjen vsaj bistven del vsebine, kljub temu, da mogoče manjkajo nekateri oblikovni elementi. V redkih primerih, ko je zaradi narave spletnega mesta nemogoče zajeti večji del njegove vsebine, se odločimo, da ga ne bomo shranjevali.

Pri zajemih posameznih spletišč praviloma delujejo le notranje povezave, razen v primeru, ko so bila posebej zajeta tudi spletna mesta, do katerih vodijo zunanje povezave.

Enako kot pri živem spletu tudi za spletni arhiv velja, da nekatere vsebine niso zadovoljivo prikazane v določenem internetnem brskalniku. V nekaterih primerih je potrebno namesto brskalnika Firefox uporabiti Internet Explorer ali obratno.

Kako uporabljam spletni arhiv?

Na voljo je več načinov iskanja po arhivu:

  •  abecedni seznam: spletna mesta so urejena po abecedi naslovov;
  • brskanje po področjih: spletna mesta so razvrščena tudi po področjih, znotraj vsakega področja pa po abecedi naslovov;
  • iskanje z vnosom URI (uniform resource indentifier): če veste točen URI spletne strani, ki si jo želite ogledati, lahko v iskalno polje vnesete URI;
  • iskanje po celotnem besedilu: z vnosom ene ali več besed v iskalno polje izvedemo iskanje po besedilu spletnih mest v arhivu. Za zdaj je indeksirano besedilo, ki je vsebovano v HTML datotekah.

Na vrhu vsake arhivirane spletne strani se nahaja drsnik s pomočjo katerega se lahko premikate med posameznimi zajemi.