O arhivu
Čemu arhiviranje spleta?
Narodna in univerzitetna knjižnica zbira, hrani, varuje in ohranja pisno kulturno
in znanstveno dediščino slovenskega naroda ter omogoča uporabo svojih zbirk tako
domačim kot tujim uporabnikom. Z vsakokratnim pojavom novih medijev ali nosilcev
informacij smo morali tudi v knjižnicah poskrbeti za te nove vrste gradiva in
jih obravnavati z enako mero odgovornosti, kot je veljala tradicionalnim
nosilcem. Svetovni splet je že nekaj časa prostor, na katerem se pojavljajo
najrazličnejše publikacije z vseh področij človekovega ustvarjanja, tako
znanstveno raziskovalnega kot kulturno umetniškega, poleg tega pa je to tudi
prostor komunikacije, izmenjave informacij in znanja, povezovanja ter
vzpostavljanja najrazličnejših odnosov med posamezniki ali skupinami
posameznikov.
Ko govorimo o nacionalni ali svetovni kulturni dediščini, ne moremo več
izključiti tega obsežnega in kompleksnega prostora, ki je pri produkciji in
pretoku znanja danes že v precejšnji meri nadomestil klasične mehanizme in poti.
S stališča bibliotekarske stroke se kulturne dediščine lotevamo predvsem z
vidika trajnega ohranjanja in trajnega omogočanja uporabe, zato smo se v
knjižnicah morali soočiti tudi z izzivi ohranjanja spletnih mest, tako njihove
vsebine kot tudi specifične strukture, ki je že sama po sebi vredna ohranitve za
prihodnje rodove. Zajemanje in arhiviranje vsebin na spletu sta dejavnosti, ki
ju izvajajo predvsem nacionalne ali regionalne knjižnice in sta v skladu z
njihovim poslanstvom logična nadgradnja zbiranja, obdelave, hranjenja in dajanja
v uporabo klasičnih publikacij na fizičnih nosilcih.
Kaj je arhiviranje spleta?
Pri arhiviranju vsebin na spletu gre za sistematično zajemanje in arhiviranje
določenih delov svetovnega spleta. Spletna mesta zajemamo s pomočjo posebnih
aplikacij za samodejni zajem (bolj poznane pod imeni kot so spletni roboti ali
pajki). Zajamemo in shranimo jih na tak način, da ohranijo vse notranje
povezave med posameznimi stranmi in datotekami znotraj spletišča. Arhivirano
spletno mesto je v idealni situaciji enako izvirniku na živem spletu in omogoča
tudi enako uporabo.
Pri vsakem zajemu je možno določiti obseg shranjene vsebine glede na globino in
širino. Lahko napravimo le posnetek prve strani spletišča ali pa posežemo
globlje na drugi, tretji ali najgloblji nivo. Glede na širino lahko zajamemo le
strani in pripadajoče datoteke na eni domeni ali pa razširimo zajem na nekatere
druge domene, ki k celoti spletišča, kot jo doživlja uporabnik morda, prispevajo
pomembnejši del vsebine.
Na podlagi praktičnih izkušenj institucij, ki izvajajo to dejavnost, lahko glede
na obseg ločimo dva pristopa k zajemanju – selektivnega in celostnega. Pri prvem
zajemamo določeno število izbrani spletišč, ki jih skušamo zajeti čim bolj
popolno. Ta pristop mnogi imenujejo tudi tematsko zajemanje, saj so izbrana
spletna mesta pogosto s področja neke specifične tematike ali pa pokrivajo
določen dogodek (npr. volitve). Pri celostnem zajemanju pa gre za shranitev
celotne nacionalne domene ali podobno velikega kosa spleta.
Ker se vsebine na spletu neprestano spreminjajo, tudi zajeme posameznega
spletnega mesta izvajamo kontinuirano z različnimi frekvencami. Ta je odvisna od
pogostosti spreminjanja spletnega mesta, njegove velikosti in od kapacitete
strojne opreme, ki jo imamo na voljo. Uporabnik arhiva lahko zato dostopa do
različnih verzij spletnih mest, kot so bile arhivirane skozi čas.
Kaj vsebuje spletni arhiv?
Arhiv vsebuje spletna mesta, ki smo jih v NUK shranjevali od leta 2008. Trenutno
je v arhivu shranjenih čez 1000 spletnih mest, v glavnem s področij javne
uprave, visokega šolstva, znanosti, kulture in tudi nekatere serijske
publikacije v spletni obliki.
Kljub temu, da ima na podlagi Zakona o obveznem izvodu publikacij NUK možnost
shranjevati vse spletne strani, ki imajo značaj slovenike, lahko zaradi omejenih
sredstev zdaj shranjujemo le majhen vzorec slovenskega spleta. Nabor spletnih
mest postopoma širimo. V začetnem obdobju pa smo se po zgledih iz tujine najprej
lotili zgoraj navedenih področij. V prihodnosti nameravamo izbor razširiti v
skladu z lastnimi zmožnostmi.
Praviloma je vsako spletno mesto zajeto večkrat z določeno frekvenco. Zato so
posamezni zajemi v arhivu urejeni po datumu, uporabnik pa si lahko izbere,
katero različico spletnega mesta si bo ogledal. Večino spletnih mest zajemamo
dvakrat letno, manjši del pa štirikrat letno in enkrat mesečno. V nekaterih
primerih pokrivanja časovno omejenih dogodkov (npr. volitve) smo določen izbor
spletnih mest zajemali tedensko ali dnevno.
Česa arhiv ne vsebuje?
Arhiviranje vsebin na spletu zaradi tehničnih lastnosti samega spleta skoraj
nikoli ni popolno. Čeprav se postopki zajemanja neprestano razvijajo in
izpopolnjujejo obstajajo segmenti spleta, ki jih je nemogoče učinkovito zajeti
in shraniti. Naš cilj je shraniti vsako spletno mesto v celoti, vendar je
potrebno upoštevati, da to ni vedno možno. Kljub temu da je uporaba arhiviranih
spletnih mest enaka uporabi živega spleta, so nekatere funkcionalnosti spletnih
strani v arhivu omejene ali jih preprosto ni:
- vsebin, ki so na spletu dostopne ob registraciji z uporabniškim imenom in
geslom, arhiv praviloma ne vsebuje;
- dinamično generirane vsebine, ki je na živem spletu dostopna s poizvedbo v bazi,
robotski program ne more zajeti, ker ne more izpolnjevati iskalnih polj;
- spletni arhiv še ne vsebuje pretočnih avdio in video vsebin. Postopke za zajem
tovrstnih vsebin še razvijamo, trenutno pa še ni na voljo standardiziranih
rešitev;
- nekatera spletna mesta so zaradi specifične izvedbe zajeta pomanjkljivo, kar
pomeni, da lahko manjkajo nekateri oblikovni ali (redkeje) vsebinski elementi.
Po vsakem zajemu opravimo tudi preverbo kakovosti. Načeloma velja, da shranimo
tiste zajeme, pri katerih je ohranjen vsaj bistven del vsebine, kljub temu, da
mogoče manjkajo nekateri oblikovni elementi. V redkih primerih, ko je zaradi
narave spletnega mesta nemogoče zajeti večji del njegove vsebine, se odločimo,
da ga ne bomo shranjevali.
Pri zajemih posameznih spletišč praviloma delujejo le notranje povezave, razen v
primeru, ko so bila posebej zajeta tudi spletna mesta, do katerih vodijo zunanje
povezave.
Enako kot pri živem spletu tudi za spletni arhiv velja, da nekatere vsebine niso
zadovoljivo prikazane v določenem internetnem brskalniku. V nekaterih primerih
je potrebno namesto brskalnika Firefox uporabiti Internet Explorer ali obratno.
Kako uporabljam
spletni arhiv?
Na voljo je več načinov iskanja po arhivu:
- abecedni seznam: spletna mesta so urejena po abecedi naslovov;
- brskanje po področjih: spletna mesta so razvrščena tudi po področjih, znotraj
vsakega področja pa po abecedi naslovov;
- iskanje z vnosom URI (uniform resource indentifier): če veste točen URI spletne
strani, ki si jo želite ogledati, lahko v iskalno polje vnesete URI;
- iskanje po celotnem besedilu: z vnosom ene ali več besed v iskalno polje izvedemo
iskanje po besedilu spletnih mest v arhivu. Za zdaj je indeksirano besedilo, ki
je vsebovano v HTML datotekah.
Na vrhu vsake arhivirane
spletne strani se nahaja drsnik s pomočjo katerega se lahko premikate med
posameznimi zajemi.