úterý 6. března 2012

Jak nalézt zdroje uložené ve WebArchivu


Existuje několik způsobů, jak nalézt zdroje uložené ve WebArchivu.

1) Vyhledávání

Základní způsob, jak nalézt všechny webové stránky, ať jsou archivované v rámci celoplošných nebo výběrových sklizní. Odkaz na vyhledávání je dostupný na hlavní stránce WebArchivu. Prokliknutím se zobrazí jednoduchá „googlovská“  řádka.


Vyhledávat lze dvěma způsoby, pomocí URL a klíčových slov. Při vyhledávání pomocí URL je nutné zadat konkrétní URL adresu stránek, je ji možné zapsat v různých tvarech: nkp.cz, www.nkp.cz, http://nkp.cz, http://www.nkp.cz, s lomítkem nebo bez lomítka na konci (http://nkp.cz/ nebo http://nkp.cz).

Ke zpřístupnění archivu  je používán program Wayback Machine, což je open source systém vyvinutý americkou organizací Internet Archive. Wayback zobrazí výsledky hledání jako soupis jednotlivých archivovaných verzí stránek. Alternativně může zobrazit také oznámení, že je zdroj z důvodu omezení autorským zákonem přístupný pouze v prostorách Národní knihovny nebo že se ve WebArchivu nenachází.

Výsledky hledání je možné dále zpřesňovat. Na stránce se zobrazenými výsledky vedle řádku pro zadání URL adresy lze pomocí drop-down menu omezit hledání na konkrétní rok nebo zvolit pokročilé vyhledávání.


Druhým způsobem je vyhledávání pomocí klíčových slov. Celý obsah WebArchivu je fulltextově indexovaný pomocí nástroje NutchWax. Pro zadání rešeršního dotazu lze používat booleovské operátory (AND, OR, NOT) a hledat fráze zapsáním do uvozovek "". Výsledky hledání jsou zobrazeny jako seznam zvýrazněných klíčových slov včetně úryvku textu a odkazů do WebArchivu a na živé stránky.


Pokud nenajdete stránky ve WebArchivu, můžete zkusit hledat v Internet Archive.

2) Prohlížení

Zdroje, na které byla uzavřena smlouva a které jsou archivovány v rámci výběrových sklizní, jsou po zkatalogizování zařazeny do předmětového rejstříku. Ten je rozdělen do 26 hlavních kategorií dle metody Konspektu. U jednotlivých kategorií je zobrazen počet zdrojů, které obsahují.



Hlavní kategorie se dále dělí do podkategorií. Záznamy jsou v nich uspořádány v abecedním pořadí, obsahují odkaz do WebArchivu, náhled stránek, jejich název, anotaci, klíčová slova a odkaz na živé stránky.



Vybráním konkrétního klíčového slova se zobrazí seznam všech zdrojů, kterým bylo přiřazeno.



Alternativně lze k vyhledání zdrojů se smlouvou použít abecední seznam spolupracujících vydavatelů, který se nachází v levém menu na hlavních stránkách WebArchivu. Ke každému jménu je přiřazen název stránek, na které byla uzavřena smlouva. Odkaz z něj vede na živý web. Následně je tedy nejlepší pro zobrazení archivovaných verzí použít klasické vyhledávání.



3) Katalog Národní knihovny ČR

Přes katalog Národní knihovny ČR a jeho dílčí báze Elektronické online zdroje je možné vyhledat všechny zkatalogizované zdroje WebArchivu (tj. všechny zdroje se smlouvou a některé další vybrané zdroje). Je tak možné využívat všech výhod knihovního katalogu. Katalogizační záznamy ale zatím obsahují pouze odkaz na aktuální verzi stránek na živém webu. Nalezené zdroje je tedy nutné následně vyhledat přímo na stránkách WebArchivu.