Nové přírůstky 2012 (4. týden)

V týdnu od 23.-29.1.2012 jsme uzavřeli smlouvu na následující zdroje:

Lucie Vondráčková
http://lucievondrackova.cz
- frekvence sklízení: 2x ročně




Nové přírůstky 2012 (3. týden)

V týdnu od 16.-22.1.2012 jsme uzavřeli smlouvu na následující zdroje:

Pomníčky Jizerské hory
http://stovi.info/pomnicky/
- frekvence sklízení: 2x ročně




Statistiky výběrové sklizně - leden 2012

Výběrová sklizeň za leden 2012 (viz předchozí příspěvek) byla úspěšně ukončena. Celkem se sklidilo 317 GB dat (4,7 milionů objektů).

Návrhy od vydavatelů a uživatelů - leden 2012 (1/2)

Návrhy na zařazení zdrojů může zasílat kdokoli pomocí formuláře na stránkách WebArchivu nebo emailu.

V období od 1. do 15.1.2012  bylo navrženo 13 zdrojů:

Teplice///Teplitz : architektura na severu Čech
http://teplice-teplitz.net

Nové přírůstky 2012 (1. a 2. týden)

V týdnech od 2. - 8. 1. 2012 a 9. 1. -15. 1. 2012 jsme uzavřeli smlouvy na následující zdroje:

Koroptvicky.cz
http://www.koroptvicky.estranky.cz
- frekvence sklízení: 2x ročně






Indexace sklizní 2011

Všechny výběrové sklizně roku 2011 jsou nyní zaindexovány pro základní vyhledávání přes URL zdroje.

Co to znamená, resp. k čemu je to dobré?

Tematická sklizeň Václav Havel

Národní knihovna ČR připravila tematickou sklizeň k úmrtí prvního polistopadového československého a českého prezidenta Václava Havla, který zemřel 18. prosince 2011. Sklizeň proběhla v několika kolech na přelomu roku 2011/2012. Tato sklizeň byla v v jednom ohledu výjimečná.

Typologie sklizní WebArchivu

Terminologie: sklizeň - automatické procházení, stahování a ukládání webových stránek pomocí robotů na základě definovaných parametrů (z anglického web harvesting, doslova sklízení webu; robot je pak nazýván harvester nebo také crawler)

Ve WebArchivu jsou prováděny 3 základní typy sklizní:

Výběrová sklizeň - leden 2012

Včera byla spuštěna první řádná sklizeň roku 2012 - výběrová sklizeň zdrojů se smlouvou s frekvencí sklízení jeden měsíc. Sklízí se 211 zdrojů (255 semínek) - viz seznam archivovaných zdrojů.

O blogu WebArchiv

WebArchiv je projekt Národní knihovny ČR zaměřený na dlouhodobé uchování a zpřístupnění obsahu "českého" webu. Projekt běží od roku 2001. Záměrem blogu je uchovat kontext a historické informace o WebArchivu. Budeme zde prezentovat, co, jak a proč děláme. Postupně budeme přidávat také příspěvky dokumentující historii projektu. Příležitostně budeme také upozorňovat na zajímavosti z oblasti archivace webu.