Co je to Wayback Machine a proč je užitečný?
Internet Webové Stránky Hrdina / / April 22, 2021
Poslední aktualizace dne
Wayback Machine je nejoblíbenější částí Webové stránky internetového archivu. Tento bezplatný online nástroj, který byl poprvé představen v roce 2001, vám umožní „vrátit se v čase“ a podívat se, jak vypadaly webové stránky po celém světě v určitých okamžicích. Wayback Machine obsahuje 562 miliarda webové stránky v době psaní tohoto článku, každý rok je přidáno mnoho dalších.
Zde je pohled na Wayback Machine a na to, čím je výjimečný.
Úvod do internetového archivu
Internetový archiv, který vytvořili Brewster Kahle a Bruce Gilliat, je nezisková organizace se stanoveným posláním „univerzálního přístupu ke všem znalostem“. Od začátku, organizace poskytla bezplatný veřejný přístup k digitalizovaným materiálům, jako jsou webové stránky, knihy, zvukové nahrávky, včetně živých koncertů, videí, obrázků a softwaru programy.
K dnešnímu dni vše, co shromáždil internetový archiv, zabírá více než 70 Petabajty místa na serveru, včetně dvou kopií všeho. Organizace je financována z darů, grantů a poplatků ze služeb digitalizace knih. Z důvodu ochrany osobních údajů internetový archiv nesleduje adresy IP svých čtenářů a používá protokol HTTPS (zabezpečený).
Wayback Machine
Pouze jedna část internetového archivu, Wayback Machine, byla navržena tak, aby zachytila změněný nebo odstraněný obsah webových stránek. Od spuštění se stalo jedním z nejpopulárnějších a nejuznávanějších míst na webu. Kahle a Gilliat pojmenovali web podle fiktivního zařízení pro cestování časem v animované sérii z 60. let, The Rocky and Bullwinkle Show.
Ačkoli Internet Archive spustil web pro veřejnost až v říjnu 2001, Wayback Machine začal archivovat webové stránky v mezipaměti od května 1996. Do roku 2001 digitální pásky uchovávaly informace, které byly přístupné pouze vybraným vědcům a vědcům. Když se vše o pět let později stalo veřejností (jak bylo dlouho plánováno), obsahovalo již více než 10 miliard archivovaných stránek.
Skladování a sbírky
Dnes web uchovává historická data na clusteru uzlů Linuxu. Stroj Wayback Machine stahuje všechny veřejně přístupné informace a datové soubory na webové stránky prostřednictvím svého mechanismu procházení. Není zde však zahrnuto vše zveřejněné na webu, protože určitý obsah je omezen nebo uložen v databázích, které nejsou přístupné. Z tohoto důvodu jsou některé weby procházeny lépe než jiné, v závislosti na tom, jak vývojáři web vytvořili najednou.
Všimnete si také, že čím novější je archiv, tím více obsahu je k dispozici pro daný web. Nový nástroj, který internetový archiv představil v roce 2005, je jedním z důvodů, proč jsou novější data úplnější. Archive-It.org pomáhá překonat nesrovnalosti na částečně uložených webech tím, že umožňuje institucím a tvůrcům obsahu získávat a uchovávat sbírky digitálního obsahu.
O procházení
Prohledávače webu, někdy nazývané spider nebo spiderbot, jsou stejně staré jako samotný internet. Tyto prohledávače jsou internetoví roboti, kteří neustále procházejí web pro účely indexování, což z nich dělá důležitou součást jakéhokoli moderního vyhledávače. Prohledávače používané pro Wayback Machine k vytváření digitálních snímků webů pocházejí z různých zdrojů, které se časem měnily.
Jak si rychle všimnete, frekvence zachycení snímků se u jednotlivých webů velmi liší. Typicky, čím větší (a možná i populárnější) web, tím více procházení. Navíc hodně záleží na tom, jak často má web změny na stránce. I ty nejmenší weby jsou nakonec procházeny, pokud není důvod, proč tomu tak není. Například weby chráněné heslem neprocházejí a nejsou zahrnuty ani weby, jejichž vlastníci požadovali.
Používání stroje Wayback
Web Wayback Machine je snadno použitelný pro každého. Chcete-li najít historické snímky webu, zadejte jeho název do vyhledávače webu. Na stránce s výsledky vyhledávání hypertextové odkazy označují data a časy, kdy byl web archivován. Kliknutím na odkaz zobrazíte web „zpět v čase“.
V následujících příkladech můžete vidět přední stránku webu Apple zaznamenanou v únoru 2005 a listopadu 2014 a domovskou stránku CNN od data v březnu 2004 a září 2010.
Poznámka: Tyto procházení zahrnují také odkazy na jiné stránky zaznamenané v daný den, nejen na domovské stránky.
Pokročilé nástroje
Stroj Wayback vytvořený pro výzkumné pracovníky i veřejnost má několik vestavěných nástrojů, které by příležitostným uživatelům mohly chybět. Například podle návrhu lze snadno vyhledávat stránky s výsledky vyhledávání. Jak bylo vysvětleno: „Pokud najdete archivovanou stránku, na kterou byste chtěli odkazovat na své webové stránce nebo v článku, můžete adresu URL zkopírovat. Můžete dokonce použít fuzzy shodu URL a specifikaci data... ale to je o něco pokročilejší. “
Wayback Machine také umožňuje vlastníkům webů použít k uložení konkrétní stránky funkci „Uložit stránku nyní“. A přesto to není dokonalé. V současné době tato funkce nepřidává adresu URL webu k žádnému budoucímu procházení. Žádost navíc neukládá více než jednu stránku. Je to však dobrý první krok k archivaci domovské stránky vašeho webu pro historické záznamy.
Nemusíte pokaždé navštěvovat Wayback Machine, abyste provedli nové vyhledávání. Místo toho můžete najít obsah zadáním adresy na panelu nástrojů webového prohlížeče. Tento formát použijte pro všechna vyhledávání: http://web.archive.org/*/www.yoursite.com/*. Například použijte http://web.archive.org/*/www.groovypost.com/* najít archivované stránky pro GroovyPost!
Mobilní a vývojářské nástroje
A konečně, Wayback Machine není umístěn pouze na webu. Můžete najít aplikaci Wayback Machine pro iOS a Android. K dispozici jsou také rozšíření pro Chrome, Safari a Firefox. Vývojáři si také budou chtít vyzkoušet rozhraní API pro internetový archiv Wayback Machine. To vývojářům usnadňuje získávání informací o datech zachycování Wayback.
Stroj internetového archivu Wayback podporuje několik různých API. Díky tomu vývojářům usnadní získávání informací o datech zachycení Wayback.
Návrat „zpět v čase“ pro vaše oblíbené webové stránky je důvodem číslo jedna pro návštěvu stroje Wayback Machine. Je to také skvělý nástroj pro kohokoli, kdo zkoumá historii webových stránek pro školní projekty nebo pro obchodní využití. Ať děláte cokoli, navštivte Wayback Machine a v několika jednoduchých krocích uvidíte, co můžete objevit.
Další informace o službě předplatného Archive-It internetového archivu najdete na oficiální webové stránky a začněte přispívat ještě dnes!