Интернет — среда быстроменяющаяся, страницы открываются и исчезают, их содержимое тоже имеет свойство быстро меняться. Что делать, если вам нужна информация, которая когда-то была представлена по какой-то ссылке, а ее сейчас там нет? Только одно — идти на специальный сайт под названием Архив Интернета.
Безусловно, создать точную копию всех сайтов, существовавших когда-либо в виртуальном пространстве, просто нереально. Но время от времени отслеживать обновления, а главное, не дать исчезнуть насовсем тем сайтам, которые по разным причинам перестали существовать — вот основная задача архива Интернета.
Сервис, называемый The Internet Archive Wayback Machine, позволяет просматривать заархивированные версии сайтов Сети, в том числе за определенный промежуток времени.
В декабре 2000 года Конгресс США выделил Библиотеке Конгресса 100 миллионов долларов для разработки национальной программы сохранения цифровой информации. Помимо оплаты хранения, эти деньги пошли и на научные исследования стабильности цифровых носителей.
Не стоит на месте и программное обеспечение, что приводит к появлению большого количества разных форматов, не всегда совместимых между собой.
Поэтому специалисты в архивном деле стараются хранить данные в таких стандартных форматах, как HTML и ASCII.
Объем накопленной в архиве информации измеряется 1PB (petabyte), а растет со скоростью 20 терабайт в месяц. Архив обновляется каждые два месяца. Архив Интернета планирует переписывать собираемые материалы на новые носители каждые 5 лет, чтобы предотвратить потерю данных.
Кроме этого, совместно с архивом Интернета работает специальная поисковая машина Wayback Machine, которая позволяет путешествовать в прошлое Интернета и отыскивать сайты, которых уже не существует.
В качестве базы для поиска Wayback Machine использует не сам Интернет, а Архив Интернета.
Wayback Machine очень полезна для журналистов, поскольку сохраняет «снимки» электронных газет так же, как микрофильмы сохраняют старые бумажные издания. Особенно это актуально в случае электронных изданий, которые не имеют собственного архива.
Для поиска информации в архиве вам достаточно на главной странице указать адрес сайта, в результате чего вы получите список дат, за которые в архиве сохранены «снимки» сайта. Вы можете выбрать нужную дату и просмотреть, как выглядел сайт в определенный день.
Таким образом, с помощью Архива Интернета можно не только отыскивать исчезнувшие сайты, но и просмотреть, как выглядели известные на сегодня ресурсы в начале своей виртуальной жизни.
На сайте также доступен расширенный поиск, благодаря которому можно задать ряд дополнительных параметров, например, диапазон дат, за которые вы хотите просмотреть сайты, а также – ограничение по типу, настройки отображения дубликатов, онлайновый инструмент сравнения найденных страниц и многое другое.
Подготовила Надежда Баловсяк, «ITUA»