Один из самых важных веб-сайтов Интернета работает в бывшей церкви

Хотя мы иногда представляем веб-сайты парящими в эфире, обычно мы представляем их физические формы как банки серверов. Между тем, Интернет-архив, один из самых посещаемых веб-сайтов в мире, на самом деле находится в потрясающем здании в Сан-Франциско, которое раньше было церковью.

«Я думаю, что роль здесь заключается в том, чтобы запечатлеть то, что произошло», — обнаружил в Internet Archive Брюстер Кейл в интервью газете San Francisco Standard, — «чтобы люди не могли переписывать историю (…) и (…), чтобы опираться на лучшее, что когда-либо делали другие люди». CNN делится пересказом Кале истории Александрийской библиотеки, обширной коллекции, в которой собрана большая часть человеческих знаний того времени. Это была не одна библиотека, а два отдельных объекта, оба из которых, как полагают, были в конечном итоге уничтожены в разные (часто спорные) моменты истории. Это была трагическая утрата того, что, по сути, составляло большую часть суммы письменных человеческих знаний того времени, и именно это Кале и его команда пытаются предотвратить повторение в той бывшей церкви христианской науки в городе у залива.

Давайте более подробно рассмотрим сам сайт и средства, с помощью которых он медленно и неуклонно сохраняет контент Интернета для браузеров будущего. Архивирование контента — ценная функция в Gmail и далеко за ее пределами, и это, пожалуй, наиболее масштабное использование этой концепции.

Продолжающаяся битва за сохранение Интернета

Здание находится по адресу 300 Funston Street, Сан-Франциско. Это бывшая церковь христианской науки, которая прослужила около 86 лет, когда ее купил Интернет-архив в 2009 году. Возможно, это уже не церковь, но это не значит, что ее скамьи пустуют. Основатель также объясняет The San Francisco Standard, что если сотрудник проработал с ним три года, ему вручают небольшую скульптуру, изображающую его самого, сидящего на скамье. «Это способ (…) признать людей, которые проводят свою жизнь, выполняя общественную работу», — сказал Кхейл изданию. Как продолжает хвастаться основатель, в современном мире трудно подобраться к знаменитой Александрийской библиотеке ближе, чем эта. Возможно, среда сильно изменилась, но идея сбора суммы человеческих знаний во многом осталась прежней. Однако процесс этого был невообразим для строителей Александрийской библиотеки.

Сравнительно небольшое количество существующих веб-сайтов активно посещаются и поддерживаются, и это усложняет процесс сохранения важных веб-сайтов. Все, от научных статей до вырезок из старых газет, можно найти заново с помощью Wayback Machine, и именно здесь это и происходит.

Кале объясняет, что Интернет-архив сохранил церковь в основном в том виде, в котором она была, с великолепными скамьями, которые все еще нетронуты и находятся на своих местах. Тем не менее, компания тщательно разместила множество серверов, и «каждый раз, когда мигает свет, это означает, что кто-то либо загружает данные, либо скачивает их из Интернет-архива, так что это активный способ «видеть» Интернет».

Масштаб миссии

Ряд серверов в штаб-квартире Интернет-архивов.

Если вы часто пользовались Интернет-архивом и/или Wayback Machine, вы наверняка начали ощущать масштаб этого ресурса, а также ту любовь и заботу, которые, несомненно, связаны с его поддержанием и продолжением его развития. Чтобы дать представление о масштабах роста Интернета, Всемирный экономический форум сообщает, что в 1992 году в общей сложности существовало десять веб-сайтов. В 1994 году их было почти 3000. Перенесемся в август 2021 года, примерно через три десятилетия после создания первого, и их общее количество составило почти 1,9 миллиарда.

Количество веб-страниц, сохраненных в Интернет-архиве, поистине примечательно. В конце октября 2025 года блоги Интернет-архивов с гордостью хвастались, что «1 триллион веб-страниц сохранен и доступен для доступа через Wayback Machine». Последовали празднования, включавшие выступления Брюстера Кале, Анни Рауверды из Depths of Wikipedia и пионера Интернета Винта Серфа, а также специальные экскурсии по архивам.

Wayback Machine — это результат захвата веб-страницы в том виде, в каком она была на тот момент, и это делается с помощью сканирования. В Интернет-архиве поясняют: «большая часть наших архивированных веб-данных получена в результате нашего собственного сканирования или сканирования Alexa Internet», и что существуют способы сделать контент более доступным и, следовательно, повысить вероятность его добавления, при этом важны тщательные методы связывания и использование каталогов. Помимо самих веб-сайтов, добавляет CNN, Интернет-архив также располагает технологией (от формата микрофиш до проигрывателей), необходимой для записи других медиаформатов для процветания. Против Интернет-архива были иски по поводу доступа к контенту, но его общая функция важна.