Automattic и Internet Archive выпустили плагин WordPress для вечной жизни ссылок

Internet Archive

Компания Automattic, стоящая за WordPress.com, и некоммерческая организация Internet Archive объявили о совместном проекте, призванном остановить «гниение ссылок» (link rot) - одну из фундаментальных проблем сохранности информации во Всемирной паутине. Новый бесплатный плагин Internet Archive Wayback Machine Link Fixer автоматически находит неработающие ссылки на сайтах WordPress и заменяет их сохранёнными копиями из знаменитого цифрового архива Wayback Machine.

Проблема исчезающих ссылок давно волнует исследователей и контент-мейкеров. Согласно недавнему исследованию Pew Research Center, около 40% ссылок, активных в 2013 году, сегодня ведут в никуда. Страницы перемещаются, домены не продлеваются, а целые сайты закрываются, оставляя после себя цифровые «белые пятна» и разрывая контекст в миллионах статей. Новый инструмент предлагает системное решение этой проблемы для самой популярной в мире системы управления контентом (CMS).

Плагин функционирует полностью в автоматическом режиме. После установки он начинает сканировать контент сайта, выявляя все внешние ссылки. Для каждой из них происходит проверка через API Wayback Machine на наличие сохранённого «снимка» страницы. Если архивной версии нет, плагин сам инициирует её создание. Когда исходная ссылка перестаёт работать, посетитель сайта незаметно для себя перенаправляется на доступную архивную копию, что предотвращает появление ошибки 404. Важно, что система постоянно перепроверяет статус ссылок. Следовательно, если оригинальная страница снова становится доступной, редирект на архив прекращается.

Помимо защиты внешних ссылок, плагин вносит вклад в сохранение собственного контента владельца сайта. Каждый раз при обновлении публикации он автоматически отправляет её URL в Wayback Machine для архивации, создавая хронологическую запись изменений. Это может быть особенно ценно для новостных изданий, блогов и академических ресурсов. Функционал настраивается, например, можно задать периодичность проверки ссылок, которая по умолчанию составляет три дня.

С технической точки зрения, плагин является открытым исходным кодом и взаимодействует с двумя внешними сервисами Internet Archive. Основной API Wayback Machine используется для поиска и создания архивных копий. Отдельный API бота (Bot API) применяется для проверки доступности ссылок и отслеживания редиректов. Разработчики подчёркивают аспекты приватности: единственными данными, передаваемыми в Internet Archive, являются сами URL-адреса. Никакая личная информация пользователей не передаётся. При этом отправленные URL становятся частью публичного цифрового архива.

Запуск этого плагина отражает общую философию обеих организаций, направленную на сохранение открытого и долговечного веба. Internet Archive с 1996 года занимается архивацией интернета, а Automattic, развивая экосистему WordPress, стремится к децентрализации и устойчивости веб-контента. Этот симбиоз позволит владельцам миллионов сайтов на WordPress практически без усилий повысить надёжность своих материалов, улучшить пользовательский опыт и защитить ссылочную массу, что также важно для поисковой оптимизации (SEO). Плагин уже доступен для бесплатной установки в официальном репозитории WordPress.org.

Комментарии: 0