В ночь с 28 на 29 июля 2025 года GitHub, одна из крупнейших платформ для хостинга кода и совместной разработки, столкнулась с масштабным сбоем, который затронул миллионы пользователей по всему миру. Инцидент, продолжавшийся около восьми часов, нарушил работу ключевых функций, включая API, систему Issues и Pull Requests - инструменты, без которых невозможна современная разработка ПО.
Проблемы начались около 22:40 UTC, когда инженеры GitHub зафиксировали первые жалобы на замедленную работу сервисов. Вскоре пользователи столкнулись с серьезными трудностями: многие не могли загружать изменения, создавать Pull Requests или работать с Issues. Это вызвало хаос в рабочих процессах команд, особенно для тех, кто находился в часовых поясах, где в это время был пик рабочего дня.
Команда GitHub оперативно отреагировала на инцидент, опубликовав первый статус в официальном блоге: "Мы изучаем сообщения о снижении производительности API, Issues и Pull Requests". Однако ситуация ухудшалась, и к 23:18 компания подтвердила, что некоторые сервисы работают нестабильно. В качестве основной причины была названа проблема с сетевой инфраструктурой, но точные детали на тот момент оставались неизвестными.
Следующие несколько часов разработчики по всему миру наблюдали за обновлениями статуса, надеясь на скорейшее восстановление. К полуночи по UTC GitHub сообщил, что около 4% запросов к критическим сервисам завершались ошибкой. Это означало, что, несмотря на усилия инженеров, значительная часть функциональности оставалась недоступной.
Прорыв произошел только в 01:52 UTC, когда команда GitHub развернула временное решение для устранения сбоя. "Мы применяем меры для устранения инцидента и сообщим о результатах после проверки", - написали представители платформы.
Восстановление шло поэтапно: сначала, в 02:03 UTC, заработала система Issues, затем, спустя две минуты, - Pull Requests. Полное устранение неполадок было подтверждено в 02:06 UTC. "Инцидент устранен. Благодарим за терпение!" - таким было финальное сообщение GitHub.
Этот сбой в очередной раз продемонстрировал, насколько критична зависимость современных IT-процессов от облачных платформ. GitHub, насчитывающий более 100 миллионов пользователей, является не просто инструментом для хранения кода, а ключевым элементом глобальной инфраструктуры разработки ПО. Его отказ парализовал работу тысяч команд, вынуждая их искать временные решения или просто ждать восстановления.
Хотя текущий статус GitHub указывает на стабильную работу сервисов, компания пообещала опубликовать детальный разбор причин сбоя в ближайшее время. Подобные отчеты - стандартная практика после серьезных инцидентов, и аналитики ждут, смогут ли инженеры GitHub выявить системные уязвимости, чтобы предотвратить повторение ситуации.
Для многих организаций этот случай стал напоминанием о том, что даже крупнейшие технологические гиганты не застрахованы от сбоев. Вопрос отказоустойчивости облачных сервисов и скорости реагирования на инциденты остается одним из самых актуальных в индустрии, особенно когда от стабильности платформ зависит работа тысяч компаний по всему миру.