Яндекс упал на несколько часов из-за ошибки конфигурирования марштуризатора

Из-за ошибки конфигурирования маршрутизатора в новом датацентре сервисы Яндекса были недоступны в течение нескольких часов. Описание проблемы доступно в блоге Яндекса:

"В Яндексе используются протоколы маршрутизации внутренний протокол OSPF и внешний протокол BGP. Из-за ошибки информация обо всех внешних маршрутах оказалась во внутренних таблицах маршрутизации. Это примерно на три порядка больше маршрутов, чем обычно. Протокол OSPF не рассчитан на такое количество. В результате у всех маршрутизаторов кончилась память, и они перестали работать. Нарушилась работа сети, и через несколько минут Яндекс стал полностью недоступен."

С учетом того, что из-за проблем с маршрутизацией не работала и вся внутренняя сеть, выявление и устранение ошибки было не самой приятной задачей.

Помимо самого Яндекса и его пользователей среди пострадавших замечена масса сайтов, на которых был установлен Яндекс.Директ, Карты и другие сервисы, выдача которых из-за этого была практически заморожена, либо которые пользовались библиотекой JQuery с Яндекса, а также Рамблер, недавно перешедший на поиск Яндекса.

Top