
Дарья Попова
Купер
— Как было плохо: семизначное число по входящим алертам в сутки, алерты летят в разработку напрямую, нет выделенной команды координаторов инцидентов, нет процессов. Нет приоритизации инцидентов, метрик реакции и решения инцидентов.
— Почему решили изменить: большая нагрузка на разработку, нет оформленных инцидентов и постмортемов, нужны автоматизации.
— Как стало хорошо: выделенная команда мониторинга 24/7, алерты контролируются командой мониторинга, понятный процесс Incident и Problem Management, координация инцидентов, автоматизация почти на каждом шаге жизни инцидента, дежурства команд разработки.
Купер