Если вы узнали что прод упал - от клиента - у вас не прод. У вас MVP.
Вы запустили продукт. Клиенты им пользуются. Уже хорошо. Но продакшен без мониторинга - это ваш клиент в роли дежурной смены.
На интервью DevOps-инженера спрашивают: “как вы действуете при звонке ‘прод упал’?” Хороший ответ: “такого звонка не должно быть”.
Не потому что DevOps такой крутой. А потому что система должна знать о проблеме раньше клиента. Всегда.
Как выглядит нормально:
СТО утром получает сообщение: “Ночью упало X. Даунтайм 5 минут. Причина такая. Пофиксили так. Постмортем к вечеру.”
Не звонок от клиента. Отчёт от команды.
Если у вас иначе - вопрос не к DevOps. Вопрос к вам: как так получилось, что клиент узнал раньше?
Напишите, разберёмся.