Перейти к основному содержимому

1 запись с тегом "mttr"

Посмотреть все теги

MTTR: почему скорость восстановления важнее предотвращения всех сбоев

· 10 мин. чтения
Artur Pan
CTO & Co-Founder at PanDev

Книга Google Site Reliability Engineering (2016) популяризировала контринтуитивный принцип: примите неизбежность сбоев и инвестируйте в скорость восстановления. Исследования DORA подтвердили это данными — разница между элитными и отстающими командами не в том, что у элитных меньше инцидентов, а в том, что они восстанавливаются менее чем за час вместо недели. Каждая инженерная организация инвестирует в предотвращение сбоев. Немногие инвестируют в быстрое восстановление после них. Данные говорят, что приоритеты расставлены наоборот.