приручаем prometheus в масштабах

best practices из bigtech

Как подготовить метрики, системы и инженеров к росту, и не допустить ситуацию, в которой мониторинг становится проблемой, а не инструментом? 2-х часовой урок вместе c SRE из TravelTech
29 сентября ПН, 19:00 МСК
Причина не в prometheus, а в подходе к архитектуре и игнорировании проблем в observability-стеке, пока он еще хоть как-то справляется
Метрики, которые помогают инженерам, превращаются в шум, алерты начинают прилетать сотнями, а дашборды грузятся десятки секунд

Любая система может сломаться на масштабе

Prometheus — не исключение

На уроке научимся готовить prometheus к масштабированию
/1
Как подготовить метрики, системы и инженеров к росту
/2
Как не допустить точки невозврата, когда мониторинг перестает быть инструментом и становится проблемой
/3
Что смотреть в prometheus, чтобы понять, когда он перестанет вывозить нагрузку
/4
Проблемы роста кардинальности метрик и как они решаются при помощь relabeling
/5
Оптимизация хранения и получения метрик, включая federation, sharding и remote write
/6
Способы оптимизации запросов promQL на основе recording rules
/7
Ошибки в запросах promQL, которые приводят к неправильной интерпретации метрик
/8
Пути получения нешумных алертов на основе SLO и error budget
/9
Паттерны предаггрегации метрик на стороне сервиса для получения более высокой точности измерений

Преподает Виталий Лихачев

SRE в TravelTech, который ты точно знаешь

повышаю стабильность и надежность систем с сотнями миллионов пользователей
NDA (TravelTech)
ex-senior разработчик платформы авторизации
Avito Tech
ex-разработчик системы управления складами
EPAM
на ивентах и конференциях
44 доклада
работы в BigTech-компаниях
6000+ часов
обучил в других онлайн-школах
500+ учеников
занимаюсь программированием
10+ лет
запишись на бесплатный урок
{
ффф"public_lesson": {
ффффф"price": free
ффф}
}
Жми на кнопку и заполняй форму регистрации — добавим тебя в Telegram-чат урока, где будет ссылка на прямой эфир и запись
29 сентября ПН, 19:00
Урок начнется через:
23
14
дней
часов
минут
секунд
14
07
:
:
:
best practices по Prometheus
теория и практика в прямом эфире
запись урока для зарегистрировавшихся
Частые вопросы
Урок подойдет backend-разработчикам на любом языке программирования. Будет проще, если ты:
  • от уровня Middle
  • умеешь работать с Docker Compose
  • имеешь опыт работы с терминалом

Junior-специалистам будет полезно, но сложно. На этом грейде не требуют знаний observability, но если не пугает сложность и ты хочешь быстрее расти — you are welcome:)

Остались вопросы?

Если у тебя срочный вопрос, можешь написать нам в Telegram-бот
Если ты готов немного подождать, оставляй вопрос на сайте — мы свяжемся с тобой в ближайшее время