Как подготовить метрики, системы и инженеров к росту, и не допустить ситуацию, в которой мониторинг становится проблемой, а не инструментом? 2-х часовой урок вместе c SRE из TravelTech
Урок подойдет backend-разработчикам на любом языке программирования. Будет проще, если ты:
от уровня Middle
умеешь работать с Docker Compose
имеешь опыт работы с терминалом
Junior-специалистам будет полезно, но сложно.На этом грейде не требуют знаний observability, но если не пугает сложность и ты хочешь быстрее расти — you are welcome:)
Разберем best practices в Prometheus и научимся делать все, как в BigTech-компаниях:
как подготовить к росту не только ваши метрики, но и системы, и инженеров
как не допустить точки невозврата, когда мониторинг перестанет быть инструментом, а станет проблемой сам по себе
что смотреть в prometheus, чтобы понять, когда он перестанет вывозить нагрузку
проблемы роста кардинальности метрик и как они решаются при помощь relabeling
подходы к оптимизации хранения и получения метрик, включая federation, sharding и remote write
способы оптимизации запросов promQL на основе recording rules
ошибки в запросах promQL, которые приводят к неправильной интерпретации метрик
пути получения нешумных алертов на основе SLO и error budget
паттерны предаггрегации метрик на стороне сервиса для получения более высокой точности измерений
В понедельник 29 сентября в 19:00 по МСК. Запись будет для всех, кто зарегистрировался на урок