В этом видео:
Prometheus — это высокопроизводительная система мониторинга и хранения временных рядов, созданная для микросервисных и распределённых сред. Он использует pull-модель, мощный язык запросов и собственную TSDB, позволяя точно контролировать состояние сервисов, анализировать поведение систем под нагрузкой и строить надёжную наблюдаемость в продакшене.
В данном бесплатном уроке автор последовательно разбирает, с какими реальными трудностями сталкиваются команды, когда начинают использовать Prometheus в крупных системах мониторинга. В начале он предлагает рассмотреть, как устроены основные компоненты, каким образом формируется конфигурационный файл, какие параметры в нём действительно важны и как на практике происходит создание метрик для разных приложений.
Сначала автор останавливается на ключевых проблемах масштабирования. Подробно обсуждаются рост кардинальности метрик, чрезмерная нагрузка на раздел хранения, перегруженность лейблов и ситуации, когда система перестаёт справляться с объёмом данных. Отдельное внимание уделяется тому, как неправильная структура метрик приводит к увеличению нагрузки на базу и усложняет работу сервисов, от которых зависит стабильность компании. Автор подчеркивает, что без дисциплины при проектировании метрик и без регулярной проверки их качества даже хороший инструмент может работать неэффективно.
Затем он переходит к устройству внутреннего хранилища. Здесь объясняется, как данные сначала записываются в оперативную память, потом переходят в долговременное хранение, и почему архитектура хранения так чувствительна к неправильному набору параметров и чрезмерной детализации. Рассматриваются особенности работы с разными источниками сбора, взаимодействие между сервисами сервера, поведение системы в момент нагрузки и влияние структуры данных на производительность.
В финальной части видео автор обсуждает подход Observability Driven Development. Он подчёркивает, что наблюдаемость должна быть не надстройкой, а частью проектирования. Важно, чтобы разработчики изначально закладывали необходимые метрики, понимали, как они будут использоваться в мониторинга, и какие процессы помогают обеспечить прозрачность и диагностируемость. Такой подход позволяет эффективно отслеживать состояние сервиса, быстро реагировать на отклонения в случае их появления, получать доступ к нужной информации и выстраивать удобный интерфейс.
Кому может быть полезен этот урок:
Урок по Prometheus ведет Виталий Лихачев, который на текущий момент работает в Travel Tech, где повышает стабильность и надежность систем с сотнями миллионов пользователей. Виталий занимается программирование уже более 10 лет, имеет более 6000 часов работы в Big-Tech компаниях и обучил более 500 учеников.
Более подробнее о Prometheus, а также о том, как поставлять логи, метрики, трейсы, делать информативные дашборды, быстро устранять инциденты и правильно интерпретировать данные, ты можешь узнать на нашем курсе "Observability, как в BigTech". В рамках курса ты узнаешь:
Курс подойдет backend-разработчикам от уровня Middle. Практика будет на Golang, но знания применимы ко всем языкам программирования, поскольку инструментация Observability универсальна, и различия в языках минимальные.
Благодаря курсу ты:
- 00:00 - Введение
- 02:26 - Проблемы Prometheus
- 05:57 - Устройство хранения в Prometheus
- 53:09 - Observability driven development
- 01:20:12 - Курс по observanility, как в BigTech
Prometheus — это высокопроизводительная система мониторинга и хранения временных рядов, созданная для микросервисных и распределённых сред. Он использует pull-модель, мощный язык запросов и собственную TSDB, позволяя точно контролировать состояние сервисов, анализировать поведение систем под нагрузкой и строить надёжную наблюдаемость в продакшене.
В данном бесплатном уроке автор последовательно разбирает, с какими реальными трудностями сталкиваются команды, когда начинают использовать Prometheus в крупных системах мониторинга. В начале он предлагает рассмотреть, как устроены основные компоненты, каким образом формируется конфигурационный файл, какие параметры в нём действительно важны и как на практике происходит создание метрик для разных приложений.
Сначала автор останавливается на ключевых проблемах масштабирования. Подробно обсуждаются рост кардинальности метрик, чрезмерная нагрузка на раздел хранения, перегруженность лейблов и ситуации, когда система перестаёт справляться с объёмом данных. Отдельное внимание уделяется тому, как неправильная структура метрик приводит к увеличению нагрузки на базу и усложняет работу сервисов, от которых зависит стабильность компании. Автор подчеркивает, что без дисциплины при проектировании метрик и без регулярной проверки их качества даже хороший инструмент может работать неэффективно.
Затем он переходит к устройству внутреннего хранилища. Здесь объясняется, как данные сначала записываются в оперативную память, потом переходят в долговременное хранение, и почему архитектура хранения так чувствительна к неправильному набору параметров и чрезмерной детализации. Рассматриваются особенности работы с разными источниками сбора, взаимодействие между сервисами сервера, поведение системы в момент нагрузки и влияние структуры данных на производительность.
В финальной части видео автор обсуждает подход Observability Driven Development. Он подчёркивает, что наблюдаемость должна быть не надстройкой, а частью проектирования. Важно, чтобы разработчики изначально закладывали необходимые метрики, понимали, как они будут использоваться в мониторинга, и какие процессы помогают обеспечить прозрачность и диагностируемость. Такой подход позволяет эффективно отслеживать состояние сервиса, быстро реагировать на отклонения в случае их появления, получать доступ к нужной информации и выстраивать удобный интерфейс.
Кому может быть полезен этот урок:
- Разработчикам, которые хотят правильно проектировать метрики и понимать влияние своих сервисов на мониторинг с помощью Prometheus.
- Инженерам DevOps и SRE, работающим с большими системами и сталкивающимся с проблемами хранения и использованием метрик.
- Командам, стремящимся улучшить культуру наблюдаемости.
- Тем, кто хочет разобраться, как обеспечить корректную настройку, доступность данных и прозрачность работы сервисов.
Урок по Prometheus ведет Виталий Лихачев, который на текущий момент работает в Travel Tech, где повышает стабильность и надежность систем с сотнями миллионов пользователей. Виталий занимается программирование уже более 10 лет, имеет более 6000 часов работы в Big-Tech компаниях и обучил более 500 учеников.
Более подробнее о Prometheus, а также о том, как поставлять логи, метрики, трейсы, делать информативные дашборды, быстро устранять инциденты и правильно интерпретировать данные, ты можешь узнать на нашем курсе "Observability, как в BigTech". В рамках курса ты узнаешь:
- Как правильно строить дашборды (dashboard), алерты, интерпретировать данные и уведомления на уровне Senior’ов и TeamLead'ов
- Как строить полезные метрики, которые не расходуют лишние ресурсы на хранение
- Как писать логи, в которых потом легко разобраться
- Как с помощью Observability экономить деньги работодателю и многое другое.
Курс подойдет backend-разработчикам от уровня Middle. Практика будет на Golang, но знания применимы ко всем языкам программирования, поскольку инструментация Observability универсальна, и различия в языках минимальные.
Благодаря курсу ты:
- глубоко изучишь основы и лучшие практики: метрики, логи, трейсы и многое другое,
- создашь эффективные и не перегруженные дашборды для мониторинга состояния системы и приложений,
- научишься управлять стабильностью системы и предсказывать ее поведение,
- изучишь все плюсы и минусы Prometheus, Grafana Loki, Jaeger и поймешь, что и когда нужно использовать.