курс по Data Science
для middle: senior-навыки за 6 недель

Best practices по внедрению моделей в продакшн на примере реальных задач из BigTech. Без «красивых» ML и базовых методов — только грязные данные, real-time ML и ежедневные проблемы DS на работе

Преподает  Team Lead в Яндекс

дни и время
ВТ/ЧТ 19:00
когда
11 ноября
поток
поток №1
длительность
6 недель

Подойдет для Data Scientists, Classic ML и NLP-инженеров уровня middle/middle+

{
ффф"grade": {
ффффф"junior": true,
ффффф"middle": true,
ффффф"senior": false

ффф}
}
Нужны базовые знания основ машинного обучения, математики и программирования
Будем писать на Python, но если ты программируешь на чем-то другом — это некритично. Вся практика будет применима на другие ЯП

в курсе осваиваем навыки, которые мешают расти мидлам

/1
Как обнаружить проблемы в грязных данных в самом начале работы и сделать модель, устойчивую к дрейфу
/2
Как учесть все инфраструктурные ограничения и раскатать модель на прод с первого раза без финансовых потерь
/3
Как правильно мониторить деградацию моделей в проде, делать их стабильными и автоматически переобучать
/4
Как строить хорошие признаки по нестабильным временным рядам — активности пользователей, курсу валют и др.
/5
Как расти в зарплате через связку продуктовых и бизнес-метрик: увеличивать выручку и средний чек, а не техническую точность рекомендаций
/6
Как тестировать раскатанную ML через A/B-тесты, избегать ложных выводов и потерь у смежных бизнес-подразделений

программа

6 недель точечно закрываем каждый блок-фактор

Не просто теория, а выжимка всего опыта от TeamLead из Яндекса. Лучшие практики из BigTech, разбор реальных бизнес-кейсов и много кода, который ты напишешь самостоятельно
{
ффф"ratio": {
ффффф"practice": 70%,
ффффф"theory": 30%
ффф}
}
  • проблематика курса: основные проблемы с данными, инфраструктурные сложности, слабая связь модельных и бизнес метрик
  • основные различия между датасетами обучения и работой
  • про табличные и текстовые данные из курса, отражающие реальные бизнес-процессы из финансовой, рекламной и других digital-сфер
  • тонкости применения популярных в BigTech моделей для задач классификации, регрессии, ранжирования и прогнозирования — Catboost, Tabnet, DSSM, Bert


Практика:
BigTech-кейс с изменением поведения модели в продакшне, которое не определить стандартными методами. Подробный разбор предпосылок и последствий. Разбор методов оценки стабильности факторов, которые помогают избежать проблемы в продакшне

*на основе сервиса для настройки рекламы

В итоге прокачаем hard’ы до уровня
Senior в BigTech и научимся:

Работать с «грязными» данными, искать смещения и дрифты
Использовать Feature engineering в real time системах и генерировать признаки с пониманием вычислительной сложности
Оптимизировать ML-модели для продакшна
Использовать специфику актуальных ML/DL моделей для работы с табличными и текстовыми данными
Контролировать жизненный цикл моделей в продакшне и строить мониторинги
Работать с MLOps инструментами и взаимодействовать с инфраструктурой

Весь процесс обучения по шагам

Уроки длятся по 1,5−2 часа раз в неделю и проходят в свободное от учебы и работы время

Ходишь на интерактивные онлайн-уроки в ZOOM

В каждом ДЗ отрабатываем полученные навыки и решаем задачи, которые встречаются на работе

Делаешь домашку в виде рабочих кейсов

Все ДЗ проверяет преподаватель. Вопросы можно задавать на еженедельных online-встречах

Ходишь на Q&A-сеccии и задаешь вопросы

Посмеяться, обсудить проблему или задать вопрос — на связи преподаватель и другие ученики курса

Общаешься в чате

Книги, статьи, видео — отдадим все, что можно почитать на досуге и прокачаться еще сильнее

Изучаешь дополнительные материалы

Выдадим после курса для подтверждения твоих навыков

Получаешь сертификат

преподает Дмитрий Сафонов, Data Science Team Lead в Яндекс

разрабатываю алгоритмы антифрода рекламы, руковожу ML-командой
Яндекс
cтроил прогнозные модели биржевых индикаторов, разработал инфраструктуру для автоматизации ML-процессов
Quantum Brains
преподавал анализ данных на Python
СПБГЭУ

Отвечаем репутацией за качество обучения

{
ффф"it_companies": {
ффффф"trust": 100%
ффф}
}
BigTech-компании регулярно покупают наши курсы для сотрудников. Вот некоторые из них:
начинаем 11 ноября
Можно оплатить в рассрочку и иностранной валютой. Вернем 100% средств в первую неделю обучения, если не понравится
Стандарт
Только 50 мест
19 100 Р
62 600 Р
Стоимость увеличится через
дней
часов
минут
секунд
Премиум
11 online-занятий 2 раза в неделю
Домашние задания и дипломный проект
Проверка ДЗ и проекта от преподавателя
Q&A-сессии с ответами на вопросы
Общий чат и допматериалы
Доступ к курсу на 1 год
Только 50 мест
23 800 Р
65 900 Р
Стоимость увеличится через
дней
часов
минут
секунд
11 online-занятий 2 раза в неделю
Домашние задания и дипломный проект
Проверка ДЗ и проекта от преподавателя
Q&A-сессии с ответами на вопросы
Общий чат и допматериалы
Доступ к курсу на 2 года
Стандарт
Только 50 мест
55 600 Р
62 600 Р
Скидка с урока действует еще
дней
часов
минут
секунд
Премиум
11 online-занятий 2 раза в неделю
Домашние задания и дипломный проект
Проверка ДЗ и проекта от преподавателя
Q&A-сессии с ответами на вопросы
Общий чат и допматериалы
Доступ к курсу на 1 год
Только 50 мест
58 900 Р
65 900 Р
Скидка с урока действует еще
дней
часов
минут
секунд
11 online-занятий 2 раза в неделю
Домашние задания и дипломный проект
Проверка ДЗ и проекта от преподавателя
Q&A-сессии с ответами на вопросы
Общий чат и допматериалы
Доступ к курсу на 2 года
Понимаем переживания, что может не понравиться. Записывайся на бесплатный урок, чтобы протестировать курс

Открытый урок «minority drift: От методов детекции до стабильного прода»

Виды Minority Drift в продакшен данных: Class-wise, Conditional, Subpopulation, Hidden Drift
Оценка деградации моделей и финансовых потерь на практике
Как делать признаки и модели устойчивыми к дрейфу: PSI и KL-дивергенция
Контроль качества — построение Fairness Metrics
Частые вопросы
Для прохождения курса нужны базовые знания основ машинного обучения, математики и программирования. Курс ориентирован на специалистов уровня middle/middle+ Data Scientists, Classic ML и NLP-инженеров

Во время курса будем писать код на Python, но если ты программируешь на чем-то другом — это некритично. Вся практика будет применима на другие языки программирования

Также подойдет для junior. Если хочешь быстро вырасти — приходи, но специалистам, начинающим карьеру в сфере Data Science, будет сложно. В курсе много практики, которая уже подразумевает наличие практических навыков

Остались вопросы?

Если у тебя срочный вопрос, можешь написать нам в Telegram-бот
Если ты готов немного подождать, оставляй вопрос на сайте — мы свяжемся с тобой в ближайшее время
Наш онлайн-курс предназначен для специалистов Data Science, которые уже имеют базовые знания в математике и статистике, теории вероятностей и программировании на Python, и хотят ускорить своё развитие до продакшн-уровня. Программа обучения на курсе сфокусирована на решении реальных задач, с которыми сталкиваются компании: от построения моделей машинного обучения и нейронных сетей до анализа метрик продукта и влияния на бизнес.

На этом курсе нет абстракций — только практическая работа с «грязными» данными, ограничениями инфраструктуры, обработкой потоков и мониторингом систем. Вы научитесь применять алгоритмы machine learning, строить системы рекомендаций, работать с SQL и Pandas, визуализировать графики и таблицы, а также создавать и оптимизировать модели на Python, Spark и с использованием библиотек для NLP и компьютерного зрения.

Курс по Data Science подходит, если вы уже уверенно пишете на Python и работаете с данными: это обычно Python, SQL, библиотеки Pandas, Numpy, Matplotlib, Seaborn. На выходе вы соберете кейсы для портфолио и обновите резюме. Работа идет вокруг product-mindset: приоритизируются основные цели продукта и бизнеса, используются инструменты и алгоритмы, обсуждаются интерпретации, классификации и регрессии, A/B-эксперименты и практики анализа.

Фокус курса — на применении знаний в реальных проектах и умении объяснять ценность решений. Обучение подходит вам, если вы хотите стать специалистом Data Science и увереннее разговаривать с продактом и аналитикой, чтобы решать задачи бизнеса.

Чтобы успешно пройти курс, специалист должен иметь базовые знания математики, статистики, теории вероятностей и программирования. Если вы ищете курсы Data Science для новичков или Data Scientist с нуля, этот курс не подойдет, так как он рассчитан на специалистов с опытом.

Как будет проходить курс?

Старт курса по Data Science — 11 ноября 2025 года. Длительность курса составит 6 недель.

В рамках учебного процесса раз в неделю на платформе у вас будут интерактивные уроки, домашние задания с проверкой и Q&A-сессии, где можно спросить любые вопросы. Всего на курсе будет 5 модулей и итоговая дипломная работа. Также на курсе есть чат с другими студентами, конспекты и дополнительные материалы.

Формат курса и ритм занятий позволяют совмещать обучение с работой, а поддержка сообщества помогает двигаться быстрее, что подтверждается отзывами студентов с других курсов.

На курсе доступно 2 тарифа. Разница состоит только в доступе к курсу: тариф Стандарт предполагает доступ на 1 год, а Премиум - 2 года.

После прохождения курса вы сможете участвовать в дизайне метрик, обсуждать принципы продакшн-ML и принимать зрелые инженерные решения. Дополнительно курс поможет увидеть связь моделей и бизнес-процессов, работать со системами и пайплайнами данных: от построения витрин до обработки событий в потоке.

Преподаватель курса — специалист из Яндекса, Data Scientist, поэтому будут обсуждаться реальные ограничения, катки/откаты, мониторинг и метрики. Также в программе курса много практических разборов, контрольные тесты, и практикумы.

Когда курс будет завершен, получите именной сертификат, который вы как специалист сможете показать работодателю при трудоустройстве для подтверждения своих действующих навыков и опыта в Data Science и выделиться среди конкурентов.

Школа Balun.Courses предлагает также и другие курсы, а именно курсы в сфере программирования, которые уже прошли более 900 выпускников. У нас можно изучить System Design, углубиться в нюансы и тонкости языка программирования Go, а также эффективно подготовиться к собеседованиям в крупные Big-Tech компании.

Также недавно у нас вышел новый бесплатный курс по Структурам данных без сложной математики для работы или подготовки к алгоритмическому собеседованию при поиске работы.
Обучение для специалистов в сфере Data Science в Balun.Courses