1. Что такое AutoML?
2. История и развитие AutoML
Ключевые вехи:
3. AutoML в действии: прогноз цен на жильё за 3 минуты
Установка и подготовка данных
pip install autogluon pandas scikit-learn from autogluon.tabular import TabularDataset, TabularPredictor
from sklearn.datasets import fetch_california_housing
import pandas as pd
# Загружаем данные
california = fetch_california_housing(as_frame=True)
california_housing = california.frame # DataFrame с 20k+ строк, 8 признаков + target # Загружаем через AutoGluon
data = TabularDataset(california_housing)
# Разделяем на train/test
train_data, test_data = data.iloc[:-2000], data.iloc[-2000:]
# Обучаем модель (всё автоматически: предобработка, подбор, ансамбль)
predictor = TabularPredictor(label='MedHouseVal').fit(
train_data,
time_limit=180, # 3 минуты
presets='best_quality' # Качество важнее скорости
)
# Оценка на тесте
results = predictor.evaluate(test_data)
print(f"RMSE: {results[root_mean_squared_error]:.3f}")
print(f"R²: {results['r2']:.3f}")
# Предсказания
predictions = predictor.predict(test_data) Результаты
Значение
0.843 ± 0.005
4. AutoML vs ручной подход и LLM на шумных данных сенсоров
Что внутри датасета
Сложности задачи
Сравнение подходов
df['sensor_1_rolling_mean'] = (
df.groupby('unit_id')['sensor_1']
.rolling(window=30, center=True)
.mean()
.reset_index(level=0, drop=True)
) Результаты сравнения
ROC-AUC
0.75
0.83
0.85
0.85
Вывод
5. Плюсы и минусы
Основные плюсы AutoML
Основные минусы AutoML
Заключение: когда и зачем использовать AutoML
бесплатные уроки по data science