1. Зачем генерировать табличные данные
VAE (TVAE)
Нормальное, но сглаженное repository.tudelft+1
4. Инструменты: что выбрать
import torch
from tabddpm import TabDDPM
X_num = torch.tensor(df\[num_cols\].values, dtype=torch.float32)
X_cat = torch.tensor(encoded_cat, dtype=torch.float32)
X = torch.cat(\[X_num, X_cat\], dim=1)
model = TabDDPM(
input_dim=X.shape\[1\],
hidden_dim=512,
num_timesteps=1000
)
model.fit(X, epochs=200, batch_size=256)
synthetic_data = model.sample(1000) import torch
from tabdiff import TabDiff
model = TabDiff(
num_numeric=len(num_cols),
cat_cardinalities=[df[c].nunique() for c in cat_cols],
embedding_dim=32,
hidden_dim=512,
num_timesteps=1000
)
X_num = torch.tensor(df[num_cols].values, dtype=torch.float32)
X_cat = torch.tensor(df[cat_cols].values, dtype=torch.long)
model.fit(
numeric_data=X_num,
categorical_data=X_cat,
epochs=200,
batch_size=256
)
synthetic_num, synthetic_cat = model.sample(1000) 5. Заключение
бесплатные уроки по data science