- Mon Shot de Data Science
- Posts
- Comment encoder des variables catégorielles avec plusieurs catégories ?
Comment encoder des variables catégorielles avec plusieurs catégories ?
#86 - category-encoders
Nous encodons souvent les colonnes catégorielles avec un encodage one-hot. Mais la matrice des features devient peu dense et ingérable avec un grand nombre de catégories.
La bibliothèque category-encoders fournit une suite d'encodeurs spécifiques pour les variables catégorielles. Il est ainsi facile d'expérimenter différentes techniques d'encodage.
Par exemple, j'ai utilisé l’encodeur binaire ci-dessus pour représenter une colonne catégorielle au format binaire.
En savoir plus : Documentation de Category Encoders.
Ça t'a plu ? 😎 |
Reply