Comment encoder des variables catégorielles avec plusieurs catégories ?

#86 - category-encoders

Category Encoders

Nous encodons souvent les colonnes catégorielles avec un encodage one-hot. Mais la matrice des features devient peu dense et ingérable avec un grand nombre de catégories.

La bibliothèque category-encoders fournit une suite d'encodeurs spécifiques pour les variables catégorielles. Il est ainsi facile d'expérimenter différentes techniques d'encodage.

Par exemple, j'ai utilisé l’encodeur binaire ci-dessus pour représenter une colonne catégorielle au format binaire.

Ça t'a plu ? 😎

Connexion ou S'abonner pour participer aux sondages.

Reply

or to participate.