Ne crée pas de colonnes conditionnelles avec Apply de Pandas

#10 - Colonnes Conditionnelles

Lors de la création de colonnes conditionnelles dans Pandas, nous avons tendance à utiliser la méthode apply() presque tout le temps.

Cependant, apply() de Pandas n'est rien d'autre qu'une boucle for. Par conséquent, elle passe à côté de l'objectif principal de la vectorisation…

Tu devrais plutôt utiliser la méthode np.where() pour créer des colonnes conditionnelles. Elle fait exactement le même job mais elle est extrêmement rapide.

La condition est transmise comme premier argument. Suivie du résultat si la condition est évaluée à True (deuxième argument) et False (troisième argument).

Plus d'informations ici sur Where de NumPy.

Et si tu veux tester l’extrait de code ci-dessus, voici le code complet sur github.

Ça t'a plu ? 😎

Connexion ou S'abonner pour participer aux sondages.

Reply

or to participate.