Accélérer 5x la vitesse de Apply Pandas avec NumPy

#72 - la méthode np.select()

la méthode np.select()

Lors de la création de colonnes conditionnelles dans Pandas, nous avons tendance à utiliser la méthode apply() presque tout le temps.

Cependant, apply() de Pandas n'est rien d'autre qu'une boucle for améliorée. Par conséquent, elle passe à côté de l'objectif principal de la vectorisation.

Tu devrais plutôt utiliser la méthode np.select() pour créer des colonnes conditionnelles. Elle fait le même job mais en étant extrêmement rapide.

Les conditions et les résultats correspondants sont passés dans les deux premiers arguments. Le dernier argument est le résultat par défaut.

Plus d'informations ici : documentation de select de NumPy.

Ça t'a plu ? 😎

Connexion ou S'abonner pour participer aux sondages.

Reply

or to participate.