Une fonctionnalité cachée de la méthode describe de Pandas

#33 - En spécifiant include = "all"

La méthode decribe() de Pandas est utilisée pour imprimer des statistiques descriptives sur des données.

Mais as-tu déjà remarqué que la sortie renvoyée par cette méthode est toujours limitée aux colonnes numériques ? Bien sûr, les détails tels que la moyenne, la médiane, l'écart-type, etc. n'ont aucune signification pour les colonnes non numériques. On peut donc se dire que les résultats sont tout à fait logiques ici.

Cependant, describe() peut également fournir un résumé rapide des colonnes non numériques. Tu peux le faire en spécifiant include = "all". En conséquence, il renverra le nombre d'éléments uniques, l'élément le plus représenté (avec sa fréquence) des colonnes catégorielles. Ce qui peut parfois être très utile !

Ça t'a plu ? 😎

Connexion ou S'abonner pour participer aux sondages.

Reply

or to participate.