- Mon Shot de Data Science
- Posts
- Une fonctionnalité cachée de la méthode describe de Pandas
Une fonctionnalité cachée de la méthode describe de Pandas
#33 - En spécifiant include = "all"
La méthode decribe() de Pandas est utilisée pour imprimer des statistiques descriptives sur des données.
Mais as-tu déjà remarqué que la sortie renvoyée par cette méthode est toujours limitée aux colonnes numériques ? Bien sûr, les détails tels que la moyenne, la médiane, l'écart-type, etc. n'ont aucune signification pour les colonnes non numériques. On peut donc se dire que les résultats sont tout à fait logiques ici.
Cependant, describe() peut également fournir un résumé rapide des colonnes non numériques. Tu peux le faire en spécifiant include = "all". En conséquence, il renverra le nombre d'éléments uniques, l'élément le plus représenté (avec sa fréquence) des colonnes catégorielles. Ce qui peut parfois être très utile !
Pour en savoir plus : lire la documentation de describe + consulter le notebook du code ci-dessus.
Ça t'a plu ? 😎 |
Reply