- Mon Shot de Data Science
- Posts
- Utiliser les diagrammes en boîte avec prudence ! Ils peuvent induire en erreur.
Utiliser les diagrammes en boîte avec prudence ! Ils peuvent induire en erreur.
#116 - Diagrammes en boîte identiques pour des ensembles de données différents
Les diagrammes en boîte sont assez courants dans l'analyse de données. Mais ils peuvent parfois induire en erreur.
Voici pourquoi.
Un diagramme en boîte (ou boîte à moustaches) est une représentation graphique de cinq valeurs seulement : min, premier quartile, médiane, troisième quartile et max.
Ainsi, deux ensembles de données différents ayant cinq valeurs similaires produiront des diagrammes en boîte identiques. Cela peut parfois induire en erreur et permettre de tirer des conclusions erronées.
La conclusion n'est PAS qu'il ne faut pas utiliser les diagrammes en boîte. Il convient plutôt d'examiner la distribution sous-jacente. Les histogrammes et les diagrammes en violon peuvent être utiles à cet égard.
Enfin, n'oublie jamais que lorsque tu condenses un ensemble de données, tu n’as pas une vue d'ensemble. En effet, tu perds des informations essentielles.
Consulter le notebook de traçage des diagrammes de l’illustration ci-dessus.
Ça t'a plu ? 😎 |
Reply