- Mon Shot de Data Science
- Posts
- Pourquoi KMeans n'est pas toujours l'algorithme de clustering le plus approprié
Pourquoi KMeans n'est pas toujours l'algorithme de clustering le plus approprié
#83 - KMeans vs. DBSCAN
KMeans est un algorithme de clustering très répandu. Cependant, ses limites le rendent inapplicable dans de nombreux cas.
Par exemple, KMeans regroupe les points en se basant uniquement sur la localité des centroïdes. Il peut donc créer des clusters erronés lorsque les points de données ont des formes arbitraires.
Parmi les nombreuses alternatives possibles, on trouve DBSCAN, qui est un algorithme de clustering basé sur la densité. Il peut donc identifier des clusters de forme et de taille arbitraires.
Il est donc robuste face à des données dont les clusters ne sont pas sphériques et dont les densités varient.
Plus d'informations ici : Comparaison de différents algorithmes de clustering (guide Sklearn).
Ça t'a plu ? 😎 |
Reply