Pourquoi KMeans n'est pas toujours l'algorithme de clustering le plus approprié

#83 - KMeans vs. DBSCAN

KMeans vs. DBSCAN

KMeans est un algorithme de clustering très répandu. Cependant, ses limites le rendent inapplicable dans de nombreux cas.

Par exemple, KMeans regroupe les points en se basant uniquement sur la localité des centroïdes. Il peut donc créer des clusters erronés lorsque les points de données ont des formes arbitraires.

Parmi les nombreuses alternatives possibles, on trouve DBSCAN, qui est un algorithme de clustering basé sur la densité. Il peut donc identifier des clusters de forme et de taille arbitraires.

Il est donc robuste face à des données dont les clusters ne sont pas sphériques et dont les densités varient.

Ça t'a plu ? 😎

Connexion ou S'abonner pour participer aux sondages.

Reply

or to participate.