- Mon Shot de Data Science
- Posts
- Pourquoi cela ne s'appelle pas plutôt la classification logistique ?
Pourquoi cela ne s'appelle pas plutôt la classification logistique ?
#132 - Régression logistique
Est-ce que tu t’es déjà demandé pourquoi la régression logistique contient le terme « régression » alors qu'elle n'est utilisée que pour des tâches de classification ?
Pourquoi ne pas l'appeler plutôt « classification logistique » ?
Je t’explique pourquoi.
La plupart d'entre nous interprétons la régression logistique comme un algorithme de classification. Or, il s'agit d'un algorithme de régression par nature. En effet, il prédit un résultat continu, qui est la probabilité d'une classe.
Ce n'est que lorsque nous appliquons ces seuils et modifions l'interprétation de ses résultats que l'ensemble du pipeline devient un classificateur.
Pourtant, intrinsèquement, l'algorithme n’effectue jamais de classification. L'algorithme adhère toujours à la régression. En revanche, c'est l'étape supplémentaire consistant à appliquer des seuils de probabilité qui permet de classifier un échantillon.
Ça t'a plu ? 😎 |
Reply