Principe de l’algorithme ‘kNN’
Objectifs d’apprentissage ou d’entraînement et pré-requis (acquis antérieurs mobilisés)
• Comprendre le principe de l’algorithme Knn
• Calcul de distance dans un repère orthonormé (Mathématiques, 2nde)
Programmation en langage Python : compétences requises ( à acquérir, à mobiliser, à développer, à maîtriser)
- //
Le principe de l’algorithme des k plus proches voisins est le suivant :
De façon générale… | …appliqué à l’exemple précédent |
Calculer la distance entre l’élément à déterminer et chacun des éléments du jeu de données de référence. | calculer la distance entre le point représentant l’iris « mystère » et chaque point issu du jeu de données « iris ». |
Sélectionner uniquement les k distances les plus petites, c’est à dire les k plus proches voisins. | sélectionner les k iris identifiés qui sont les plus proches de l’iris inconnu |
Parmi les k plus proches voisins, déterminer quelle est la classe la plus fréquente, celle qui est majoritaire. | Déterminer l’espèce la plus fréquente parmi les k plus proches iris voisins. |
Attribuer cette classe à l’élément inconnu. | Associer à l’ »iris mystère » cette « espèce majoritaire” |
Considérons la situation où k = 3.
- Les 3 plus proches voisins sont signalés ci-dessus avec des flèches.
- Nous avons deux « iris setosa » (point vert) et un « iris virginica » (point rouge).
- D’après l’algorithme des « k plus proches voisins », notre « iris mystère » appartient à l’espèce « iris setosa ».