N.S.I. WorkSpace Compétence,Notions,P-Th-G,Première G3 – Algorithme des k plus proches voisins

G3 – Algorithme des k plus proches voisins

Principe de l’algorithme ‘kNN’

Objectifs d’apprentissage ou d’entraînement et pré-requis (acquis antérieurs mobilisés)

• Comprendre le principe de l’algorithme Knn
• Calcul de distance dans un repère orthonormé (Mathématiques, 2nde)

Programmation en langage Python : compétences requises ( à acquérir, à mobiliser, à développer, à maîtriser)

  • //

Le principe de l’algorithme des k plus proches voisins est le suivant :

De façon générale……appliqué à l’exemple précédent
Calculer la distance entre l’élément à déterminer et chacun des éléments du jeu de données de référence.calculer la distance entre le point représentant l’iris « mystère » et chaque point issu du jeu de données « iris ».
Sélectionner uniquement les k distances les plus petites, c’est à dire les k plus proches voisins.sélectionner les k iris identifiés qui sont les plus proches de l’iris inconnu
Parmi les k plus proches voisins, déterminer quelle est la classe la plus fréquente, celle qui est majoritaire.Déterminer l’espèce la plus fréquente parmi les k plus proches iris voisins.
Attribuer cette classe à l’élément inconnu.Associer à l’ »iris mystère » cette « espèce majoritaire”

Considérons la situation où k = 3.

  • Les 3 plus proches voisins sont signalés ci-dessus avec des flèches.
  • Nous avons deux « iris setosa » (point vert) et un « iris virginica » (point rouge).
  • D’après l’algorithme des « k plus proches voisins », notre « iris mystère » appartient à l’espèce « iris setosa ».