N.S.I. WorkSpace Compétence,Notions,P-Th-G,Première G3 – Algorithme des k plus proches voisins

G3 – Algorithme des k plus proches voisins

« Nous allons maintenant travailler sur un algorithme d’apprentissage automatique, souvent appelé, même en français, algorithme de machine learning. L’idée est d’utiliser un grand nombre de données afin « d’apprendre à la machine » à résoudre un certain type de problème (nous verrons un exemple un peu plus loin).

Cette idée d’apprentissage automatique ne date pas d’hier, puisque le terme de « machine learning » a été utilisé pour la première fois par l’informaticien américain Arthur Samuel en 1959.

Pourquoi le « machine learning » est tant « à la mode » depuis quelques années ? Simplement parce que le nerf de la guerre dans les algorithmes de machine learning est la qualité et la quantité des données, celles qui permettront à la machine d’apprendre à résoudre un problème. Or, avec le développement d’internet, il est relativement simple de trouver des données sur n’importe quel sujet : on parle de « big data ».

À noter aussi l’importance des stratégies mises en place par les GAFAM (Google, Apple, Facebook, Amazon et Microsoft) afin de récupérer un grand nombre de données concernant leurs clients. Ces données sont très souvent utilisées pour « nourrir » des algorithmes de machine learning. Comment, d’après vous, Amazon arrive-t-il à proposer à ces clients des « suggestions d’achats » souvent très pertinentes ?

Nous allons étudier un algorithme d’apprentissage assez simple à appréhender : l’algorithme des « k plus proches voisins ». En anglais « k nearest neighbors » d’où l’abréviation “knn”. »

Dans ce qui suit, vous devrez répondre à des questions, faire des captures d’écran, écrire du code en langage Python…
Télécharger la « Fiche-Réponse » sur laquelle vous consignerez vos productions à ces activités.