Accueil >  Blog >  Développement professionnel >  Le machine learning : définition & décryptage

Le machine learning : définition & décryptage

Publié le

 dans 

Vous vous êtes toujours demandé ce qu’était le machine learning, sans en comprendre la définition ? 

Pour comprendre les rouages de cette forme d’intelligence artificielle, nous vous proposons d’explorer son mécanisme en profondeur. Mais aussi, d’en obtenir une vue d’ensemble de ses applications, et des challenges face à son adoption massive…

 

Le machine learning

 

Machine learning : définition ?

Le machine learning, ou apprentissage automatique, est une forme d’intelligence artificielle. Il permet aux applications logicielles de prédire des résultats avec plus de précision, sans qu’elles ne soient programmées explicitement à cette fin. 

Les algorithmes de machine learning vont pour cela se servir des données comme entrée pour prédire de nouvelles valeurs de sortie. Ils imitent ainsi la façon dont les êtres humains apprennent, en améliorant progressivement la précision de leur raisonnement. 

Un excellent cas d’usage du machine learning est la définition de l’apprentissage automatique.  Cette dernière nous vient des moteurs de recommandations, qui proposent du contenu à leurs utilisateurs en fonction de leurs préférences. Mais on trouve également des exemples de machine learning dans la détection des fraudes, le filtrage des spams, la définition et l’automatisation des processus métier ou encore la maintenance prédictive.

 

Comment fonctionne l’apprentissage automatique ?

Le processus de machine learning peut être décomposé en trois temps :

  • Le processus de décision. En règle générale, les algorithmes d’apprentissage automatique sont utilisés pour effectuer une prédiction ou une classification. Sur la base de certaines données d’entrée, qui peuvent être étiquetées ou non, le machine learning sera en mesure de produire une estimation de modèle via ces données ;
  • La fonction d’erreur. Cette dernière permet d’évaluer la précision du modèle produit à partir d’exemples connus ;
  • Le processus d’optimisation du modèle. Si le modèle gagnerait à s’adapter à de nouvelles données, l’algorithme peut être ajusté afin de réduire l’écart avec les exemples connus. Il répète ce processus d’évaluation et d’optimisation et met à jour les pondérations de manière autonome, jusqu’à ce qu’un seuil de précision soit atteint.

 

Quelles sont les différentes méthodes de machine learning ?

L’apprentissage automatique peut suivre une méthodologie précise, visant à assurer la précision et pertinence de ses prédictions. Les méthodes les plus couramment utilisées sont les suivantes.

Le machine learning supervisé

Ce procédé utilise des ensembles de données étiquetés pour former des algorithmes qui classent les données ou prédisent les résultats avec précision. 

Au fur et à mesure que les données d’entrée sont introduites dans le modèle, celui-ci ajuste ses pondérations jusqu’à ce qu’il soit le plus pertinent possible.  Il atteint ainsi un niveau de précision plus élevé grâce au processus de validation croisée. Ce dernier permet de s’assurer que le modèle ne tombe pas dans des biais de surajustement ni de sous-ajustement. 

Ses exemples d’usage sont multiples : réseaux de neurones, régression linéaire ou logistique…

L’apprentissage automatique non supervisé

Le machine learning non supervisé utilise des algorithmes d’apprentissage automatique pour analyser et regrouper des ensembles de données non étiquetés. Ces algorithmes découvrent des modèles ou des regroupements de données cachés sans intervention humaine. Plus efficace pour identifier les similitudes et les différences dans un gros volume d’information, cette méthode est particulièrement adaptée au secteur de la vente (segmentation de la clientèle, stratégie de vente croisée, etc.)

Ce mode de fonctionnement inclut par exemple l’analyse en composantes principales (ACP) et la décomposition en valeurs singulières (SVD).

Le machine learning semi-supervisé

L’apprentissage semi-supervisé offre un juste milieu entre les deux méthodes précédentes. En phase de formation, il combine une petite quantité de données étiquetées avec une grande quantité de données non étiquetées. 

Cette méthode permet de guider l’algorithme dans l’extraction et la classification de caractéristiques communes. Elle peut se révéler une excellente solution si l’organisation n’a pas suffisamment de données étiquetées. 

 

Qui utilise le machine learning ?

Tous les secteurs d’activité sont aujourd’hui face au défi de traiter des quantités toujours plus importantes de données. Le machine learning est donc l’outil parfait pour optimiser le fonctionnement et la prise de décision des organisations, le plus souvent en temps réel, en s’appuyant sur le Big Data. 

Le machine learning est ainsi sollicité dans des industries très variées comme : 

  • Le secteur financier. Les banques utilisent par exemple l’apprentissage automatique afin d’identifier les opportunités d’investissement. Mais aussi pour prévenir les fraudes, en identifiant les profils à risque ou les signes avant-coureurs d’un piratage;
  • Le secteur des soins et de la santé. L’apprentissage automatique prend de plus en plus de place dans l’industrie des soins, notamment depuis l’avènement de l’Internet des Objets (IOT). Les appareils portatifs et les capteurs permettent ainsi d’évaluer la santé d’un patient en temps réel. Les experts médicaux ont donc besoin de l’apprentissage automatique pour analyser de gros volumes de données, identifier les tendances sanitaires ou détecter les signaux d’alarme. Le machine learning participe à améliorer les diagnostics et la qualité des traitements ;
  • Le retail. Les sites d’e-commerce sont aujourd’hui capables de recommander des articles en fonction de l’historique d’achat ou des pages visitées par un client. Les détaillants s’appuient pour cela sur le machine learning. L’algorithme capture notamment les données pertinentes et les analyse pour personnaliser l’expérience d’achat ;
  • L’énergie. Le machine learning est mobilisé dans les industries pétrolières ou gazières pour trouver de nouveaux gisements. Mais aussi, pour prédire la défaillance des systèmes d’extraction ou rationaliser la distribution.

 

Les défis de l’apprentissage automatique

À mesure que la technologie d’apprentissage automatique se perfectionne et nous simplifie la vie, elle soulève aussi des préoccupations éthiques. 

On pense évidemment aux débats autour de la possibilité que l’intelligence artificielle dépasse l’intelligence humaine dans un futur proche. Et en particulier, dans des domaines qui étaient jusque-là l’apanage des humains, comme la créativité scientifique ou les soft skills. L’impact du machine learning sur les emplois inquiète également une large partie des travailleurs. En réalité, elle ne fera que déplacer la demande vers d’autres domaines, plus spécialisés.

Au-delà des répercussions sur le marché du travail, l’usage généralisé du machine learning et des données questionne la confidentialité. Des législations comme le RGPD en Europe ou le California Consumer Privacy Act (CCPA) aux Etats-Unis visent ainsi à encadrer la manière dont les entreprises stockent et utilisent les données personnelles identifiables. 

Les cas de partialité et de discrimination dans un certain nombre d’algorithmes de machine learning ont aussi soulevé la question de leur neutralité. C’est le cas notamment pour les applications de rencontre, les logiciels de recrutement ou les systèmes d’octroi de prêt bancaire. 

L’avenir du machine learning reste donc à définir. Les plateformes d’apprentissage automatique (dont les fournisseurs les plus notables sont Amazon, Google, Microsoft ou encore IBM) continueront certainement de se livrer une bataille sans merci. Leur recherche dans ce domaine devrait néanmoins se concentrer sur le développement d’applications plus générales, accessibles à tous.

Abonnez vous à la newsletter BOOST, l’email qui fait du bien à votre carrière.