Une IA apprend-elle … comme nous ?

Une IA n’apprend pas comme un humain. Elle ne comprend pas une situation, ne donne pas sens à ce qu’elle voit, ne forme pas de jugement au sens où nous l’entendons. Elle ajuste des paramètres statistiques pour améliorer sa performance sur une tâche donnée. Ce point n’est pas un détail technique. Pris en compte, il change complètement la manière de penser les projets d’IA dans les organisations.

Il y a quelques semaines, un dirigeant de PME me posait une question qui revient souvent, sous des formes à peine différentes :

On a beaucoup de fichiers clients, d’historiques Excel, de données commerciales. Ça suffit pour faire une IA, non ?

Un dirigeant de PME

La question paraît simple. En réalité, elle condense plusieurs malentendus. Le premier tient à l’idée même d’ »apprentissage ». Quand on dit qu’une intelligence artificielle apprend, beaucoup imaginent spontanément quelque chose d’assez proche de l’apprentissage humain : observer des exemples, comprendre progressivement une situation, repérer l’essentiel, corriger ses erreurs, puis devenir capable d’agir avec discernement.

Cette représentation est commode. Elle est aussi trompeuse.

C’est d’ailleurs ce que rappelle très clairement Tom Mitchell dans l’un des ouvrages classiques du machine learning. Sa définition est restée célèbre parce qu’elle est à la fois simple et décisive : un programme apprend si, à partir de l’expérience, il améliore sa performance sur une classe de tâches donnée. L’intérêt de cette définition est de dissiper une confusion fréquente : dans le cadre du machine learning, apprendre ne signifie pas comprendre, mais mieux réussir une tâche mesurable. Ce déplacement est fondamental. Il nous oblige à quitter les métaphores psychologiques pour revenir à ce que fait réellement le système.

Autrement dit, ce que l’on appelle « apprentissage » en IA est d’abord un processus d’optimisation.

Dans cet article
Une machine n’apprend pas un sens, elle réduit une erreur
Ce qu’une IA apprend, c’est ce qu’on lui donne à voir, et parfois de travers
Peut-on vraiment parler d’apprentissage et de connaissance pour une machine ?
Les types d’apprentissage
Les biais ne sont pas un accident extérieur : ils sont souvent déjà dans les données
Une performance élevée n’est pas une compréhension élevée
Ce que cela change concrètement pour un projet d’entreprise
Ce qu’il faut retenir
Références

Une machine n’apprend pas un sens, elle réduit une erreur

Dans la plupart des approches contemporaines, notamment dans les réseaux de neurones, l’apprentissage consiste à ajuster progressivement des paramètres (les fameux poids du modèle) pour réduire l’écart entre une prédiction et un résultat attendu. Le système reçoit des exemples, produit une sortie, mesure son erreur, puis modifie ses paramètres afin de diminuer cette erreur lors des itérations suivantes.

Vu de loin, cela peut ressembler à une forme d’expérience. Mais il faut être précis : la machine n’apprend pas comme un enfant qui découvre une catégorie du monde, ni comme un professionnel qui affine son jugement à partir de cas concrets. Elle apprend surtout à mieux associer certaines configurations de données à certaines sorties.

L’apport de Pedro Domingos, dans son article bien connu A Few Useful Things to Know About Machine Learning, est particulièrement utile ici. Son intérêt n’est pas de donner une définition générale du machine learning, mais de rappeler aux praticiens quelque chose que les discours sur l’IA masquent souvent : le cœur d’un projet n’est pas seulement dans l’algorithme, mais dans la relation entre les données, la tâche et le critère de performance. Domingos insiste notamment sur le fait qu’un modèle ne « voit » pas le monde tel que nous le voyons. Il repère des régularités statistiques dans des représentations de données. Cela explique pourquoi un système peut être très performant sans pour autant « comprendre » quoi que ce soit au problème qu’il traite.

20251 {20251:SITSA3V5} 1 apa 50 default 85623 https://www.lescahiersdelinnovation.com/wp-content/plugins/zotpress/

C’est aussi la raison pour laquelle on surestime souvent ce qu’une IA peut faire à partir de données apparemment abondantes. Avoir beaucoup de fichiers n’équivaut pas à disposer d’un bon matériau d’apprentissage. Une accumulation de tableaux, de textes ou d’images ne devient pas automatiquement une base exploitable. Encore faut-il que ces données soient cohérentes, pertinentes, représentatives du problème traité, et reliées à une tâche claire.

Ce qu’une IA apprend, c’est ce qu’on lui donne à voir, et parfois de travers

C’est ici qu’intervient un second malentendu. On suppose volontiers qu’un système bien entraîné va apprendre les « bonnes » caractéristiques d’un problème. Or ce n’est pas nécessairement le cas. Une machine apprend d’abord les régularités les plus utiles pour réduire son erreur. Et ces régularités peuvent être très éloignées de ce que les humains considèrent comme pertinent.

Les travaux de Geirhos et de ses collègues sur le shortcut learning sont particulièrement éclairants sur ce point. Leur apport est important parce qu’ils montrent que les réseaux de neurones, loin d’apprendre toujours les bonnes structures, ont souvent tendance à exploiter des raccourcis statistiques. Le système utilise l’indice le plus facile, le plus rentable, le plus corrélé à la réponse attendue, même si cet indice est superficiel ou trompeur.

20251 {20251:W4IXX6CK} 1 apa 50 default 1 85623 https://www.lescahiersdelinnovation.com/wp-content/plugins/zotpress/

L’exemple, désormais classique, du loup et du chien l’illustre bien. Un modèle entraîné à distinguer des photos de loups et de chiens avait en réalité appris à repérer la neige en arrière-plan, parce que les images de loups comportaient plus souvent des paysages enneigés. Du point de vue du système, cette stratégie fonctionnait. Du point de vue de l’utilisateur, elle était absurde. L’intérêt de cet exemple n’est pas anecdotique : il montre que le modèle n’apprend pas nécessairement “le concept de loup”, mais des corrélations présentes dans les données d’entraînement.

Autrement dit, une IA ne saisit pas spontanément l’essence d’un objet ou d’une situation. Elle exploite ce qui, dans les données, permet de mieux prédire. Cela explique pourquoi des systèmes impressionnants en démonstration peuvent devenir fragiles dès que le contexte change légèrement.

Peut-on vraiment parler d’apprentissage et de connaissance pour une machine ?

La question n’est pas seulement technique ; elle est aussi épistémologique. Que signifie exactement « apprendre » ou « connaître » ? Dans les sciences cognitives comme en philosophie de la connaissance, apprendre ne se réduit pas à améliorer une performance. Cela suppose généralement la construction de représentations du monde, la capacité à relier des situations entre elles, à produire des inférences, voire à distinguer le vrai du faux. Autrement dit, l’apprentissage humain s’inscrit dans un rapport au sens et à la vérité, pas seulement dans l’optimisation d’un résultat.

C’est précisément ce point que souligne Judea Pearl lorsqu’il distingue, dans ses travaux sur la causalité, différents niveaux d’intelligence :

l’association (repérer des corrélations),
l’intervention (comprendre ce qui se passerait si l’on agissait différemment)
la contrefactualité (raisonner sur ce qui aurait pu se produire).

L’intérêt de cette distinction est de montrer que la plupart des systèmes actuels d’apprentissage automatique opèrent essentiellement au premier niveau. Ils apprennent des régularités statistiques, mais n’accèdent pas, en général, à une compréhension causale du monde.

Dans cette perspective, parler d’ »apprentissage » pour une IA est à la fois pertinent et trompeur. Pertinent, parce qu’il y a bien amélioration à partir de l’expérience. Trompeur, parce que cette amélioration ne s’accompagne pas nécessairement d’une connaissance au sens fort. Une IA ne sait pas pourquoi ce qu’elle prédit est vrai, ni dans quelles conditions cela cesserait de l’être. Elle ne possède pas une connaissance, mais une capacité à produire des réponses adaptées dans un cadre donné.

Cette distinction n’est pas seulement théorique. Elle permet d’éviter une erreur fréquente en entreprise : attribuer aux systèmes d’IA des capacités de compréhension ou de jugement qu’ils ne possèdent pas, et leur confier des tâches qui exigent précisément ces capacités.

On peut prolonger cette réflexion en mobilisant des références classiques de l’épistémologie. Gaston Bachelard rappelle que la connaissance scientifique ne procède pas par simple accumulation d’observations, mais par rupture avec les évidences premières et construction de concepts qui réorganisent l’expérience. De son côté, Karl Popper insiste sur le fait qu’une connaissance n’est scientifique que si elle est falsifiable, c’est-à-dire exposée à la possibilité d’être réfutée. Or, les systèmes d’IA actuels ne construisent ni de tels cadres conceptuels, ni de véritables hypothèses susceptibles d’être testées et réfutées : ils ajustent des modèles à partir de données. Cela renforce l’idée que leur “apprentissage” relève davantage de l’optimisation statistique que d’une élaboration de connaissances au sens scientifique du terme.

Les types d’apprentissage

Mais toutes les IA ne s’entraînent pas pareil.

Certaines apprennent avec des exemples (apprentissage supervisé)
D’autres cherchent des structures cachées (non supervisé)
D’autres encore apprennent en testant des actions et en récoltant des récompenses (renforcement)

Et selon le problème que vous cherchez à résoudre, l’une ou l’autre méthode sera plus pertinente.

L’apprentissage supervisé : efficace, mais dépendant de la qualité des exemples

Dans les entreprises, la plupart des cas d’usage relèvent de l’apprentissage supervisé. Le principe est simple : on fournit au système des exemples déjà associés à une bonne réponse.

Une image étiquetée « défaut » ou « pas défaut »
Un courriel classé « réclamation » ou « demande commerciale »
Un dossier marqué « fraude » ou « non fraude » etc.

Ce type d’apprentissage est puissant parce qu’il permet de construire rapidement des modèles capables de classer, prédire ou détecter. Mais il repose sur une condition forte : il faut disposer d’exemples bien annotés, suffisamment nombreux, et surtout représentatifs de la réalité future.

C’est précisément sur ce point que la littérature oblige à être prudent. Domingos (cf. supra) rappelle que, dans de nombreux cas, les gains marginaux liés à un nouvel algorithme sont faibles au regard de ce que l’on gagne ou perd avec de meilleures données. L’intérêt de cet apport est très concret pour les organisations : il déplace l’attention. Là où beaucoup de projets commencent par la recherche du « bon outil IA », il faudrait souvent commencer par une question plus prosaïque et plus décisive : sur quoi allons-nous réellement entraîner le système ?

En pratique, c’est souvent là que les projets déraillent. Les données sont incomplètes, hétérogènes, issues de processus métiers mal stabilisés, annotées selon des critères variables, ou tout simplement trop éloignées du problème réel. On croit disposer d’un patrimoine de données ; on découvre en réalité un empilement de traces difficilement réutilisables.

La vraie difficulté n’est donc pas seulement de « faire tourner un modèle », mais de construire un environnement de données dans lequel l’apprentissage statistique a une chance d’être pertinent.

L’apprentissage non supervisé : découvrir des structures, pas produire du sens métier

Toutes les formes d’apprentissage ne reposent pas sur des données annotées. Dans l’apprentissage non supervisé, le système cherche des regroupements, des proximités, des structures latentes dans les données. On l’utilise, par exemple, pour segmenter des clients, détecter des comportements atypiques ou explorer un corpus documentaire.

Cette famille de méthodes donne parfois l’impression d’une forme d’autonomie plus grande : la machine « découvrirait » seule des structures cachées. Mais là encore, il faut être précis. Ce qu’elle découvre, ce sont d’abord des structures statistiques. Le passage de ces structures à une interprétation utile reste un travail humain.

L’intérêt de rappeler cela est d’éviter une confusion fréquente en entreprise : croire qu’un clustering, une réduction de dimension ou une détection d’anomalies produira spontanément des catégories prêtes à l’emploi. En réalité, le modèle propose un découpage mathématique du réel. C’est ensuite au métier de juger si ce découpage correspond à quelque chose d’opérationnel.

Autrement dit, même lorsqu’une IA “découvre” quelque chose, elle ne le comprend pas pour autant.

L’apprentissage par renforcement : apprendre par essai-erreur, mais dans un cadre très défini

Une troisième grande famille d’approches est l’apprentissage par renforcement. Ici, le système interagit avec un environnement, teste des actions et reçoit une récompense ou une pénalité. À première vue, on retrouve quelque chose qui ressemble davantage à l’apprentissage humain : essai, erreur, correction, amélioration.

Mais ce rapprochement doit lui aussi être manié avec prudence. Le système n’apprend pas ce qu’est une bonne décision au sens humain du terme. Il apprend à maximiser une fonction de récompense.

Cette distinction est décisive. Elle explique pourquoi un agent peut adopter des comportements très performants du point de vue du score tout en s’éloignant de l’intention réelle de ses concepteurs. Le problème n’est donc pas seulement l’algorithme, il est aussi dans la définition de ce que l’on récompense.

Cela vaut bien au-delà des jeux ou de la robotique. Dans toute organisation, la manière dont on définit un objectif conditionne le comportement du système. Sur ce point, la proximité avec les questions classiques de management est frappante : comme les humains, les machines finissent souvent par optimiser l’indicateur plus que la finalité.

Les biais ne sont pas un accident extérieur : ils sont souvent déjà dans les données

La question des biais est souvent abordée comme si elle survenait après coup, lorsque l’on découvre qu’un modèle discrimine, exclut ou reproduit des écarts indésirables. En réalité, le problème apparaît bien plus tôt.

Les travaux de Barocas, Hardt et Narayanan sont utiles précisément parce qu’ils montrent que les biais algorithmiques ne sont pas seulement des défauts techniques du modèle. Ils sont souvent liés à la manière dont les données ont été produites, sélectionnées et interprétées. Leur apport est important car il permet d’éviter un faux diagnostic : croire qu’un modèle serait « neutre par nature » et que les dérives viendraient uniquement d’un mauvais paramétrage.

Or les données historiques d’une organisation portent déjà les traces de ses pratiques passées. Si une entreprise a évalué, recruté, financé ou servi ses clients selon certaines routines, ces routines se retrouvent dans les données. L’algorithme peut alors les reproduire avec une grande efficacité, sans jamais « savoir » qu’il reproduit un biais.

Autrement dit, la machine n’invente pas le biais : elle l’apprend.

Une performance élevée n’est pas une compréhension élevée

C’est ici qu’intervient une dernière confusion, probablement la plus tenace : parce que certains systèmes obtiennent des performances spectaculaires, on tend à leur attribuer une forme de compréhension générale. Or cette conclusion va trop vite.

Gary Marcus, dans son texte critique sur le deep learning, insiste sur ce point avec une vigueur parfois polémique, mais utile. Son apport n’est pas de nier les succès des approches statistiques. Il est de rappeler qu’exceller dans la détection de corrélations à grande échelle ne signifie pas disposer d’une compréhension abstraite, causale ou conceptuelle du monde. Cette mise en garde est importante parce qu’elle évite de confondre performance locale et intelligence générale.

20251 {20251:RKZJ4JW6} 1 apa 50 default 1 85623 https://www.lescahiersdelinnovation.com/wp-content/plugins/zotpress/

Un système peut être très bon pour prédire le prochain mot, repérer certains motifs visuels ou classer des documents, tout en restant fragile lorsqu’il doit raisonner à partir de connaissances implicites, transférer proprement un apprentissage à un nouveau contexte, ou distinguer ce qui est structurel de ce qui est accidentel.

Pour une organisation, cette distinction change beaucoup de choses. Elle invite à ne pas poser à un modèle des problèmes qui exigent autre chose qu’une bonne exploitation statistique d’exemples passés. Toutes les tâches ne se prêtent pas de la même manière à l’apprentissage automatique, et toutes les décisions ne doivent pas être formulées comme des problèmes de prédiction.

Ce que cela change concrètement pour un projet d’entreprise

Comprendre qu’une IA n’apprend pas comme un humain ne conduit pas à dévaluer l’outil. Cela conduit à mieux le situer.

Le problème n’est pas de savoir si l’IA est « intelligente » au sens fort. Le problème est de savoir si l’on dispose, dans l’organisation, des conditions qui rendent son apprentissage utile. Cela suppose au moins quatre questions.

D’abord : quelle est exactement la tâche ? Beaucoup de projets échouent parce qu’ils commencent avec une ambition trop vague : “faire de l’IA sur nos données”. Or un système n’apprend qu’en référence à une tâche précise et à un critère de performance défini. C’est, au fond, la leçon de Mitchell (cf. supra) : sans tâche, sans expérience et sans mesure de performance, parler d’apprentissage n’a guère de sens.
Ensuite : sur quelles données va-t-on entraîner le système ? Non pas au sens quantitatif seulement, mais au sens de leur qualité, de leur cohérence et de leur représentativité. C’est ici que la leçon de Domingos reste précieuse : un modèle médiocre sur de bonnes données peut valoir mieux qu’un modèle sophistiqué sur des données pauvres.
Troisième question : que risque-t-il d’apprendre par erreur ? Les travaux sur le shortcut learning montrent bien qu’un modèle peut apprendre le mauvais signal tout en obtenant de bons résultats apparents. Il faut donc toujours se demander ce qui, dans les données, sert réellement de base à la prédiction.
Enfin : quels biais du passé risque-t-on de réinjecter dans le futur ? La littérature sur la fairness rappelle que l’algorithme ne vient pas au-dessus de l’organisation comme une couche neutre. Il absorbe souvent une partie de son histoire, de ses routines et de ses angles morts.

On peut dire les choses autrement : un projet d’IA n’est jamais seulement un projet technique. C’est un projet de formalisation, de sélection, de mesure et de traduction du réel. Et c’est précisément pour cela qu’il échoue si souvent lorsqu’il est traité comme une simple affaire d’outillage.

Ce qu’il faut retenir

Une IA n’apprend pas comme nous. Elle n’interprète pas le monde, ne comprend pas les situations et ne forme pas de jugement au sens humain. Elle améliore sa performance sur une tâche définie à partir de données et d’un critère d’évaluation.

Cette distinction est importante parce qu’elle permet de mieux comprendre où se jouent réellement les succès et les échecs des projets d’IA. La qualité de l’apprentissage dépend moins d’une magie algorithmique que de la manière dont on définit la tâche, construit les données, choisit les indicateurs et contrôle les biais.

L’enjeu, pour une entreprise, n’est donc pas simplement de posséder beaucoup de données ou d’acheter un bon outil. Il est de savoir si elle est capable de transformer un problème organisationnel en tâche bien posée, de disposer d’exemples pertinents, et d’évaluer ce que le système apprend effectivement.

La vraie question n’est pas : « l’IA peut-elle apprendre ? »
La vraie question est : « que lui donnons-nous réellement à apprendre, et dans quelles conditions cet apprentissage produira-t-il quelque chose d’utile ? »

Références

20251 JZD8A44A 1 apa 50 default 85623 https://www.lescahiersdelinnovation.com/wp-content/plugins/zotpress/