Publié le 24 Janvier 2024

Bien définir l'IA pour mieux la comprendre

Interview de Fayçal Boujemaa, Technology Strategist, Orange Innovation / Data & AI.

illustration de point d'interrogation
Photo de Fayçal Boujemaa

Fayçal Boujemaa,
Technology Strategist,
Orange Innovation / Data & AI

 

Quelle définition peut-on donner de l’intelligence artificielle ?

Fayçal Boujemaa : L’IA est une tentative de reproduire, par des machines, des compétences cognitives (voir, écouter, raisonner, parler, apprendre…) qui sont le propre de l’être humain, et ce, à des fins d’aide à la décision et d’automatisation. Pour y parvenir, on utilise tout un ensemble de sciences et de technologies comme la vision par ordinateur, la synthèse et la reconnaissance de la parole ou la représentation des connaissances, ou de l'apprentissage automatique (Machine Learning).

L’actualité récente laisse penser qu’il s’agit de quelque chose de nouveau. Pourtant, cette notion est apparue en 1950, sous la plume d’Alan Turing, sans doute l’un des mathématiciens les plus prodigieux du 20e siècle. Dans son article, Alan Turing a pu apporter une première réponse à la question de savoir si « les machines pouvaient penser ».

Il me semble important de poser que l’IA n’est pas une technologie qui va remplacer l’Homme. Une partie de nous est insaisissable, relève de l’inconscient. Tout cela ne peut être reproduit, tant la manière même dont chacun de ces éléments exerce des effets sur notre comportement ou nos pensées reste encore pleine de mystères.
 

Qu’en est-il de l’IA générative ?

F.B. : L’IA générative est un type d’IA qui cible la création, à partir d’une requête textuelle (un « prompt » ou une « invite »), de contenus aussi variés que du texte, des images, de la vidéo, de la musique ou du code (programme informatique). C’est un sous-ensemble du domaine de l’apprentissage automatique de l’IA qui s’appuie sur des techniques d’apprentissage profond (Deep Learning) et d'apprentissage par renforcement.
L’origine remonte à 2017, par des chercheurs de Google. Le grand mérite d’OpenAI, fin novembre 2022, est d’avoir rendu l’lA générative accessible au plus grand nombre, aussi bien aux entreprises qu’au grand public. D’ailleurs, Google et OpenAI restent leaders avec leurs technologies, respectivement Bard et Gemini pour le premier, et ChatGPT pour le second.

En plus de ces deux acteurs majeurs, sans être exhaustif, on peut citer : Meta, Hugging Face, Anthropic, Microsoft, Midjourney, Stable Diffusion, Mistral…
 

Comment fonctionne une IA générative ?

F.B. : Comme toute IA, une IA générative passe par une première phase avant d’entrer dans une seconde phase, celle de l’usage (phase d'inférence) où elle est mise à la disposition des utilisateurs. Généralement, elle continue à apprendre pendant cette seconde phase.

D’une manière très schématique, pour son apprentissage, une IA générative s’alimente en scrutant l’ensemble des contenus du web produit par l’Homme (des milliards et des milliards de pages web, incluant Wikipédia, les livres et les journaux électroniques…). Elle construit ainsi des statistiques et des probabilités d’apparition d’un mot compte tenu d’un contexte (les mots qui précèdent). Dans sa phase usage, à une question d’un utilisateur, une IA générative construit sa réponse, mot après mot, en se basant sur le principe du « mot suivant le plus probable » (selon les statistiques et probabilités établies durant la phase d’apprentissage). Il est à noter que ce principe est utilisé pour la génération de texte ou de code. Pour la génération d’images ou de vidéos, le procédé est légèrement différent.
 

Quels sont les défauts actuels de l’IA générative ?

Les réponses d’une IA générative peuvent, dans certains cas, manquer de fraîcheur et/ou de précision. Dans d’autres cas, on peut être confronté à des affabulations.

Fayçal Boujemma, Technology Strategist, Orange Innovation / Data & AI

 

F.B. : Même si les progrès sont considérables, il y en a encore beaucoup. Les réponses d’une IA générative peuvent, dans certains cas, manquer de fraîcheur et/ou de précision, et comporter donc des informations obsolètes et/ou imprécises. Cela est dû au fait que l’apprentissage et l’actualisation d’une IA générative, décrit ci-dessus, n’est pas fait au quotidien. Les grosses capacités de calcul nécessaires sont telles que les mises à jour ou les actualisations complètes nécessitent plusieurs semaines, voire plusieurs mois. 

Dans d’autres cas, on peut être confronté à des affabulations (ou hallucinations) avec des réponses qui semblent cohérentes mais qui sont en fait fausses. Ce phénomène est dû à un « déraillement » de la mécanique du « mot suivant le plus probable » décrite ci-dessus. Il arrive que le « mot suivant » ne soit pas le bon et par cascade, on peut avoir une réponse alignant des faits ou informations qui ne sont ni exacts ni réels. 

Par ailleurs, comme dit plus haut, les IA génératives apprennent et fabriquent des contenus par imitation et à partir du contenu d’un web ouvert et loin d’être parfait. De ce fait, dans ses réponses, une IA générative peut, parfois, reproduire des fausses nouvelles (fake news) et/ou des biais complotistes, sexistes, racistes… Mises entre de mauvaises mains, les IA génératives spécialisées dans la création de contenu audio, image et vidéo peuvent s’avérer, malheureusement, de formidables outils de Deepfake.

Un autre point de vigilance concerne la consommation d’énergie. Aussi bien dans la phase « entraînement » que la phase « usage » décrites ci-dessus, les IA / IA génératives nécessitent beaucoup de calculs qui engendrent donc une énorme consommation d’énergie. Ces défauts sont adressés par plusieurs innovations à venir : « IA verte » (Green AI), nouveaux processeurs optimisés pour l’IA / IA générative… 

Enfin, les IA génératives posent d’importants problèmes en matière de propriété intellectuelle car elles utilisent des données sur le web, pour apprendre et pour créer des contenus, sans forcément avoir été autorisées à les utiliser par leurs ayants droit.
 

Quelles compétences deviennent nécessaires ?

Un bon usage des IA génératives nécessite un indispensable savoir-faire pour rédiger ou énoncer des questions (des prompts ou des invites) et ce afin d’en tirer toute la quintessence.

Fayçal Boujemma, Technology Strategist, Orange Innovation / Data & AI

 

F.B. : En matière de compétences, il convient de séparer deux points de vue. Le premier est celui des « constructeurs », ces « moteurs » IA / IA génératives, ce sont majoritairement des scientifiques (chercheurs et ingénieurs) avec des compétences, par ex. en science des données (Data Science), ingénierie des données (Data Engineering), expertise métier… Le second est celui des « utilisateurs » de ces « moteurs » d’IA / IA génératives. Ils peuvent être de tous les métiers concernés par l’usage de ces technologies : des financiers, des RH, des créateurs de contenu, des juristes, des commerciaux, des programmeurs (informatiques)… et évidemment les scientifiques et les ingénieurs, qui sont aussi utilisateurs.

Par ailleurs, un bon usage des IA génératives nécessite un indispensable savoir-faire pour rédiger ou énoncer des questions (des prompts ou des invites) et ce afin d’en tirer toute la quintessence. Pour cela, un métier nouveau est né (avec l’arrivée de ChatGPT d’OpenAI, fin 2022) : l’ingénieur de l’invite ou du prompt (ou « Prompt Engineer »).

Peut-on prévoir les prochaines étapes à franchir ?

F.B. : Cela est quasi-impossible au vu de la vitesse avec laquelle l’IA/l'IA générative progressent avec la mise au point de moteurs d’IA générative multimodale, de plus en plus puissants et précis. Nous assistons à des évolutions et des ruptures à une vitesse rarement observée dans l’histoire des technologies. Avec ces évolutions aussi étonnantes qu’imprévues, nous entrons dans un monde incertain où la prévision et la prospective deviennent difficiles, et où l’agilité devient le maître-mot.

Ce que l’on peut tenter de décrire en revanche, ce sont les grandes phases d’évolution probable de l’IA. Au commencement, on parlait d’IA qui était dite faible ou étroite (Weak ou Narrow AI). Avec les IA génératives, nous avançons vers ce qui pourrait devenir un jour des IA générales ou fortes (Strong ou General AI) qui pourraient atteindre un niveau comparable à celui de l’intelligence humaine. Nous n’y sommes pas encore. Il faudra sans doute allier à l’IA les capacités offertes par les ordinateurs quantiques (Quantum Computers). Il s’agit d’une nouvelle génération d’ordinateurs, encore en laboratoire, capables de performances allant de quelques centaines de milliers à quelques millions de fois les performances des ordinateurs d’aujourd’hui. Est-ce vers 2030 que cela serait atteint, comme le pensent certains, ou plus tôt ? Rien ne permet de le confirmer avec certitude. Mais la conjonction de la puissance des ordinateurs quantiques et de l’IA nous mènera, sans doute, vers un monde difficile à imaginer avec des IA qui seraient peut-être capables d’aller au-delà de nos propres capacités humaines : l’ère de la Super IA (Super AI).

Dans tous les cas, il ne faut jamais perdre de vue l’exigence de faire que l’IA soit et reste éthique, responsable et digne de confiance, au bénéfice de tous. Comme nous le disions au tout début, il est précieux finalement qu’une part de nous reste insaisissable et mystérieuse !