Voici un deuxième épisode de mes notes de lecture sur l’intelligence artificielle, qui tentera entre autres de répondre à la question suivante : les livres jaunes sont-ils de bons vulgarisateurs ?
En d’autres termes : l’expression « pour les nuls » permet-elle réellement à un non-spécialiste de maîtriser un sujet ?
Ce deuxième épisode s’intéressera donc, après celui qui m’avait mis le pied à l’étrier et qui s’intéressait à la question en proposant une chronologie et un regard scientifique, à des ressources qui revendiquent, si je peux m’exprimer ainsi, de traduire l’intelligence artificielle en langage naturel.
Dans cet épisode :
- les ouvrages Comprendre la révolution de l’intelligence artificielle et L’intelligence artificielle pour les nuls
- les dossiers de Geek junior n°23 et du hors-série de Tangente n°86
- une sélection de ressources
Comprendre la révolution de l’intelligence artificielle, Stéphane d’Ascoli
Ouvrage publié en 2020 chez First éditions, 189 pages. 13 chapitres, un glossaire à la fin, ainsi que des propositions bibliographiques de prolongement.
Les 13 chapitres sont répartis en quatre parties distinctes. La première partie « Intelligence artificielle : retour aux sources » revient sur des éléments définitionnels et chronologiques.
chapitre 1 : le monde des algorithmes / chapitre 2 : l’ia des mythes originels à aujourd’hui
- retour sur des éléments de définition déjà évoqués dans mon épisode 1 : algorithme, machine learning, deep learning.
L’ouvrage fait en outre la distinction entre IA symbolique qui suit des règles explicites et IA connexionniste qui utilise des exemples pour fonctionner et améliorer ses réponses.
- chronologie depuis l’Antiquité (Pygmalion et Galatée) jusqu’à AlphaGo.
Les deux parties suivantes vont s’intéresser aux deux modes de fonctionnement de l’intelligence artificielle : le machine learning (3 chapitres) et son sous-domaine le deep learning (4 chapitres).
chapitre 3 : comprendre le machine learning
- apprendre à partir de données et généraliser l’apprentissage à de nouvelles données en ajustant avec différents curseurs. Plus un algorithme dispose de curseurs, plus il pourra résoudre des problèmes en ayant une fonction de perte satisfaisante (un score de performance : plus il est élevé, moins les performance sont bonnes) ;
- bruit et silence en intelligence artificielle : l’overfitting (un algorithme avec trop de curseurs mémorise des informations inutiles) et l’underfitting (un algorithme avec trop peu de curseurs qui n’aura pas assez de données pour fonctionner correctement)
- 3 types d’apprentissages pour les algorithmes : supervisé, non supervisé et par renforcement.
chapitre 4 : un jour dans la vie d’un concepteur d’ia
Pour mettre au point une IA, l’analogie de la recette de cuisine : il faut une recette (l’algorithme), des ustensiles (les processeurs de calcul) et des ingrédients (les données).
Le chapitre détaille les différentes étapes de traitement des données :
- récolter les données
- les nettoyer
- sélectionner les caractéristiques d’intérêt
- formater les données
- séparer les données d’entrainement et de test
et l’évaluation d’un algorithme à travers deux types de critère : la sensibilité (capacité d’un algorithme à donner un résultat positif lorsqu’une hypothèse est vérifiée) et la spécificité (capacité à donner un résultat négatif lorsqu’une hypothèse n’est pas vérifiée).
chapitre 5 : quelques applications célèbres
- la régression linéaire pour déterminer les taux de prêt
- l’utilisation d’arbres décisionnels pour établir un diagnostic médical à partir d’une série de symptômes
- les systèmes de recommandation
Pour suggérer des films susceptibles de vous plaire, Netflix doit apprendre vos goûts au moyen d’un système de recommandation. (…) Cette méthode se résume dans une formule récurrente « Les utilisateurs qui ont aimé X ont également aimé Y ».
L’idée est simple : séparer les utilisateurs en groupes, correspondant à des « communautés » de goûts.
chapitre 6 : comprendre le deep learning
- le perceptron (modèle mathématique du neurone) comme premier pas vers le deep learning ;
- le transfer learning permet aux algorithmes entrainés à une certaine tâche de se conformer à une nouvelle tâche
Les trois chapitres suivants s’intéressent à différentes applications du deep learning : les images, le langage et les agents intelligents.
chapitre 7 : deep learning et images
Ce chapitre revient sur les différentes formes de traitement de l’image par les algorithmes dont :
- la reconnaissance faciale qui utilise des réseaux convolutifs (opération qui consiste à scruter par parcelles pour extraire de manière autonome les caractéristiques d’une image),
- la génération d’image qui s’appuie sur des algorithmes génératifs (comme pour les deep fakes) fonctionnant avec des réseaux de neurones encodeurs et décodeurs.
chapitre 7 : deep learning et langage
Pour représenter les mots, les algorithmes utilisent la méthode du plongement lexical qui consiste à représenter des mots par des vecteurs – soit un paquet de nombres (cela permet entre autres de repérer les discours de haine sur les réseaux sociaux).
Le chapitre étudie également le fonctionnement des claviers prédictifs avec les réseaux récurrents, le mécanisme d’attention utilisé par les outils de traduction automatique, et les étapes de réponse à une demande par les assistants vocaux.
chapitre 8 : deep learning et agents intelligents
L’agent intelligent est un algorithme capable de percevoir son environnement et d’interagir avec lui.
Le chapitre revient sur l’apprentissage par renforcement des algorithmes avec les exemples d’AlphaGo et des voitures autonomes.
La dernière partie de l’ouvrage est consacrée à « L’humanité face à l’intelligence artificielle » avec des problématiques qui peuvent être réutilisées dans le cadre de débats avec les élèves (SNT, enseignement scientifique, EMC, philosophie).
- Chapitre 10 : l’intelligence artificielle face à l’intelligence humaine (avec le test de Turing) avec un retour sur le fonctionnement d’AlphaGo.
Citation d’Albert Einstein : « Les ordinateurs sont incroyablement rapides, précis et stupides. Les hommes sont incroyablement lents, inexacts et intelligents. L’ensemble des deux constitue une force incalculable ».
- Chapitre 11 : faut-il craindre l’IA ? Culture populaire avec Asimov, Kubrick, Terminator… Applications militaires et dérives de l’intelligence artificielle (système de crédit social en Chine, reconnaissances faciales, deep fake, falsification d’identité). Impacts de l’IA sur le monde du travail et sur l’environnement.
- Chapitre 12 : comment concevoir une IA « éthique » ?
Le chapitre revient sur les problématiques d’utilisation des données : collecte des données personnelles, enfermement dans les bulles de filtres, retour sur le scandale Cambridge Analytica, biais des algorithmes.
Quelle responsabilité donner aux algorithmes (Moral Machine) ? Comment réduire les impacts environnementaux du numérique ?
- Chapitre 13 : l’IA peut-elle servir l’humanité ? Retour sur les potentialités de l’intelligence artificielle dans les domaines du handicap, de la recherche scientifique (lutte contre le cancer, physique des particules, astrophysique) et de l’éducation.
Mon avis sur l’ouvrage :
Le plus : il s’agit d’un véritable ouvrage de vulgarisation, les schémas sont parlants et lisibles, des encarts permettent de faire des rappels synthétiques, et l’auteur propose pour des notions techniques des analogies qui permettent vraiment de comprendre le sujet sans être noyé d’informations.
L’intelligence artificielle pour les nuls, John Paul Mueller & Luca Massaron
Ouvrage publié en 2019 chez F1rst intractive, 343 pages. 20 chapitres, une introduction qui fait office de mode d’emploi du livre, un index en fin d’ouvrage.
Les 20 chapitres sont répartis en 6 parties distinctes, dont l’introduction explicite si le propos s’adresse davantage aux novices ou aux spécialistes.
Partie 1 : introduction à l’ia
Cette première partie se décompose en 4 chapitres qui vont expliciter le fonctionnement basique d’une intelligence artificielle.
Le premier chapitre « Introduction à l’IA » redonne des points de définition (en particulier sur ce que l’on entend par intelligence) et un bref aperçu historique de l’intelligence artificielle.
La porte d’entrée de l’ouvrage, contrairement aux deux autres livres abordés précédemment (Turing à la plage et Comprendre la révolution de l’intelligence artificielle) se fait non pas via la machine mais de manière plus approfondie via les données traitées et les algorithmes.
Dans le deuxième chapitre « Définir le rôle des données« , les auteurs reviennent sur les sources et la fiabilité des données exploitées par les algorithmes.
Focus sur les listes déroulantes :
Les listes déroulantes sont adaptées à toutes sortes d’entrées de données, et elles rendent la saisie de données par un utilisateur humain extrêmement fiable, puisque l’utilisateur n’a pas d’autres possibilité que d’utiliser une des entrées proposées par le système.
Les auteurs identifient cinq types de données incorrectes : les données mensongères, les omissions volontaires, les erreurs de perspectives (divergence de points de vue), les biais et le cadre de référence (c’est-à-dire le contexte et la situation d’utilisation des données).
L’intérêt de ce chapitre est de mettre en lumière la vigilance à avoir vis à vis de l’information, et ce au-delà de la question de l’intelligence artificielle :
- utilisation d’un thesaurus / descripteurs VS mots clés pour la question des listes déroulantes
- différentes formes de désinformation et prolongement de la question des données incorrectes vers les biais de confirmation et les bulles de filtres.
- l’ouvrage renvoie vers le site Data never Sleeps qui permet de voir l’évolution de la collecte des données quotidiennes depuis 2013
Les chapitres 3 et 4 reviennent sur le fonctionnement des algorithmes et du matériel informatique (processeurs graphiques).
partie 2 : recenser les utilisations de l’ia dans la société
Cette seconde partie revient sur les utilisations de l’intelligence artificielle dans les applications informatiques, et sur les deux fonctionnalités principales qui sont attendues de l’intelligence artificielle : les corrections et les suggestions.
On retrouve notamment les corrections non seulement dans les vérificateurs orthographiques mais aussi dans la correction de trajectoire des voitures, et la suggestion dans le traitement automatique du langage naturel et la recherche d’information.
L’intelligence artificielle sert également à automatiser des processus courants et à s’épargner des tâches ennuyeuses et répétitives (principalement dans le domaine de l’industrie). Dans le domaine médical, l’IA est utilisée pour le suivi des patients, le diagnostic et de nouvelles techniques chirurgicales.
Enfin elle permet d’améliorer l’interaction humaine en créant de nouveaux alphabets (emojis), en automatisant la traduction ou en créant des liens sur les réseaux sociaux.
partie 3 : travailler avec des applications électroniques de l’ia / partie 4 : travailler avec l’ia dans des applications matérielles
Dans la troisième partie de l’ouvrage, les auteurs reviennent sur les analyses de données par l’intelligence artificielle.
Les points que je retiens de ces chapitres :
- l’utilisation pour l’analyse des données des outils statistiques (moyenne et variance) et du calcul de corrélation et de la régression linéaire, qui indiquent si des phénomènes peuvent être liés les uns aux autres, ce qui m’a rappelé l’épisode d’E-penser sur la différence entre corrélation et causalité ;
- un retour sur l’apprentissage machine avec les distinctions entre apprentissage supervisé, non supervisé et par renforcement ;
- les probabilités, les graphes et les arbres de décision.
Le dernier chapitre de la troisième partie est consacré à l’apprentissage profond et à ses modes de fonctionnement. Les auteurs s’intéressent à son application dans les agents conversationnels.
Ils reviennent sur le premier agent conversationnel, ELIZA, élaboré par Joseph Weizenbaum en 1966, qui propose une réponse à partir d’un ensemble d’associations et de sujets présélectionnés. Deux autres agents plus récents sont mentionnés : Google Smart Reply et Tay, ainsi que le prix Lobner. Le chapitre se termine par la mention suivante :
Pour avoir une idée des progrès de ces technologies, lisez les pages consacrées à ces réseaux sur le site Internet d’OpenAI, un organisme de recherche sur l’IA à but non lucratif (…).
La quatrième partie s’intéresse aux applications matérielles : la robotique (prétexte à reprendre les lois de la robotique d’Asimov), les drones et les voitures autonomes. Ces problématiques peuvent être réutilisées dans le cadre de débats avec les élèves (SNT, enseignement scientifique, EMC, philosophie).
Un encart dans le chapitre sur les drones revient sur le film WarGames qui donne l’exemple d’une intelligence artificielle (l’ordinateur PROG) dont le fonctionnement est biaisé par le piratage.
partie 5 : se pencher sur l’avenir de l’ia / partie 6 : la partie des dix
Ces deux dernières parties sont consacrées aux perpectives offertes par l’intelligence artificielle, dont certaines sont à relativiser ou à actualiser étant donnée la date de publication de l’ouvrage.
Dans la partie 5, les auteurs reviennent sur certains domaines de l’intelligence humaine et où l’intelligence artificielle trouve ses limites, à savoir la créativité, l’imagination, l’originalité, et la fiabilité des données – puisque les résultats d’une IA peuvent être biaisés par des facteurs humains ou des déficiences techniques.
Sont abordés à nouveau les « hivers de l’IA« , périodes durant lesquelles un optimisme démesuré se confronte à des échecs pourtant prévisibles.
Le chapitre 16 est consacré aux applications de l’IA dans l’espace (question qui peut être traitée notamment dans le programme d’HGGSP Terminale) avec l’observation spatiale, l’exploration, l’exploitation des ressources. Le chapitre 17 aborde les possibilités de l’IA notamment dans le domaine environnemental.
La « partie des 10 » propose des pistes de réflexion autour de trois chapitres (à réutiliser en EMC, philosophie et HLP, et en sujets de grand oral) :
- 10 activités à l’abri de l’IA, où l’on retrouve le domaine de l’interaction humaine, notamment l’enseignement (ouf), de la créativité et de l’intuition
- 10 contributions importantes de l’IA à la société (médecine, industrie, projets spatiaux)
- 10 exemples d’échecs de l’IA, principalement dans le domaine des relations et de la connaissance intrapersonnelle : compréhension, éthique, extrapolation des données, empathie, affinité intellectuelle, remise en question et croyances.
Mon avis sur l’ouvrage
Comme beaucoup d’ouvrages de la collection « Pour les nuls » que j’ai pu parcourir, celui-ci ne m’a pas vraiment satisfait.
Cette collection peut être très utile lorsqu’il s’agit de proposer un guide pratique pour apprendre une langue (ou un langage informatique… le seul qui figure dans ma bibliothèque est consacré aux codes HTML, XML et CSS).
En revanche pour traiter d’une thématique, je trouve la structure et le propos souvent complexes et alambiqués, et vulgarisant finalement très mal le sujet qu’ils sont censés aborder, avec des systèmes de renvois à des articles en ligne et certaines phrases jouant sur une connivence avec le sujet que le lecteur ne parvient pas à s’approprier.
Geek Junior n°33 d’avril 2023
Cette revue dédiée à la culture numérique proposait un dossier consacré à l’intelligence artificielle et à ChatGPT dans son numéro d’avril 2023.
Ce numéro aborde l’intelligence artificielle sous différents aspects :
- le dossier donne la parole à un « expert » (Laurence Devillers, chercheuse au CNRS) avec 3 questions : définition / limites de ChatGPT et conseils d’utilisation (p.9)
- 8 questions / réponses sur ChatGPT et un encart de mise en garde face aux fake news (p.10-11)
- un lexique de l’intelligence artificielle et un retour sur ce qu’est un prompt (p.12)
- un tutoriel pour s’initier à l’intelligence artificielle avec Adacraft (une application web qui fonctionne en prolongement de Scratch) p.21-23
- un quiz et des mots mêlés p.29-30
Tangente Hors-série n°86 de juin 2023
Cette revue spécialisée dans l’enseignement des mathématiques consacre un article à « Chat-GPT : une IA très mathématique » (p.16-18).
L’article revient sur le mode de fonctionnement de Chat-GPT : agent conversationnel et réseau de neurones, où la modélisation du texte généré passe par la vectorisation (chaque mot = un vecteur), par l’apprentissage par renforcement et par un mécanisme d’attention (scores et récompenses données en fonction de la pertinence de la réponse).
Autres ressources
Pour finir voici un petit panel de ressources pour prolonger ces lectures et pour garder la trace d’autres lectures à venir :
- deux Digipad : une veille sur l’IA et un Digipad « IA et éducation«
- le journal gratuit Day-Click que l’on reçoit gratuitement dans les établissements scolaires, et son numéro de mai 2023, qui revient sur les technologies de rupture, avec deux pages sur l’intelligence artificielle
- Le numéro 22 de la revue Méta-média qui s’intéresse à la façon dont l’IA générative change notre manière de produire et de consommer de l’information
- La vidéo d’ARTE : «L’IA peut-elle créer de l’art ?»