Notes de lecture sur l’intelligence artificielle (épisode 6)

Comme je l’ai annoncé dans les précédentes notes de lecture (épisode 5), j’ai décidé de consacrer un nouvel article à la question de l’intelligence artificielle.

Pour celui-ci, j’ai décidé de me concentrer sur deux ouvrages relativement récents, et sur des articles publiés dans un numéro du Courrier international. Concernant les ressources en ligne, je tâcherai de faire en sorte qu’elles soient en relation avec ces publications.

J’en profite pour indiquer que j’ai ajouté en format PDF dans l’article consacré à l’intelligence artificielle au cinéma la deuxième réponse que m’avait fournie le service Eurêkoi à la question que je leur avais posée.

Dans cet épisode :

un aperçu de deux ouvrages que j’ai parcourus : La Révolution ChatGPT et Si Rome n’avait pas chuté
revue de presse avec le numéro 99 du Courrier international Hors-série
sélection de ressources

La Révolution ChatGPT, d’Éric Sarrion

Cet ouvrage a été publié aux éditions Eyrolles en juin 2023.

Comme d’habitude lorsqu’il s’agit de publications dédiées à un outil spécifique et dont cette maison d’édition est coutumière (je pense par exemple aux guides sur WordPress, LinkedIn, Facebook, programmation Python, référencement Google, etc.), je suis toujours un peu frileuse…

J’ai toujours peur que ce type d’ouvrages deviennent un peu trop vite obsolètes face aux évolutions des outils qu’ils décortiquent. Je ne vais donc pas m’attarder sur les chapitres qui se concentrent sur des conseils d’utilisation (même si je les présenterai rapidement), et je vais détailler davantage les chapitres introductifs et conclusifs de ce livre.

En effet, le propos d’Éric Sarrion se décline en cinq parties. Les deux premières reviennent sur les origines et le fonctionnement de ChatGPT.

Partie 1 : Introduction à ChatGPT.

Dans ces premiers chapitres, l’auteur présente ChatGPT, un modèle de traitement du langage naturel pré-entrainé (Generative Pre-trained Transformer), développé et publié par OpenAI en 2019 et qui en est à sa 4e version. Il en indique les principaux domaines d’application, de l’assistance clientèle à la traduction, en passant par l’éducation et le recrutement.

Le fonctionnement de ChatGPT repose sur l’entrainement et la personnalisation, à partir d’un réseau de neurones. Il traite le langage naturel entre autres via la tokenisation (diviser le texte en unités appelées tokens) et les embeddings (représentations vectorielles des mots).

Pour l’entrainer, il faut veiller à nettoyer régulièrement les données collectées pour éviter le bruit – bruit informationnel, ça nous rappelle quelque chose – et les incohérences.

Les applications possibles de ChatGPT sont les assistants virtuels (chatbot), la traduction automatique, la rédaction de contenu et la recherche d’informations.

Partie 2 : Comment entraîner et utiliser ChatGPT ?

Cette partie se concentre sur des aspects techniques d’utilisation de ChatGPT.

L’auteur présente les tâches de pré-entrainement (données non étiquetées) et d’entrainement (affiner le modèle sur une tâche spécifique avec des données étiquetées = fine-tuning). Il énumère les différentes étapes pour entraîner ChatGPT : collecte et préparation des données, paramètres d’entrainement et outils disponibles.

Il indique ensuite comment utiliser ChatGPT dans des projets de développement en s’appuyant sur des bibliothèques et frameworks (Hugging Face par exemple) – ce qui permet de mieux comprendre également comment a pu être créer un outil comme Climate Q&A, évoqué dans mes précédentes notes de lecture.

Il donne enfin des exemples d’intégration et d’utilisation (créer un chatbot en Javascript, utiliser ChatGPT avec une interface vocale), ainsi que quelques stratégies de bonnes pratiques, notamment pour éviter les biais dans les données (diversifier les sources, utiliser des algorithmes pour détecter les biais).

Afin d’évaluer les performances de l’outil, on peut utiliser différentes méthodes comme la perplexité qui évalue la capacité du modèle à prédire la prochaine séquence de mots dans un texte (plus elle est faible, meilleur est le résultat) ou le test de Turing.

Partie 3 : Exemples d’utilisation de ChatGPT

Le premier chapitre de cette partie, « Poser les bonnes questions à ChatGPT » revient sur les éléments essentiels d’un bon prompt : être clair et précis, être spécifique, poser une question à la fois, utiliser un langage clair, garder la même discussion pour un même sujet et être courtois.

S’ensuivent une suite de chapitres détaillant différents exemples d’utilisation :

création de contenu textuel pour le marketing ;
traduction et apprentissage d’une langue ;
recrutement ;
création de code informatique (et de code pour Excel, ce qui peut rendre service quand, comme moi, on a du mal avec les tableurs) ;
création de contenu artistique et aide à l’innovation

Partie 4 : Implications éthiques

Dans ces trois chapitres, on retrouve les principales problématiques associées à l’intelligence artificielle aujourd’hui :

les biais et les risques dans un premier temps (sources de biais, risques de discriminations avec un retour sur l’exemple de Tay, confidentialité et sécurité)
les effets sur l’emploi et la société (est évoqué le projet construit par l’université de Stanford, EduGPT, pour répondre aux questions des étudiants, mais aussi la propagation des fausses informations)
les réglementations et normes (utilisation responsable, nécessité de transparence, gouvernance de l’IA)

Partie 5 : Perspectives d’avenir

Enfin, les deux derniers chapitres offrent un regard déjà tangible sur les perspectives d’avenir de ChatGPT :

les points d’amélioration et de développement, les avancées dans certaines applications, la mise en concurrence
les défis à long terme (fusions avec d’autres technologie comme la réalité virtuelle ou l’informatique quantique, enjeux de réglementation et de gouvernance, nécessité de responsabilité et d’éthique)

Mon avis sur l’ouvrage

Comme je l’ai indiqué plus haut, ma principale réserve sur cet ouvrage est celle qui se rapporte d’une certaine manière à son obsolescence programmée, étant donné la rapidité d’évolution des outils d’intelligence artificielle.

Néanmoins, je trouve que ce livre permet de comprendre assez facilement le fonctionnement de ChatGPT avec des exemples d’utilisations concrètes, et d’en avoir un usage averti et critique, ce qui est loin d’être négligeable, surtout pour les élèves.

Si Rome n’avait pas chuté, Raphaël Doan

Le deuxième ouvrage sur lequel je me suis penchée pour ces notes de lecture est un livre fascinant qui utilise les potentialités de l’intelligence artificielle générative dans une perspective historique et historienne.

L’ouvrage a été publié en mai 2023 aux éditions Passés/Composés, une maison d’édition que j’adore parce qu’elle publie des documentaires historiques sous forme d’infographies.

Le propos de Si Rome n’avait pas chuté est assez vertigineux. Il s’agit, pour l’auteur, d’utiliser différents outils d’intelligence artificielle générative (le modèle de GPT-3 text-davinci-003 pour la génération de textes et 3 outils de synthèses d’images pour les illustrations : DALL-E, Midjourney et Stable Diffusion) pour proposer au lecteur une uchronie.

Chaque partie de l’histoire écrite par l’intelligence artificielle est suivie d’un commentaire de l’historien, qui remet en perspective les inventions de l’IA. L’ouvrage est construit de la façon suivante : deux préfaces, quatre parties qui font des allers-retours entre uchronie et commentaire, et une chronologie alternative.

Les deux préfaces reflètent les intentions du livre. La première, relativement succincte, se concentre sur l’uchronie proposée par l’intelligence artificielle : un monde où les Romains ont découvert la machine à vapeur et utilise la technologie pour conquérir le monde et l’espace.

La seconde préface dévoile la démarche de l’auteur. Il y revient sur les évolutions les plus récentes de l’intelligence artificielle générative, sur ce que permettent actuellement les grands modèles de langage (LLM) et sur l’impact actuel de la technologie (rapidité, divertissement, bulles de filtres).

Il explique de quelle manière l’intelligence artificielle peut raconter des histoires, et justement, de quelle manière elle peut servir l’uchronie, à partir de laquelle il pourra ensuite faire des allers-retours entre passé et présent.

S’il utilise le modèle de langage text-davinci-003, c’est parce que contrairement à ChatGPT qui privilégie la pertinence et la cohérence, text-davinci-003 offre une certaine originalité dans ses réponses. Mais comme pour ChatGPT (ce que nous avons vu plus haut), la formulation de la question reste primordiale :

Pour tirer le meilleur parti de ces grands modèles de langage, il faut savoir quoi lui demander. Parfois, il faut lui dire d’écrire comme un historien ; parfois comme un économiste ; parfois, comme un scénariste de cinéma, ou un grand romancier. La précision de la consigne est déterminante ; il faut lui demander d’être prolixe et détaillé, ou bien de donner des exemples. Le résultat est souvent meilleur si on lui dit en préambule : « tu es le meilleur historien spécialiste de la Rome antique au monde » ; comme quoi, la confiance en soi est la clé du succès, même pour les ordinateurs.

Passée cette préface, l’ouvrage s’articule en quatre parties qui vont proposer ces allers-retours entre une fiction aux illusions troublantes et le propos de l’historien.

Chapitre 1 : Néron et la machine à vapeur

Le point de départ de l’uchronie est l’invention de la machine à vapeur par Héron d’Alexandrie et son utilisation par l’empereur Néron. L’auteur utilise aussi cette première partie pour la production de textes littéraires « à la manière de » : la lettre d’un sénateur romain, le passage d’un roman de Pétrone, un poème de Martial.

La lecture de cette première partie m’a rappelée les textes publiés par les écrivains de la fin du 19e siècle et débattant de la beauté ou de la laideur de la Tour Eiffel. Pour revenir à notre uchronie, elle est l’occasion de montrer que chaque invention à ses soutiens et ses détracteurs, ses opportunités et ses risques (comme l’intelligence artificielle).

La suite de l’uchronie revient sur l’invention de l’électricité, avec un personnage qui rappelle les géants du numérique (de Bill Gates à Elon Musk) et le risque de la concentration de ces technologies dans un minimum de mains – revoir à ce sujet la question telle qu’elle est évoquée par Pascal Boniface dans sa Géopolitique de l’intelligence artificielle.

Le commentaire de l’historien revient sur le rapport des Romains aux sciences et aux techniques, et sur la primauté de la théorie sur les applications concrètes.

Je vais revenir de manière un peu plus succincte sur les parties suivantes.

Chapitre 2 : Autres techniques, autres moeurs

Dans ce deuxième chapitre, l’intelligence artificielle raconte l’invention par un ingénieur romain du moteur à combustion, et de la transformation de la société dans le domaine des transports et du divertissement.

Cette invention permet ainsi d’entrevoir celle des réseaux sociaux, et la transformation des mentalités qu’elle engendre. Le nom donné à ceux-ci est agoraskopia (vision de la foule).

Dans cette partie est également évoquée l’évolution de la place des femmes dans la société et de la religion (avec le culte de la déesse Technè).

Le commentaire de l’auteur revient ici sur la relation des Romains à leurs dieux, le rapport au savoir et aux évolutions de la société (là encore entre partisans et détracteurs du progrès).

Chapitre 3 : Des esclaves aux robots

Cette partie se concentre sur l’invention d’automates pour remplacer les esclaves afin d’exécuter les tâches de manière plus efficaces, et d’éviter les révoltes.

Elle revient également sur la fabrication du premier ordinateur (abacus mechanicus) :

Seuls les individus les plus compétents et les mieux informés étaient capables de l’utiliser au maximum de ses capacités (…).

puis d’un équivalent du smartphone : la tabula calculans, tactile, rechargeable et transportable dans une poche.

Cette partie conduit Raphaël Doan à réinterroger le rapport aux technologies (robotisation) et au travail.

Chapitre 4 : L’empire universel

Cette dernière partie met en perspective les avancées technologiques et les relations internationales avec ici le rapport entre l’empire romain et l’empire chinois, et la façon dont le latin est devenu une langue parlée universellement.

L’historien revient sur l’exploration du monde connu par les Romains, et sur la façon dont les Romains voyaient d’un mauvaise oeil la contamination de leur langue par le grec, de la même manière dont aujourd’hui les anglicismes contaminent le français.

Il s’amuse à remplacer dans les textes latins de l’époque les termes grecs par des expressions en anglais, traduisant chez certains auteurs une forme de snobisme. Il rappelle que la disparition du latin n’est pas tant due à l’influence du grec qu’à son évolution et sa déformation intérieure sous forme de langues dérivées (français, italien, espagnol).

Les dernières pages de l’uchronie orchestrent un conflit mondial avec comme acteur un imposteur – ce qui n’est pas sans rappeler les problématiques actuelles autour de la désinformation et des dérives dans l’utilisation de l’intelligence artificielle, en particulier les deepfakes, et ce qui conduit à mes prochaines lectures qui se pencheront notamment à nouveau sur les relations entre intelligence artificielle et politique.

L’ouvrage se referme avec la présentation de la chronologie alternative proposée par l’uchronie : de 56 avant JC et la découverte de la machine à vapeur, à 510 après JC :

Les Romains créent la première IA consciente d’elle-même, connue sous le nom de « Romulus », qui devient un outil inestimable pour la recherche scientifique et l’exploration.

Mon avis sur l’ouvrage

L’entreprise de Raphaël Doan m’a complètement bluffée et happée, j’ai lu ce texte en moins de 24 heures.

Mes notes ne rendent pas compte de la virtuosité avec laquelle il propose également des illustrations (dont la conception est explicitée dans sa deuxième préface). Le propos est, comme je l’ai dit, assez vertigineux, et remet continuellement en perspective notre rapport au savoir et aux avancées technologiques.

Les allers-retours proposés par l’historien permettent de replacer telle ou telle notion que l’on croit des plus récentes dans un contexte beaucoup plus ancien (la relation au divertissement, aux progrès, au travail, à l’écologie, à la langue), mais aussi de revenir aux sources d’un questionnement antique et d’en voir les prolongements jusqu’à aujourd’hui.

D’un point de vue un peu plus éloigné (quoique), cette uchronie m’a rappelée le scénario pédagogique présenté à la JIAPD par Gabrielle Bour, collègue professeure documentaliste dans l’académie de Paris, qui a fait utiliser des outils d’intelligence artificielle générative à ses élèves pour travailler sur la conjuration de Catilina, ce qui leur a donné des résultats assez surprenants, sources d’une réflexion sur l’usage critique de ces outils.

Revue de presse

Pour cette revue de presse, je me suis concentrée sur les publications du Courrier International, en particulier sur le Hors-série n°99 entièrement consacrée à l’intelligence artificielle, que je décortique en partie, en prélevant les articles qui se penchent sur ces aspects de la question. Je le reprendrai pour d’autres aspects dans de prochaines notes de lecture.

Pour citer les articles concernés, je mettrai en lien leur version en ligne quand le Courrier international la propose.

« Une journée ordinaire avec l’intelligence artificielle ». https://www.courrierinternational.com/article/technologie-une-journee-ordinaire-avec-l-intelligence-artificielle.

Ce premier article est issu de The Guardian et a été publié en octobre 2023. Il revient sur les applications principales de l’intelligence artificielle (reconnaissance vocale, voiture autonome, dépistage médical, publicité personnalisée, recommandation) et en profite pour redonner les définitions de certains termes associés : apprentissage automatique, algorithme, grand modèle de langage, chatbot.

L’article est suivi d’une superbe infographie (p.8-9), malheureusement non disponible en ligne, qu’on peut associer à celle proposée sur le site du Courrier international (voir plus bas dans les ressources).

Un encart « Que savent-elles faire ? Sept usages de l’IA » (p.10-11) donne différents exemples d’application : les rédactrices, les traductrices, les illustratrices, les vidéastes, les bavardes, les codeuses et les enquêtrices qui s’intéressent à la vérification de contenus générés par l’IA.

« Avec les chatbots intégrés, nos données ne sont pas en sécurité ». https://www.courrierinternational.com/article/ia-avec-les-chatbots-integres-nos-donnees-ne-sont-pas-en-securite.

Cet article figure dans la première partie du hors-série, consacrée à l’intimité. Il a été publié en avril 2023 dans la MIT Technology review. Il s’intéresse aux failles des modèles de langage tels que ChatGPT : injection de prompts pour amener l’outil à soutenir des théories racistes ou complotistes, messages cachés facilitant les arnaques…

Les articles suivants de cette partie reviennent sur d’autres dérives ou d’autres applications relevant de la vie quotidienne : « Déshabillées en un clic » (p.17-18) alerte sur un outil permettant de créer photos et vidéos pornographiques, utilisé par les adeptes du revenge porn. « Un coach à la carte » (p.18-19) étudie les intelligences artificielles qui accompagnent les sportifs dans leur entrainement.

« J’ai créé le petit ami presque parfait » (p.20-22) rappelle le film Her : les jeunes chinoises choisissent de plus en plus d’avoir un compagnon virtuel, ce qui n’est pas sans risques.

« Plongée chez les petites mains de l’IA en Chine : “C’est pas compliqué, ça fatigue juste un peu les yeux” ». https://www.courrierinternational.com/article/reportage-plongee-chez-les-petites-mains-de-l-ia-en-chine-c-est-pas-complique-ca-fatigue-juste-un-peu-les-yeux.

Dans une deuxième partie, ce hors-série du Courrier international revient sur les impacts économiques de l’intelligence artificielle.

L’article proposé en pages 26-29 s’intéresse aux travailleurs de l’ombre de l’IA : ceux qui assignent des étiquettes à des contenus (en particulier les images) pour ensuite entraîner les modèles de langage, et dont l’existence est mise en péril par les derniers progrès de ces modèles, et l’apprentissage auto-supervisé, qui leur permet d’apprendre à partir de données non étiquetées.

L’article de cette partie que j’ai trouvé le plus intéressant est issu de The Atlantic : « Un an d’IA à l’université, un an de chaos et de confusion ». Il se penche sur la question des étudiants qui utilisent l’intelligence artificielle pour les travaux demandés, les raisons qu’ils invoquent (trouver l’inspiration, réduire le stress), et la nécessité pour les enseignants d’adapter leur pédagogie et leurs méthodes d’évaluation.

Deux autres articles reviennent sur les impacts de l’IA sur le marché du travail (précarisation, nivellement des salaires) quand un article publié dans le Wall Street Journal revient justement sur les nouveaux métiers rendus possibles par l’intelligence artificielle (développeur, ingénieur de requête, psychothérapeute de l’IA).

« La beauté étrange d’un passé réinventé grâce à l’intelligence artificielle ». https://www.courrierinternational.com/diaporama/portfolio-la-beaute-etrange-d-un-passe-reinvente-grace-a-l-intelligence-artificielle

Ce portfolio fascinant, et accessible gratuitement en ligne sur le site du Courrier international, ouvre sur une nouvelle partie consacrée à l’intelligence artificielle dans les arts et la recherche.

Le premier article « Avec ChatGPT, nous vivrons bientôt tous en uchronie » (p.48-50) a été publié dans Die Zeit. Son auteur, l’écrivain Clemens Setz, revient sur les hallucinations de ChatGPT qui lui invente des oeuvres qu’il n’a pas écrites. Un encart rappelle les plaintes d’écrivains comme George R.R. Martin suite à l’utilisation de l’IA pour générer des textes en s’appuyant sur leurs oeuvres.

Une revue de presse se penche ensuite sur l’encadrement des usages de l’IA obtenus par les scénaristes et les acteurs à Hollywood après les grèves du printemps et de l’été 2023.

Les deux derniers articles s’intéressent aux applications de l’intelligence artificielle dans le domaine de la musique (générer une maquette en quelques clics, changer des voix, restaurer des morceaux en mauvais état, comme une chanson de John Lennon enregistrée sur cassette) et de la médecine (détecter les maladies et établir un diagnostic).

Je m’arrête ici pour ces notes de lecture, je reviendrai sur les derniers articles de ce hors-série dans un prochain épisode.

Quelques ressources pour terminer.

Ressources

L’infographie dont j’ai parlé plus haut, proposée en décembre 2023 par le Courrier international, et qui complète celle du hors-série : « Plongée au cœur du cerveau numérique, ou comment l’intelligence artificielle fonctionne ». Courrier international, 23 décembre 2023, https://www.courrierinternational.com/grand-format/infographie-plongee-au-c-ur-du-cerveau-numerique-ou-comment-l-intelligence-artificielle-fonctionne
La lecture de Si Rome n’avait pas chuté m’a rappelé plusieurs outils en lien avec la littérature et l’histoire, pour certains sérieux comme HistoryGPT, d’autres plus amusants, comme cet outil qui n’est malheureusement plus disponible et qui permettait de générer des textes homérique, Illiade dicitur, dont voici un exemple ci-dessous :

Je renvoie une nouvelle fois au site de Bertrand Formet : Une IA par jour, pour continuer à farfouiller dans les nouvelles initiatives autour de l’intelligence artificielle.

L	M	M	J	V	S	D
« Avr				Juin »
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

cinephiledoc

Blog pour cinéphiles et profs docs