Dans ce nouvel épisode de mes notes de lecture, j’ai voulu me pencher sur la question des données numériques, pour prolonger les précédentes notes de lecture consacrées plus spécifiquement à l’intelligence artificielle.
Pour préparer cet article, je me suis donc plongée pour l’instant dans deux ouvrages, et dans une sélection de ressources que j’avais consultées durant le traditionnel Cybermoi/s, et qui m’ont également servi à construire mes séances en SNT.
Petite précision concernant ces notes de lecture, il s’agit encore une fois de comptes-rendus subjectifs, et qui me permettent de garder une trace de mes lectures.
Je donne aussi mon ressenti global à la lecture des ouvrages et des articles qui me tombent sous la main, moins pour en faire une critique que pour témoigner de leur accessibilité et en indiquer les prolongements possibles.
Dans cet épisode :
- un aperçu de deux ouvrages que j’ai parcouru et qui abordent la question d’un point de vue philosophique et politique : Data-Philosophie et Toxic Data
- sélection de ressources
Data-Philosophie, de Sonia Bressler
J’ai acheté ce livre pour le CDI en septembre 2023, parce qu’il m’apparaissait important d’enrichir le fonds philosophie d’ouvrages traitant de problématiques récentes, et propices à intéresser les élèves suivants notamment les spécialités HLP et HGGSP mais également pour permettre à l’ensemble des élèves d’approfondir des notions abordées en cours de philosophie.
L’ambition de ce livre, comme son titre et son avant-propos le rappellent, est donc de lier la pensée philosophique à la question des données numériques, et il soulève des problématiques déjà abordées dans les ouvrages que j’avais pu consulter sur l’intelligence artificielle (voir épisode 4), notamment la question du transhumanisme.
Dans l’introduction, l’auteure rappelle les domaines que recouvre la data-philosophie, à savoir la connaissance, les enjeux éthiques de la collecte et de l’utilisation des données, et, dans une moindre mesure pour cet ouvrage (en tout cas moindre que par exemple l’ouvrage de Pascal Boniface), les implications géopolitiques.
Data-Philosophie est construit en trois parties : contextualisation de la data-philosophie, implications de cette dernière et perspectives critiques.
Première partie : contextualisation de la data-philosophie
Dans cette partie, l’auteure propose un historique de la pensée philosophique en lien avec les données numériques. Elle étudie les ramifications les plus anciennes de la philosophie avec les enjeux actuels de l’accès à la connaissance, de l’esprit critique, de l’intelligence artificielle, etc.
Voici quelques étapes de ces ramifications :
- Platon et l’allégorie de la caverne
- Aristote et la classification des connaissances, ainsi la nécessité d’utiliser les données de manière éthique et responsable
- Descartes : doute méthodique (esprit critique), dualisme homme / machine
- Leibniz : système de notation binaire, langage universel
- Kant : impératif catégorique et éthique des données
- Charles Sanders Peirce : distinction entre signe / objet et interprétant, ce qui permet d’avoir un recul sur la manière dont sont traitées, analysées et interprétées les données
- les relations entre données et connaissance avec Bertrand Russell, Karl Popper et Thomas Kuhn
L’auteure revient ensuite sur l’émergence du domaine de la data-philosophie à proprement parler (ordinateurs – internet – réseaux sociaux) et sur :
- les problèmes éthiques qu’elle soulève : respect de la vie privée, sécurité des données, biais algorithmiques, transparence et responsabilité
- les problèmes épistémologiques et ontologiques : rapport à la connaissance et à la vérité (fiabilité de l’information), biais, représentativité des données
- l’interdisciplinarité de la data-philosophie avec les sciences de l’information, la sociologie, la psychologie et les sciences politiques
Elle évoque les apports de deux contributeurs à la data-philosophie : Luciano Floridi qui a introduit le concept d’infosphère et Tim Berners-Lee, fondateur du World Wide Web, concepteur du web sémantique et défenseur de la démocratisation et de la décentralisation du web.
Enfin, cette première partie revient sur les concepts clés de la data-philosophie, déjà rapidement évoqués :
- la relation entre les données, la connaissance et la réalité : biais potentiels des algorithmes, interprétation des données, utilisation des données personnelles à des fins politiques, infodémie et relation des individus à l’information
- la représentativité des données et la façon dont ces dernières peuvent influencer notre compréhension de la réalité
- les principes éthiques de l’utilisation des données (vie privée, confidentialité, transparence, responsabilité)
Deuxième partie : les implications de la data-philosophie
Dans cette deuxième partie, l’auteure revient sur les enjeux politiques, sociaux et humains que soulèvent les données numériques, et propose des pistes de réflexion afin d’appréhender leur utilisation de manière éthique et responsable.
Je ne vais pas revenir de manière approfondie sur ces différents enjeux, sauf ceux qui ont plus particulièrement retenu mon attention.
Dans un premier chapitre, Sonia Bressler aborde les implications éthiques : l’importance du consentement et de la transparence (avec les problématiques de respect de la vie privée), la nécessité d’un accès équitable aux données et de la lutte contre les discriminations.
Dans un second chapitre, elle aborde les implications épistémologiques : les limites de la connaissance basée sur les données et la question de la fiabilité de l’information.
Elle revient sur les enjeux de la sélection des données dans le fonctionnement des modèles prédictifs et explicatifs (machine learning, agents) et à nouveau sur les biais algorithmiques notamment dans le domaine de l’emploi (recrutement), de l’économie (accès au crédit, publicité) et de la reconnaissance faciale.
Le dernier chapitre porte sur les implications politiques et sociales :
- démocratie et gouvernance : la façon dont les données numériques participent de la polarisation des débats politiques, des bulles de filtres et de la manipulation des opinions publiques (ce qui est développé par le deuxième ouvrage que j’évoquerai dans cet article, Toxic Data), l’atteinte à la vie privée, mais également la question de la désinformation avec les biais de confirmation et l’influence sur les comportements électoraux et sociaux
- protection des droits fondamentaux avec un rappel de la protection des données (RGPD, droit à l’oubli…)
- la transparence et la responsabilité des institutions, la question de l’ouverture des données / open data (voir le site data.gouv)
- la participation citoyenne des individus aux questions relatives aux données et donc la nécessité de l’éducation (littératie des données, esprit critique)
- la relation des données aux domaines de l’économie et du travail (automatisation, protection des travailleurs et innovations technologiques)
troisième partie : perspectives critiques
Dans cette dernière partie consacrées aux débats et controverses en lien avec les données numériques, Sonia Bressler revient dans un premier temps sur les questions de neutralité et d’objectivité des données.
Les données et algorithmes peuvent-ils être neutres ? La question permet de rappeler les différents biais qui peuvent intervenir dans le traitement des données, que ce soit en amont dans la collecte de ces données (échantillonnage non représentatif) ou en aval dans leur traitement (biais de confirmation). Elle aborde également les biais qui interviennent durant la conception des algorithmes ou dans leur fonctionnement (apprentissage automatique).
Humanisme et technologie revient sur les différents penseurs qui alertent sur la déshumanisation de la société (incitation à la surconsommation, dépendance numérique) et sur les enjeux éthiques des innovations technologiques, avec la nécessaire collaboration entre humains et machines.
Le dernier chapitre de l’ouvrage revient sur les enjeux actuels des données numériques et de l’intelligence artificielle, avec à nouveau la nécessité de transparence, les implications éthiques et sociales, la relation entre intelligence artificielle et développement durable, la mise à jour des cadres réglementaires et de la législation.
Mon avis sur l’ouvrage
J’ai trouvé cette mise en relation entre la philosophie (et plus particulièrement ses ramifications anciennes) et les données numériques particulièrement éclairante.
Cela m’a rappelé d’autres lectures, plus anciennes, que j’avais pu faire lorsqu’il s’agissait de préparer les épreuves du CAPES de documentation, et même encore plus loin, les cours de philosophie suivis en terminale et en prépa.
C’est tout l’intérêt de cette question, de voir également la transversalité des données numériques.
Par contre, l’ouvrage a tendance, en voulant insister sur les différents aspects et enjeux des data, parfois à se répéter et à étirer ces problématiques, et j’avoue que cette lecture a été pour moi un peu plus laborieuse que les autres.
Elle permet cependant de prendre de la hauteur par rapport à l’ouvrage que je vais désormais aborder, et que pourtant j’avais lu en premier.
Toxic Data, de David Chavalarias
J’avais ce livre depuis le mois de juin dans ma bibliothèque, et après mes quelques lectures sur l’intelligence artificielle, il m’a paru presque récréatif…
Il apporte un éclairage spécifiquement politique à la question des données numériques et complète à la fois l’ouvrage de Sonia Bressler sur la data-philosophie et l’ouvrage de Pascal Boniface sur la géopolitique de l’intelligence artificielle.
L’auteur ancre son contexte dans la crise provoquée par la prise d’assaut du Capitole par les militants trumpistes suite aux résultats des élections américaines en 2021. Son analyse porte ensuite sur la manière dont les réseaux sociaux transforment la circulation de l’information et influencent les comportements politiques.
Il s’appuie sur un projet lancé en 2016 avec une équipe du CNRS : le Politoscope, qui collecte les messages émis sur Twitter par les comptes appartenant à la sphère politique.
L’ouvrage se décline en 14 chapitres que je vais tâcher de résumer, et propose également des visuels et des outils pour mieux appréhender la question.
chapitre 1 : la france dans le collimateur de l’alt-right
David Chavalarias étudie dans ce chapitre l’utilisation des mèmes pour marquer l’opinion publique, et donc sur le ressort émotionnel de l’information.
Ce mode de communication est utilisé durant la campagne de 2017 par les militants extrémistes, qui vont utiliser la faille de notre système électoral : le fait de ne retenir au second tour des élections que les deux candidats arrivés en tête, ce qui polarise d’autant plus la campagne.
Il analyse également la provenance de ces messages et leur temporalité, l’utilisation des bots pour diffuser les messages, la rapidité de circulation de l’information, et souligne l’habitude que nous avons prise de recevoir cette information de manière instantanée sans forcément la remettre dans son contexte.
chapitre 2 : que se passe-t-il derrière l’écran ?
Ce chapitre revient principalement sur le fonctionnement du réseau social Twitter, la façon dont se forment les communautés (homophilie / influence sociale).
chapitre 3 : nos réseaux sociaux vus du ciel
L’auteur y étudie la participation des différentes communautés politiques à des campagnes de dénigrement de personnalités, et la représentation cartographiques des comptes politiques sur Twitter.
Cela lui permet d’approfondir les phénomènes de diffusion des fausses informations, de bulles de filtres et de repli sur soi.
chapitre 4 : quand les algos partent en vrille
Ce chapitre est l’un des plus captivants : il s’intéresse à une expérience menée par un utilisateur de Facebook qui avait décidé de liker tout ce qui apparaitrait sur sa page Facebook, pour observer la façon dont le fil d’actualités se modifiait en conséquence (filtrage collaboratif).
chapitre 5 : libres de se laisser enfermer
L’auteur étudie trois phénomènes intervenant sur les réseaux sociaux :
- renforcement
- contagion algorithmique
- bulle de filtre
ainsi que le biais de confirmation, mais également le biais de négativité, qui consiste à privilégier ce qui va accentuer nos peurs dans la réception des messages (les informations négatives) plutôt que les informations positives, et là encore le ressort émotionnel des réseaux sociaux.
chapitre 6 : toxicité à tous les étages
Citation de Marshall McLuhan :
Nous façonnons nos outils, et par la suite, nos outils nous façonnent.
À la différence d’un repas familial où nous allons adapter (généralement) nos sujets de conversation à l’auditoire pour éviter de fâcher untel ou untel, nous recevons sur les réseaux sociaux (l’auteur étudie ici le fonctionnement de l’algorithme de Facebook) toutes les informations postées par notre entourage, mettant en lumière des divergences qui autrement auraient pu rester invisibles.
chapitre 7 : quand c’est gratuit, c’est vous le produit
Dans ce chapitre, l’auteur revient sur la collecte systématique et à grande échelle des données, sur le ciblage publicitaire et sur le détournement de ce ciblage à des fins politiques.
Il se penche aussi sur la manipulation des résultats de recherche et sur les suggestions proposées, notamment par l’algorithme de Google. L’auteur propose à titre d’exemples les suggestions de recherche obtenues en tapant le nom des cinq candidats les mieux placés aux élections présidentielles de 2022.
chapitre 8 : diviser pour mieux régner depuis l’étranger
Ce chapitre étudie les phénomènes de désinformation intervenant dans les campagnes électorales (États-Unis, France) depuis l’étranger (Russie) pour influencer les résultats – ou comment l’information (et la désinformation en l’occurence) est utilisée comme moyen de déstabilisation et de division intérieure.
Ces stratégies sont proposées dans l’ouvrage de Sun Tzu, L’Art de la guerre : division entre inférieurs et supérieurs, désinformation (aussi appelée division de mort), corruption.
Elles sont approfondies dans le chapitre suivant, Subversion 2.0, qui revient également sur l’émergence du réseau social Tik Tok.
chapitre 9 : subversion 2.0
- le réseau social Tik Tok et ses critères de modération contestables
- retour sur le chatbot Tay lancé par Microsoft capté par des trolls
- premières analyses du fonctionnement des agents GPT-2 et GPT-3
chapitre 10 : check-up d’une démocratie malade
L’auteur revient ici sur les évolutions du monde politique induites par les réseaux sociaux : fragmentation du monde politique, dérapage vers les extrêmes.
Ces problématiques sont approfondies dans le chapitre suivant, « La démocratie, première victime du Covid-19 », qui se penche sur les chambres d’écho antivax.
Le chapitre 12 s’intéresse quant à lui à la montée du populisme, en étudiant les principales sources de désinformation sur Twitter et les rapports ambigus entre médias traditionnels et médias numériques (rôle de C News dans la campagne d’Éric Zemmour), avec un prolongement dans le chapitre 13, introduit par une référence à la pièce Rhinocéros de Ionesco.
L’auteur finit par étudier dans le dernier chapitre deux concepts à l’oeuvre dans la société actuelle et mettant en péril le processus démocratique : la rigidité d’une société (influence sociale) et la dépendance au chemin (phénomène de renforcement).
En conclusion, il propose deux types de recommandations, au niveau individuel et collectif pour renverser la vapeur, parmi lesquelles :
- puisez à la source, aiguisez votre sens critique, identifiez vos « vrais amis », dissociez vos différents réseaux, ayez l’oeil sur vos émotions, prenez vos distances, fuyez les notifications…
- donnons la priorité à l’éducation
En annexe de son propos il donne une liste de sophismes à éviter pour de meilleurs débats en ligne, ainsi qu’un glossaire.
Mon avis sur l’ouvrage
Cet ouvrage est absolument captivant, et je me suis retenue de ne pas en faire une recension encore plus poussée.
Les recommandations en fin d’ouvrages peuvent, selon moi être réutilisées en classe pour travailler avec les élèves sur l’esprit critique. De même le glossaire reprend les termes incontournables de l’ouvrage.
Toxic Data m’a permis de tirer des fils et de revenir sur des ressources que j’avais déjà repérée : la vidéo de Fouloscopie sur les réseaux sociaux, le site Seriously qui permet de pacifier des discussions sur Internet, ou le site de Stéphanie de Vanssay, Dompter les trolls.
Ressources
- le site Data Gouv
- la vidéo de Fouloscopie : Comment sommes-nous tous connectés ?
- le projet Politoscope
- ce dernier peut-être complété par le Climatoscope qui analyse les discours autour du réchauffement climatique
- la page Points biais et sophismes du site Penser critique
- et au moment où j’écris cet article, l’actualité concernant l’utilisation des QR codes pour les jeux olympiques 2024
Laisser un commentaire