Journalisme et IA - Assises de Tours 2024

Les Assises du journalisme de Tours ont consacré une table ronde aux impacts de l’IA dans les rédactions. Si certains journalistes et associations de professionnels réfléchissent aux usages et répercussions des outils basés sur l’intelligence artificielle, d’autres s’en sont déjà emparés, quitte à développer des applications qui leur sont propres.

C’est à l’occasion d’un hackathon que les équipes du média en ligne Contexte ont expérimenté l’intelligence artificielle (IA). « L’idée était de voir ce qu’il était possible d’imaginer comme nouveaux outils utiles pour les clients et pour les journalistes, avec comme prisme de continuer à faire de l’information de qualité », raconte Yann Guégan, chargé de l’innovation éditoriale à Contexte. Un travail qui a permis de tester la pertinence de certains outils, par exemple d’automatisation d’alertes de nouvelles publications sur des sites institutionnels suivis par la rédaction. « L’occasion aussi d’une acculturation », observe Yann Guégan.

Les applications basées sur l’intelligence artificielle (IA) ?  Le Consortium international des journalistes d’investigation  (ICIJ) y recourent lui depuis 2016. « Quand nous avons commencé à travailler sur les Panama Papers, cette série d’articles issus de la fuite de plusieurs millions de documents d’une complexité folle. Même avec une centaine de journalistes, il était impossible de tout déchiffrer », raconte Pierre Romera Zhang, chef de la technologie du consortium. Dans ce cas précis, des outils de vision par ordinateur, qui confient entre autre la mission de reconnaître des images ou du texte dans un document scanné, ont été utilisés. Tout comme des outils de machine learning permettant d’identifier des typologies de documents. « L’IA automatise des tâches qu’une personne ne serait pas capable de faire », poursuit  Pierre Romera Zhang.

France Info a démarré avec l’IA à peu près à la même période. « Mais en 2022, avec ChatGPT, il y a eu un bond technologique », reconnaît Estelle Cognacq, directrice adjointe. Sur la radio publique, collecte, mise en forme et distribution de l’information sont aujourd’hui concernées. « Nous avons un outil développé avec des ingénieurs de l’INRIA (Institut national de recherche en sciences et technologies du numérique, qui détecte à partir de comptes X (anciennement Twitter) de personnalités publiques d’anciens posts afin de faire remonter les informations d’alors. Le journaliste va ensuite fact-checker et décider ou pas de traiter l’information, par exemple en comparant des chiffres communiqués à des données issues de l’INSEE», explique Estelle Cognacq. D’autres logiciels détectent un flux soudain de tweets, ce qui a permis à la rédaction de détecter des attentats, ou proposent des extraits adaptés aux réseaux sociaux issus de vidéos produites pour le compte Twitch de la radio.

Le souci de la transparence

L’ICIJ développe également ses propres outils. « Pour des raisons déontologiques et de protection des sources. Nous avons par ailleurs un processus de fact-checking assez lourd, l’information étant vérifiée par trois personnes différentes, plus une quatrième qui est responsable de la publier ou pas. Et il est aussi pour nous essentiel d’être transparent sur notre méthodologie », commente Pierre Romera Zhang. Et de déplorer: « L’IA coûte cher à mettre en œuvre. Pour entraîner de nouvelles IA, il faut compter des millions de dollars, les seuls à avoir les moyens sont les GAFAM ».

De son côté l’Alliance de la presse d’information générale (APIG), qui rassemble la presse quotidienne et hebdomadaire, participe au côté de Reporters sans frontières au projet Spinoza. « Un outil expérimenté pour améliorer la qualité des articles qui traitent du climat et de l’environnement. Il repose sur une base de données constituées des rapports du GIEC (groupe d’experts intergouvernemental sur l’évolution du climat) et de l’IPBES (plateforme intergouvernementale scientifique et politique sur la biodiversité et les services écosystémiques, l’équivalent du GIEC pour la biodiversité), de textes juridiques et d’un corpus d’articles issus des titres volontaires. L’outil sera capable de faire une synthèse pour chacune de ces trois sources, de mettre en avant les éventuelles contradictions, d’établir une métasynthèse. Et l’ensemble des résultats seront sourcés », détaille Florent Rimbert, responsable du développement numérique de l’APIG. 

Texte : Gaelle Ginibrière, journalisme et co-pilote de la commission EMI du Club

logo CIVB new