Events

Résumer des documents diplomatiques avec l’IA: promesses et limites actuelles

Cette présentation s’inscrit dans le cadre du projet «AI-Supported Human-Computer Interaction with Large Volumes of Historical Documents» visant à concevoir des algorithmes capables de soutenir les processus éditoriaux de Documents diplomatiques suisses. Elle se concentre sur un cas d’usage précis: la génération automatique de résumés de documents historiques, envisagée comme un outil d’assistance à la sélection et à l’exploration des sources au sein du flux de travail éditorial. 

Sur la base de premières expérimentations, Xavier Baume met en évidence une tension récurrente: malgré leur caractère génératif, les modèles de résumé produisent fréquemment des textes qui réutilisent des segments du document source, parfois de manière substantielle. Ce constat invite à reconsidérer l’opposition classique entre résumés dits «abstractifs» et «extractifs», telle qu’elle structure généralement la recherche en traitement du langage naturel.

Au-delà des analyses portant sur les sorties des modèles, ces observations mettent en lumière un enjeu plus fondamental: le statut des données mobilisées pour l’entraînement et l’évaluation des systèmes. Les résumés existants ne constituent ni une référence stable ni un ensemble homogène; ils relèvent de cadres éditoriaux historiquement situés, dont les conventions interprétatives et formelles ont évolué dans le temps. Les traiter comme référence (ou ground truth) suppose donc d’interroger les conditions de leur production au sein même du projet éditorial.