Analyse textuelle de documents longs : cas des accords d’entreprise

Le 18 mars (14h00 - 15h30), la DARES a présenté leur travail sur les conventions collectives ou accords d’entreprise.

extraction d'information
NLP
DARES
Date de publication

18 mars 2026

Les accords d’entreprise représente une importe quantité d’information librement accessible. Ces accords permettent d’analyser les décisions prises au niveau le plus fin de l’économie. Ils présentent cependant plusieurs enjeux méthodologiques puisqu’ils peuvent être assez longs (jusqu’à des dizaines de page) et représentent une importante masse de données à analyser. Quelles techniques mettre en oeuvre alors pour détecter les thémes abordés par ces accords et en extraire des informations ?

Les méthodes mises en place pour répondre à ces questions incluent :

L’atelier était en présentiel à l’Insee (salle 4C-358) et en visio.

Pour plus d’information, la Dares a présenté son travail aux Journées de méthodologie statistique de 2025.

Replay de la présentation :

Présentation :

La présentation est aussi disponible en ligne.