CatégoriePython

Automatisation du traitement des corpus Europresse pour IRAMUTEQ

Introduction Dans cet article, nous explorons la création d’un script Python conçu pour transformer automatiquement des corpus de presse au format HTML, provenant d’Europresse, en un format compatible avec le logiciel d’analyse textuelle IRAMUTEQ. Ce script est une réponse « aux défis » posés par les diverses structures de fichiers rencontrées. Édite 12/01/2024 => Ici le...

Transformer les fichiers HTML Europresse au format IRAMUTEQ avec Python

Préparer un corpus pour IRAMUTEQ avec un script Python L’outil de statistique IRAMUTEQ exige une préparation spécifique des données textuelles. Pour faciliter ce processus, j’ai élaboré un script Python qui fonctionne localement sur votre ordinateur. Ce script transforme les données extraites du site Europresse en un format compatible avec IRAMUTEQ. Actuellement, le script est testé...