CatégorieR

Comprendre la CHD et la méthode Reinert

Cet article vise à « reproduire » la démarche statistique (simplifiée) expliquée par Julien Barnier autour de la CHD. Je reprends donc l’exemple et la démarche lors de son excellente intervention sur l’excellente chaîne YouTube Tuto Mate-SHS. L’objectif est de (re)construire un script R (sans utiliser le package « rainette ») qui, à partir des 5 phrases de l’exemple de...

CHD avec Rainette : de la classification à l’export des statistiques

Rainette est un paquet R développé par Julien Barnier pour effectuer des analyses textuelles, à l’aide d’une Classification Hiérarchique Descendante (CHD). Dans cet article, nous détaillons un script qui permet d’exporter en fichier texte, html, csv les résultats de la CHD. Voici les fonctionnalités principales du script : Réalisation de la CHD (cf. article) Extraction de...

Classification Hiérarchique Descendante avec Rainette

Julien Barnier est le créateur de la librairie Rainette, un outil conçu pour implémenter, dans le langage R, une Classification Hiérarchique Descendante (CHD). Cette approche statistique a été initialement développée par Max Reinert en 1983 et popularisée à travers le logiciel bien connu Alceste. La méthode de Reinert (CHD) est également accessible via le logiciel libre IRaMuTEQ. 1. La...

Transformer les fichiers texte Europresse en CSV

Ce script R permet de convertir un fichier texte d’articles, issu du site Europresse et déjà formaté pour le logiciel IRaMuTeQ, en un fichier CSV (txtTOcsv). On fait donc un petit retour en arrière : on délaisse le format texte brut avec ses variables étoilées pour revenir à un encodage (mieux) structuré, où chaque variable est encodée dans une une colonne. Lors de la création de mon script...

Analyse factorielle des correspondances sur un corpus de texte

L’Analayse Factorielle des Correspondance (AFC), développée dans les années 1960 par le statisticien français Jean-Paul Benzécri, est une méthode statistique qui permet de réduire la dimensionnalité des données tout en mettant en évidence les relations entre les variables d’un tableau de contingence. À titre d’exemple, on peut citer le travail de Pascal Marchand (LERASS...

Stephane Admin