Code and Cortex !

Extraction et correction des NER avec SpaCy et JSON

2 mois ago

8 Min Read

Puisque nous nous situons dans le champ des sciences humaines et sociales (SHS), voici une brève description du corpus utilisé : il est composé de 23 articles de presse portant sur la déclaration de Gérald Darmanin dénonçant « un ratage » dans le suivi psychiatrique d’un suspect. Ce corpus a été formaté pour répondre aux exigences du logiciel IRaMuTEQ, car il me sert également de test dans le...

Lire

Classification Hiérarchique Descendante avec Rainette

Par Stéphane Meurisse

3 mois ago

9 Min Read

2 Comments

Julien Barnier est le créateur de la librairie Rainette, un outil conçu pour implémenter, dans le langage R, une Classification Hiérarchique Descendante (CHD). Cette approche statistique a été initialement développée par Max Reinert en 1983 et popularisée à travers le logiciel bien connu Alceste. La méthode de Reinert (CHD) est également accessible via le logiciel libre IRaMuTEQ. 1. La...

Lire

Modélisation et fonctionnement d’un neurone artificiel

Par Stéphane Meurisse

3 mois ago

5 Min Read

Ajouter un commentaire

Comment fonctionne un neurone artificiel ? Le neurone artificiel, s’inspire du fonctionnement des neurones biologiques. Dans cet article, nous allons présenter et modéliser un neurone artificiel en explorant ses paramètres de base et son processus de décision. Historique du Perceptron Le perceptron est l’un des premiers modèles de neurones artificiels. Il a été inventé en 1958 par Frank...

Lire

Europresse to IRaMuTeQ – v3 – appli en ligne

Par Stéphane Meurisse

3 mois ago

6 Min Read

6 Comments

No code ! Cette application en ligne est l’aboutissement de plusieurs scripts Python conçus pour transformer vos données HTML du site Europresse au format IRaMuTeQ. Aujourd’hui, je vous présente la version 3.0.1, ne nécessitant aucune manipulation de code Python 😉 . Vous pouvez suivre la démarche qui a conduit à cette version du script à travers les différents articles : Test sur un article...

Lire

Transformer les fichiers texte Europresse en CSV

Par Stéphane Meurisse

3 mois ago

5 Min Read

Ajouter un commentaire

Ce script R permet de convertir un fichier texte d’articles, issu du site Europresse et déjà formaté pour le logiciel IRaMuTeQ, en un fichier CSV (txtTOcsv). On fait donc un petit retour en arrière : on délaisse le format texte brut avec ses variables étoilées pour revenir à un encodage (mieux) structuré, où chaque variable est encodée dans une une colonne. Lors de la création de mon script...

Lire

Initiation au Deep Learning avec le Dataset MNIST

Par Stéphane Meurisse

3 mois ago

11 Min Read

Ajouter un commentaire

Introduction au Dataset MNIST Le dataset MNIST est une référence incontournable dans le domaine du machine learning et de la vision par ordinateur. Il contient des images manuscrites des chiffres de 0 à 9, chacune en niveaux de gris et de (très) petite taille (28×28 pixels). Les données sont réparties en 60 000 images d’entraînement et 10 000 images de test, et sont principalement...

Lire

Analyse des émotions dans la voix avec un modèle Speech Emotion Recognition (SER)

Par Stéphane Meurisse

4 mois ago

8 Min Read

1 Commentaire

En développant un modèle de reconnaissance des émotions par la voix (SER, pour Speech Emotion Recognition), je n’ai pas choisi la voie la plus simple pour me familiariser avec les modèles de deep learning et l’intégration de la couche de traitement « audio » dans une approche multimodale. Pourquoi ? Parce que, comparée à des domaines comme la reconnaissance faciale, la précision des modèles basés...

Lire

Speech Emotion Recognition (SER) avec le dataset RAVDESS

Par Stéphane Meurisse

4 mois ago

13 Min Read

1 Commentaire

L’objectif de cet article est de construire un modèle pour réaliser une détection des émotions à partir de la voix (SER – Speech Emotion Recognition) afin d’analyser des segments audio spécifiques, comme par exemple un discours politique de Donald Trump. La première étape consiste à concevoir et entraîner un modèle pour réaliser cette analyse émotionnelle. Cette article...

Lire

Limites des DataSets basés sur les émotions universelles de Paul Ekman

Par Stéphane Meurisse

4 mois ago

8 Min Read

2 Comments

La reconnaissance automatique des émotions via le Speech Emotion Recognition (SER = audio) et la Facial Emotion Recognition (FER = image) repose souvent sur des jeux de données labellisés avec les émotions dites « universelles » de Paul Ekman : joie, tristesse, colère, peur, surprise, et dégoût. Bien que ces émotions soient utiles pour des analyses générales (dans le marketing par exemple), leur...

Lire

Synthetic Memories : La fabrique des souvenirs

Par Stéphane Meurisse

4 mois ago

3 Min Read

Ajouter un commentaire

Utiliser l’intelligence artificielle pour matérialiser et préserver des souvenirs oubliés ou en voie d’oubli. Telle est l’ambition de ce projet artistique et scientifique, situé à la croisée de la science, de la technologie et de la créativité. Il vise à sauvegarder les identités, mais également à préserver la mémoire collective, notamment à travers la conservation du patrimoine culturel...

Lire

Code and Cortex

Derniers articles

Extraction et correction des NER avec SpaCy et JSON

Classification Hiérarchique Descendante avec Rainette

Modélisation et fonctionnement d’un neurone artificiel

Europresse to IRaMuTeQ – v3 – appli en ligne

Transformer les fichiers texte Europresse en CSV

Initiation au Deep Learning avec le Dataset MNIST

Analyse des émotions dans la voix avec un modèle Speech Emotion Recognition (SER)

Speech Emotion Recognition (SER) avec le dataset RAVDESS

Limites des DataSets basés sur les émotions universelles de Paul Ekman

Synthetic Memories : La fabrique des souvenirs

Stephane Admin