Appariements flous de données textuelles en grande dimension.

Abstract

Appariements flous de données textuelles en grande dimension. Présentation au séminaire de la méthodologie à l’Insee

Date
Event
Séminaire de la méthodologie à l’Insee
Location
Paris

L’objectif de cette étude est de proposer une cartographie fine des comportements de consommation d’aliments gras, sucrés et salés.

Pour cela, il est nécessaire d’utiliser des méthodes d’appariement flous pour trouver, à partir de noms de produits dans les données de supermarchés, le même produit dans l’OpenFoodFacts. Nous utilisons ElasticSearch pour effectuer ce travail.

La présentation est disponible ici.

Voici une vision partielle du pipeline mis en oeuvre pour mettre en relation les différentes sources:

Avatar
Lino Galiana
Data Scientist

I am data scientist in the Department of Economic Studies at the French national statistical institute, Insee. I study Big Data and computational methods related to microeconometric and data science fields.