Tout travail de nettoyage des données est précédé d'une analyse pour savoir ce qui exactement va devoir être modifié. Les outils d'OpenRefine vont nous être très précieux pour cela, en particulier les fonctions de facettes.

Types de données modifier

OpenRefine permet d'afficher les types de données suivantes[1] :

  • chaîne de caractères (affichée en noir).
  • nombre (affiché en vert).
  • date (affichée en noir).
  • booléen (affichée en noir).
  • la valeur null ne peut s'afficher (en gris) que si on a en fait le choix.
  • les erreurs qui ne s'affiche (en rouge) que si on en fait le choix.

Facettes modifier

Les facettes s'affichent au gauche de l'interface. Elles sont deux sortes principalement textuelles ou numériques.

Facettes textuelles modifier

Facettes numériques modifier

Références modifier

  1. Mathieu Saby, « Programmer dans Openrefine avec GREL », sur https://fr.slideshare.net, (consulté le 11 février 2020).