Les différentes étapes pour construire le processus ETL générant la dimension Pesticide

Commencez par créer un nouveau projet EasyMorph.

Import des Données

La lecture de la logical datamap montre que nous allons utiliser la source de données suivante :

  • pesticides.csv
Logical Datamap
Logical Datamap spécifiant la transformation des données (cliquez pour aggrandir)

Processus ETL

Traitement du fichier pesticides.csv

Suivez les étapes suivantes pour générer la dimension dim_pesticide :

  1. Importez le fichier pesticides.csv en le glissant-déposant dans la fenêtre principale ou avec Add data > Import file > Import delimited text file dans le bandeau d’outils. Assurez-vous que les paramètres d’import soient bien configurés, notamment l’encoding en UTF-7 (nécessaire ici) et le séparateur de champ (détails).
  2. Ajoutez une clef artificielle auto-incrémentée à la table. Vous souvenez-vous pourquoi cette étape est indispensable ? (détails).
  3. Renommez les colonnes pour respecter la terminologie de la logical datamap (détails).
  4. Supprimez les colonnes qui ne sont pas documentées dans la logical datamap (détails).
  5. Réordonnez les colonnes selon le même ordre que la logical datamap. Pour cela allez dans la fenêtre active montrant un extrait des données et déplacez directement les colonnes.
  6. Exportez la dimension dans un fichier dim_pesticide.csv (détails).
Processus de construction de la dimension `Pesticide`
Processus de construction de la dimension `Pesticide`.

Exécution du processus

Dans le bandeau d’outils cliquez sur Run project pour exécuter le processus ETL. Vérifiez que le fichier dim_pesticide.csv a bien été généré.

Retour au processus ETL global