formations

Module doctoral 

Manipuler rapidement et ergonomiquement des données
spatiales ou non, issues de sources multiples

La manipulation et la capitalisation des données restent un challenge important pour les organismes de recherche. Une des difficultés majeures rencontrées par les chercheurs est de «mixer» des données dans différents formats (fichiers xls, shp, txt, base de données, etc.) issues de fournisseurs différents (données météorologiques, données de terrains, etc.). 
Toutes ces manipulations impliquent parfois des développements conséquents et coûteux, si elles ne sont pas réalisées avec des outils adaptés. 

Les ETL (extract-transform-load) constituent une famille d’outils qui proposent des composants préprogrammés (+900 pour Talend) permettant de construire des chaînes de traitements depuis des sources de données jusqu’au stockage des résultats du traitement. Ces composants sont assemblés de façon ergonomique et interactive via une interface graphique, assemblage qui automatise la production du code. Documentés correctement, ces assemblages sont une forme de capitalisation des traitements.
Module proposé par
Objectifs
S’approprier les principales fonctionnalités d’un ETL pour pouvoir manipuler et transférer des données d'une architecture source vers une architecture cible, en modifiant au besoin la structure de données. Un focus particulier sera mis sur les données spatiales et temporelles.  
Compétences visées
  • Se familiariser avec la mise en œuvre d’outils ETL
  • Être capable de réaliser des transformations de données (calcul d’indicateurs, etc.) entre des structures de données sources et des structures de données cibles. 
Programme
Le module est structuré autour de la présentation des concepts théoriques nécessaires au positionnement et à la compréhension des outils ETL et de travaux pratiques qui permettront aux chercheurs de se familiariser et s'approprier au fur et à mesure les concepts manipulés et l'outil : 
  • Présentation des ETL
  • Particularités de l'information géographique
  • Présentation détaillée de Talend et de son extension spatiale
  • Mise en pratique de l'outil sur une douzaine d'exercice de difficulté croissante
  • Application des acquis à des études de cas.
La formation est organisée en deux temps : 2 jours sont consacrés au cours et à un ensemble de TP communs et 2  jours sont consacrés au traitement de données propres des doctorants.
Modalités d'inscription
Compléter le formulaire d'inscription et le renvoyer avant le 5 mars 2018 à L. Sautot
Cas particuliers :
  • Pour les doctorants de l'école doctorale Gaia : inscription sur Adum  
  • Pour les doctorants de l'école doctorale ABIES, la formation sera proposée au catalogue de l'ED. 
Contact
Lucile Sautot - AgroParisTech - 04 67 55 86 19
André Miralles - Irstea - 04 67 54 87 29 
Informations pratiques
Dates  
Du lundi 19 mars 2018 à 14h au vendredi 23 mars 2018 à 12h30

Lieu
Maison de la Télédétection
500 rue Jean-François Breton
Montpellier
Publics
Doctorants ayant à gérer un ensemble conséquent de données.
Ce module bénéficie d’un soutien d’Agreenium dans le cadre de son appel à projet « modules doctoraux 2017 ».