Formation Talend Big Data

Talend est un outil puissant permettant de traiter des données de sources hétérogènes. Dans sa version "Big Data" talend intègre les connecteurs pour se connecter aux bases No-SQL comme MongoDB et Cassandra

  1. Introduction
    • Présentation de Talend
    • Historique de Talend
    • Présentation de la solution
    • Comparaison version entreprise et version open studio
    • Installation
  2. Business Model
    • Présentation des Business Model
    • Conception de business Model
    • Etude des fonctionnalité principales
  3. Premier Job
    • Conception d'un premier Job
    • Etude du Job
    • Relation Talend et Java
  4. Construire un Job
    • Construction d'un Job
    • Options de construction
    • Exécution multi-plateforme
  5. Les méta-données
    • Principe des méta-données
    • Concept de référentiel et du mode intégré
    • Création de référentiel de base de données SQL et No-SQL
    • Job d'importation dans une base de données
    • Job d'exportation d'une base de données
    • Création de référentiel de fichiers délimités, CSV etc.
    • Mapping de données simple
    • Création d'autre référentiel : Excel, XML etc.
  6. Architecture d'un Job : Orchestration
    • Notion de Job et de sous-job
    • Les types de lien : iterate, if, onComponentOk etc.
    • Composants d'orchestrations : prejob, postjob, duplication etc...
    • Notion de variables de composants
  7. Le mapping avancé
    • Etude du mapping avancé, plusieurs entrées et plusieurs sorties
    • Variables temporaires
    • Jointure simple et multiple
    • Options de jointure (type, et gestion du rejet)
    • Gérer les sorties multiples
  8. Gestion de contexte et d'environnement
    • Explication des variables de contextes
    • Création de contextes et de variables de contextes
    • Création d'environnements : production, recette, integration
    • Excécution dans différents environnements dans Talend
    • Construction d'un Job pour un environnement donné
  9. Les composants Java
    • Différents types de composants Java : tJavaRow, tJava, tJavaFlex
    • Utilisation du composant tJava
    • Utilisation du composant tJavaRow
    • Utilisation du composant tJavaFlex
  10. Bibliothèques et Routines
    • Intégrer des bibliothèques externes
    • Intégrer ses propres bibliothèques
    • Création de routines personnalisées
  11. Ordonnancement de Job
    • Ordonnancer les Job en version entreprise
    • Outils externes en version Open Studio
    • Création de Job d'ordonnancement
    • Passage de paramètres de Job
  12. Monitoring de Job et Reporting
    • Surveillance de Job
    • Les catchers
    • Configuration de surveillance d'erreurs, d'exécutions et de flots de données
    • Acquisition des données dans une base de données
    • Gestion des erreurs et des exceptions
    • Les connecteurs de Reporting
  13. Etude des composants spécifiques au Big Data
  14. Plus qu'un ETL
    • Connexion compte FTP
    • Envoie de mails
    • Gestion de fichiers
    • Création de composants personnalisés
    • Connexion a des applications Tiers
  15. Travaux pratiques
    • Travaux pratiques présents tout au long de la formation
    • Travail pratique de mise en situation à la fin de la formation
  • Durée de la formation : 4 à 5 jours
  • Prérequis : une base de java est un plus
  • Lieu de la formation : Lyon