ETL : réussir son projet d’intégration
Informations générales
Objectifs & compétences
Mesurer les enjeux de l'intégration des données
Identifier les fonctionnalités d'alimentation nécessaires à l'intégration des données
Évaluer la capacité des outils ETL à répondre aux besoins d'intégration
S'approprier la démarche de spécification d'un flux d'intégration des données
Public visé
Architecte et urbaniste SI
Chef de projet Data Warehouse
Chef de projet utilisateur
Maîtrise d'oeuvre
Maîtrise d'ouvrage
Pré-requis
Connaissance ou utilisation d'un système décisionnel.
Programme
1. INTÉGRATION DES DONNÉES : UN PROJET DANS LE PROJET
Rappel des spécifications d'un système décisionnel
. Les enjeux fonctionnels du décisionnel et du nouveau
. Système d'Information : couplage des besoins de gestion et de décision.
. Évolution des systèmes décisionnels et des pratiques de pilotage : du reporting en masse au pilotage des processus.
. Comment trouver un langage commun dans un monde qui évolue ?
L'intégration des données pour la création de valeur
. Création de nouvelles informations non produites par les systèmes de gestion.
. Mise en place de référentiels communs pour une analyse globale et transversale des processus ; quel impact pour l'intégration de données ?
. Quelle règle appliquer lorsqu'une donnée n'existe pas ?
. Existe partiellement ? Existe plusieurs fois (doublon) ?
. Différents scénarios fonctionnels d'intégration.
. Quelle valeur ajoutée recherche-t-on à travers le système décisionnel ?
. Quelle séparation des rôles MOA et MOE adopter ?
2. SPÉCIFICATION DU SYSTÈME D'INTÉGRATION DES DONNÉES
La démarche : du multi sources au mono cible.
Les deux « sauts fonctionnels » :
. Les modèles (le contenant)
. Les données (le contenu)
Mise en place de l'architecture d'alimentation : base de publication, base de collecte, base d'intégration.
Spécification de l'alimentation de chacune des bases.
Quel positionnement et quel rôle donner à l'ETL dans cette architecture ? Que peut-on industrialiser ?
L'intégration des données :
. Définition des sources, des cibles et de leurs connexions
. Mise en place des flux unitaires
Construction des flux d'ordonnancement.
Comment intégrer les données issues de la diversité des systèmes de gestion ?
Pourquoi est-il important de mettre en place une norme de nommage ?
Les principales fonctionnalités requises
. Gestion des axes statiques et des axes dynamiques.
. Le principe de la « fiche inconnue ».
. Alimentation des faits en « smart insert ».
. Les principales fonctionnalités : la connectivité, la capture des données modifiées, le principe de convergence, l'enrichissement, l'ordonnancement, les alertes, la gestion des métadonnées, l'analyse d'impact des évolutions…
. Quelle politique adopter pour la mise en place des filtres et des rejets ? Quand spécifier les processus de recyclage des données ?
. Où faut-il les implémenter ?
3. PANORAMA ET TYPOLOGIE DE L'OFFRE TECHNOLOGIQUE
Panorama de l'offre technologique actuelle
. Les principales solutions d'intégration présentes sur le marché.
. Les outils ETL présents en France et leur niveau de référencement.
Les axes de typologie
. Les trois familles d'outils ETL : les générateurs de code, les moteurs propriétaires, les outils mixtes.
. Quels avantages tirer de chacune de ces familles d'outils ?
. Et quels sont les risques encourus ?
. Comment segmenter l'offre selon : sa facilité de prise en main, sa complétude, son ergonomie, son administration, son support…
. Quel est l'impact de la politique de tarification des éditeurs sur le court et le long terme ?
4. SYNTHÈSE ET PERSPECTIVES
Recommandations.
Bibliographie et sites Web utiles.
Glossaire.
Modalités
Méthodes
Tarifs
- Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
- Le dispositif FNE-Formation.
- L’OPCO (opérateurs de compétences) de votre entreprise.
- Pôle Emploi sous réserve de l’acceptation de votre dossier par votre conseiller Pôle Emploi.
- CPF -MonCompteFormation
Lieux & Horaires
Prochaines sessions