Dans cet article, je vais vous citer quelques archis BI que j’ai rencontrés dans mes différentes expériences et qui utilisent les phases ODS et STG :
Source -> STG->ODS->DWH
C’est l’archi que j’utilise souvent, le STG contient les données de la source sans aucun formatage ni filtre, c’est la copie exacte de la donnée source et ODS contient les données formatées.
Et le fait de ne formater que dans un second temps permet de voir s’il manque des données dès la source.
Inconvénient : Pour les bases de données où on a une haute volumétrie de données à intégrer et avec un mode d’alimentation FULL, cette archi n’est pas vraiment conseillé, car on passe par 3 phases d’intégration avec du formatage et du filtre sur ces données ce qui mets plus de temps pour alimenter DWH.
Source->STG->DWH
Sans passer par l’ODS, on peut intégrer les données sources avec formatage dans le Staging avant d’alimenter le DWH à partir de plusieurs tables STG : c’est un mode plus allégé.
Source->DWH
Oui, ça existe !
Ce n’est pas conseillé comme archi en terme d’exploitation, ni en terme d’organisation et de structuration, mais c’est l’archi la plus facile à implémenter.
Le fait de ne pas avoir une copie de la donnée source, ça ne permet pas de savoir où les données se perdent lors de l’intégration (non fournies par la source, rejetées lors du formatage de l’ODS, non intégrées dans le DWH …)
Leave a comment