Propriétés de la dimension Parent/Child – 2ème partie

Après la création de notre dimension Parent/Child (1ère partie), nous allons voir dans cette deuxième partie, les différentes propriétés de cette dimension.

Pour cela, nous gardons le même exemple qu’avant : la dimension des familles (Catégories) d’un produit organisées selon une hiérarchie descendante.

Let’s go !!!

Lire la suite Propriétés de la dimension Parent/Child – 2ème partie

La dimension Parent/Child – 1ère partie

Parent/Child dimension est un type de dimension que je ne connaissais pas avant (Eh oui on ne peut pas tout savoir ☻), mais j’ai eu l’occasion de l’utiliser dans le cadre d’un projet sur lequel j’ai travaillé; du coup, je me suis dit que ça sera une bonne idée de partage avec vous ce que j’ai appris sur cette dimension.

Afin de mieux expliquer comment créer ce type de dimension et quelles sont ces options, laissez-moi vous mettre dans le contexte de mon exemple qui est notamment une partie de mon projet.

Lire la suite La dimension Parent/Child – 1ère partie

MPP & Distribution dans Azure SQL Data Warehouse

J’ai eu la chance d’assister à une formation sur Cortana Intelligence Suite et SQL Data warehouse chez Microsoft Paris. La formation a couvert une série de modules sur le domaine de la Data science + Azure SQL Data Warehousing.

En tant que spécialiste BI, je me suis intéressé à la partie SQL Data Warehousing et j’ai plongé dans le monde fantastique d’Azure Data Warehouse (ADW) au cours des derniers jours.

Dans cet article, je voudrais parler de deux concepts dans Azure SQL Data warehouse : MPP & distribution. Ces concepts définissent la manière dont vos données sont réparties et traitées en parallèle  :

Lire la suite MPP & Distribution dans Azure SQL Data Warehouse

Créer un cluster HDInsight en utilisant PowerShell

Cet article fournit un mécanisme de création d’un cluster HDInsight à l’aide de Windows PowerShell.

L’objectif est de définir un script PowerShell pour créer et configurer votre cluster HDInsight et bien sûr le supprimer après car l’une des fonctionnalités qui n’est pas encore gérer pour le moment dans Azure et qu’on souhaite que ça soit rajouter prochainement, est l’arrêt de votre cluster quand il est pas utilisé, car le laisser en Running coûte de l’argent.

Lire la suite Créer un cluster HDInsight en utilisant PowerShell

Qu’est-ce que la fragmentation?

Qu’est-ce que la fragmentation? Comment détecter la fragmentation et comment l’éliminer?

Une table fragmentée est une table où certaines de ses pages de données pointent vers des pages qui ne sont pas les pages immédiatement suivantes dans l’extent, et si toutes ses pages sont contiguës à la fois dans le plan d’allocation et dans les extents, alors la table n’est pas fragmentée.

Lire la suite Qu’est-ce que la fragmentation?

Défragmentation d’un index (REORGANIZE)

Pour comprendre comment SQL Server défragmente un index, considérez un exemple simplifié de pages après de nombreuses insertions, mises à jour et suppressions, comme illustré dans la figure suivante.

Lire la suite Défragmentation d’un index (REORGANIZE)

Paramétrer un lookup

L’utilisation d’une requête paramétrée dans un lookup permet d’alléger les données mises en cache, surtout dans le cas de traitements itératifs, et que l’on n’a pas besoin de charger toutes les données dans le cache.

Même si le composant lookup ne propose pas la possibilité d’utiliser des variables mais il dispose de la propriété SqlCommand qui permet de spécifier la requête du lookup et qu’on peut paramétrer.

Lire la suite Paramétrer un lookup

Clustered Vs Non-Clustered Index

La différence entre l’index Clustered et Non-clustered dans une base de données  est l’une des questions les plus populaires en  SQL.

Les index sont un concept très important, il rend l’exécution de vos requêtes rapide et si vous comparez une requête SELECT qui utilise une colonne indexée à celle qui n’a pas, vous verrez une grande différence dans les performances.

Lire la suite Clustered Vs Non-Clustered Index

Fonctions MDX basées sur le temps

Un peu de MDX pour commencer la semaine, ça fait du bien non ?!!

Comme vous l’avez déjà vu dans le titre, le but de cet article est de partager avec vous quelques fonctions MDX basées sur le temps et qui sont très utiles.

Le temps est un composant essentiel pour l’analyse du Business. Les analystes interprètent l’état de l’entreprise maintenant, souvent par rapport à ce qu’elle était dans le passé, dans le but de comprendre ce qu’il pourrait être à l’avenir.

Pour supporter ça, Analysis services fournit un certain nombre de fonctions MDX basées sur le temps, voici quelques-unes :

Lire la suite Fonctions MDX basées sur le temps