Data lake, Data Lack ... Data Swamp !

Écrit par Thierry Pécoud, le 10 septembre 2019

Enjeu stratégique, programme transverse entre les directions, et pour certaines organisations un chamboulement incroyable, le Data Lake est un prérequis indispensable pour atteindre la promesse de partage des données et de création de valeurs nouvelles à l’échelle de l’entreprise.

Si le Data Lake est devenu un levier incontournable pour les systèmes d’information, en établir l’état de l’art est aujourd’hui un défi, tant les cas d’usage, les environnements et les organisations mis en place sont variés. Un défi qui doit être relever pour exploiter le plein potentiel de l’une des meilleures réponses des DSI aux stratégies des entreprises.

Promesses initiales du Data Lake

« Driver du changement culturel, le Data Lake oblige les organisations à créer un patrimoine commun. »

Picture4

Aujourd’hui âgés de 3 à 4 ans, les drivers initiaux des Data Lakes ont été de trois types :

  • Obligations règlementaires, auxquelles il était devenu trop coûteux voir complexe de répondre à partir des technologies et architectures traditionnelles,
  • Capacités de restitution, dont l’acceptation a été accélérée par l’avènement des nouveaux usages de Data Visualisation et par l’opportunité de stockage et de calcul qu’incarnait le Data Lake,
  • Levier d’exploration, prérequis identifié pour la valorisation de ces données qui allaient demain être partagées par l’ensemble des directions de l’entreprise.

Les premiers succès des Data Lakes se sont réalisés au travers des usages règlementaires, permis par la facilité d’accès aux données provenant de différents systèmes information opérationnels. Profitant des outils de restitution mis en place et de la disponibilité de données, les usages de restitution se sont développés, appelant une nécessité de sécurisation des accès et de mutualisation d’une vision métier sur les données.

Si la question du ROI des Data Lakes a vite été éclipsée par les objectifs règlementaires, elle n’en restait pas moins pertinente dans toutes les autres situations. Face à l’investissement humain et technologique consentis par les entreprises, ces dernières étaient en droit d’attendre rapidement les valeurs promises.

Bilan des expériences Data Lake

« Notre direction générale avait la conviction que les données ne seraient pas valorisées à leur juste potentiel sans un investissement important de l’entreprise »

Picture5

Les valeurs du Data Lake peuvent-être vues sous trois angles : les Données, le Socle et les Usages.

Loin d’être indépendantes, ces valeurs contribuent par synergie à la valeur globale du Data Lake. Celle-ci peut être appréciée au cas par cas, pour chaque Data Lake qui a vu au fil du temps se multiplier les données et les usages sur un socle, qui aujourd’hui atteint bien souvent sa maturité technologique.

« Les budgets étant plus faciles à trouver pour les projets réglementaires, ces derniers réduisent l’usage du Data Lake en entrepôt de silos de données, peu adaptés pour le croisement et le partage des données. »

Pour autant, la promesse initiale d’un partage de la donnée et d’une création de valeur pour toute l’entreprise n’est que très rarement atteinte. Force est de constater que le Data Lake a d’avantage été vu comme une opportunité technologique pour réduire un time to market projet. Dans cette perspective, projet après projet, la structuration des données autour d’une vision métier et d’une recherche de valeur à l’échelle de l’entreprise ne s’est pas faite.