{"id":9818,"date":"2021-06-11T09:00:41","date_gmt":"2021-06-11T07:00:41","guid":{"rendered":"https:\/\/www.sage.com\/fr-fr\/blog\/?post_type=sage_glossary&#038;p=9818"},"modified":"2026-03-18T17:08:21","modified_gmt":"2026-03-18T16:08:21","slug":"data-lake-definiton","status":"publish","type":"sage_glossary","link":"https:\/\/www.sage.com\/fr-fr\/blog\/glossaire\/data-lake-definiton\/","title":{"rendered":"Data Lake"},"content":{"rendered":"<header class=\"entry-header has-dark-background-color entry-header--has-illustration entry-header--has-illustration--generic\">\n\t<div class=\"container\">\n\t\t<div class=\"entry-header__row row align-center\">\n\t\t\t<div class=\"col col-lg-7 col-xlg-6 entry-header__content\">\n\t\t\t\t\t\t\t<div class=\"component component-single-header\">\n\t\t\t\t\t\t\t\t\t\t<div class=\"entry-header__misc text--subtitle text--uppercase text--small\">\n\t\t\t\t\t\t\t<a href=\"https:\/\/www.sage.com\/fr-fr\/blog\/glossaire\/\" class=\"entry-header__link\">D\u00e9finition<\/a>\t\t\t\t\t\t<\/div>\n\t\t\t\t\n\t\t\t\t<div class=\"entry-title-wrapper\">\n\t\t\t\t\t<h1 class=\"entry-title\">\n\t\t\t\t\t\tData Lake\t\t\t\t\t<\/h1>\n\t\t\t\t<\/div>\n\n\t\t\t\t\n\t\t\t\t\n\t\t\t\t\n\t\t\t<\/div>\n\n\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\t<\/div>\n\t<div class=\"single-post-details container\">\n\t\t<div class=\"col\">\n\t\t\t<span class=\"reading-time\"> min de lecture<\/span>\n\t\t<button\n\t\t\ttype=\"button\"\n\t\t\tclass=\"social-share-button button button--icon button--secondary js-social-share-button\"\n\t\t\tdata-share-title=\"Data Lake\"\n\t\t\tdata-share-url=\"https:\/\/www.sage.com\/fr-fr\/blog\/glossaire\/data-lake-definiton\/\"\n\t\t\tdata-share-text=\"Veuillez lire cet article int\u00e9ressant\"\n\t\t>\n\t\t\t<span class=\"social-share-button__share-label\">Partager<\/span>\n\t\t\t<span class=\"social-share-button__copy-label\" hidden>Copier le lien<\/span>\n\t\t\t<span class=\"social-share-button__copy-tooltip\" aria-hidden=\"true\" hidden>Copi\u00e9<\/span>\n\t\t<\/button>\n\n\t\t\t\t<\/div>\n\t<\/div>\n<\/header>\n\n\n\n<p>Le Data Lake (ou lac de donn\u00e9es) est une composante cl\u00e9 de la strat\u00e9gie <a href=\"https:\/\/www.sage.com\/fr-fr\/blog\/glossaire\/big-data-definition\/#:~:text=Le%20Big%20Data%20est%20un,qu'il%20conf%C3%A8re%20aux%20entreprises.\">Big Data<\/a> d&rsquo;une entreprise. Pour r\u00e9sumer, il constitue le r\u00e9ceptacle vers lequel toutes les donn\u00e9es potentiellement int\u00e9ressantes de l&rsquo;entreprise vont converger afin d&rsquo;y \u00eatre stock\u00e9es, historis\u00e9es et analys\u00e9es. Explications.<\/p>\n\n\n<?xml encoding=\"utf-8\" ?><div class=\"wp-block-yoast-seo-table-of-contents yoast-table-of-contents\"><ul><li><a href=\"#h-qu-est-ce-que-le-data-lake\" data-level=\"2\">Qu&rsquo;est-ce que le Data Lake ?<\/a><\/li><li><a href=\"#h-a-quoi-sert-il\" data-level=\"2\">&Agrave; quoi sert-il ?<\/a><\/li><\/ul><\/div>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-qu-est-ce-que-le-data-lake\">\u00a0Qu&rsquo;est-ce que le Data Lake ?<\/h2>\n\n\n\n<p>Par opposition \u00e0 une <strong>base de donn\u00e9es<\/strong> classique qui stocke des donn\u00e9es g\u00e9n\u00e9ralement textuelles de mani\u00e8re structur\u00e9e, un <strong>Data Lake<\/strong> voit converger \u00e0 la fois des donn\u00e9es structur\u00e9es, mais aussi des s\u00e9ries temporelles, des graphes, des documents, des images, des vid\u00e9os. L&rsquo;objectif du Data Lake est de combattre le ph\u00e9nom\u00e8ne <strong>des silos de donn\u00e9es<\/strong> qui,<strong> diss\u00e9min\u00e9s dans le syst\u00e8me d&rsquo;information,<\/strong> emp\u00eachent la libre circulation des donn\u00e9es dans l&rsquo;organisation et sont en cela un frein \u00e0 l&rsquo;<a href=\"https:\/\/www.sage.com\/fr-fr\/blog\/cloud-catalyseur-innovation\/\">innovation<\/a> et l&rsquo;<a href=\"https:\/\/www.sage.com\/fr-fr\/blog\/le-cloud-au-service-de-la-flexibilite-de-votre-entreprise\/\">agilit\u00e9<\/a>. En rapprochant toutes les donn\u00e9es en un m\u00eame lieu, on va faciliter leur circulation.<\/p>\n\n\n\n<p>De fait, un Data Lake ne s&rsquo;appuie pas sur une technologie de stockage unique. Il met en \u0153uvre plusieurs solutions de stockage en parall\u00e8le. Vont ainsi cohabiter des s<strong>olutions de stockage<\/strong> d\u00e9di\u00e9es \u00e0 conserver de gros volumes de donn\u00e9es, mais aussi d&rsquo;autres technologies comme des <strong>bases de donn\u00e9es de type NoSQL<\/strong>, ou de simples <strong>espaces de stockage<\/strong> de fichiers.<\/p>\n\n\n\n<p>Ces technologies peuvent \u00eatre orient\u00e9es document, \u00eatre d\u00e9di\u00e9es au stockage de s\u00e9ries temporelles, rev\u00eatir la forme de bases de donn\u00e9es orient\u00e9es graphe ou de solutions d&rsquo;analyse haute performance de type \u00ab\u00a0in-memory\u00a0\u00bb pour investiguer les donn\u00e9es de mani\u00e8re int\u00e9ractive. Cette diversit\u00e9 de technologies constitue l&rsquo;une des grandes forces du <strong>Data Lake<\/strong> : quelle que soit la nature de la donn\u00e9e, celui-ci pourra la conserver et la mettre \u00e0 disposition des <a href=\"https:\/\/www.sage.com\/fr-fr\/blog\/ceo-quels-talents-pour-vous-entourer\/\">Data Scientists<\/a> (analystes de donn\u00e9es).<br>\nLa diversit\u00e9 des technologies \u00e0 mettre en \u0153uvre, mais aussi des \u00e9normes volumes de donn\u00e9es manipul\u00e9s, poussent de plus en plus les entreprises \u00e0 d\u00e9ployer leur Data Lake sur le <strong><a href=\"https:\/\/www.sage.com\/fr-fr\/blog\/glossaire\/cloud-computing-definition-du-cloud-computing\/\">Cloud<\/a> public<\/strong>. Les principaux fournisseurs de services Cloud proposent des solutions permettant de d\u00e9ployer facilement un Data Lake sur leurs infrastructures, avec un <strong>paiement \u00e0 l&rsquo;usage<\/strong> qui facilite le lancement d&rsquo;un tel projet.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\" id=\"h-a-quoi-sert-il\">\u00c0 quoi sert-il ?<\/h2>\n\n\n\n<p>Outre sa vocation de r\u00e9f\u00e9rentiel de l&rsquo;ensemble des donn\u00e9es de l&rsquo;entreprise, le <strong>Data Lake<\/strong> a une seconde vocation : celle d&rsquo;offrir des <strong>outils de traitement et d&rsquo;analyse<\/strong> des donn\u00e9es pour les Data Scientists. Le Data Lake met \u00e0 disposition de ces experts tout un portefeuille d&rsquo;outils et d&rsquo;algorithmes pour que ceux-ci puissent investiguer les donn\u00e9es stock\u00e9es dans le Data Lake. Les Data Scientist vont pouvoir traiter ces donn\u00e9es, les croiser et \u00e9crire les algorithmes qui livreront aux utilisateurs m\u00e9tiers des informations pertinentes pour orienter leurs choix. Pour mener \u00e0 bien ces t\u00e2ches, les Data Scientists disposent \u00e0 la fois de langages d\u00e9di\u00e9s \u00e0 l&rsquo;analyse des donn\u00e9es dont Python ou le langage R, mais aussi d&rsquo;outils d&rsquo;analyse et de visualisation de donn\u00e9es (appel\u00e9s outils de DataViz).<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"h-cas-d-usage\">Cas d\u2019usage<\/h3>\n\n\n\n<p>les Data Scientists vont pouvoir manipuler les donn\u00e9es issues des applications internes de l&rsquo;entreprise, les retraiter et g\u00e9n\u00e9rer de la valeur pour les m\u00e9tiers. Ainsi, le <strong>Data Lake<\/strong> va jouer un r\u00f4le cl\u00e9 dans une <strong>strat\u00e9gie <a href=\"https:\/\/www.sage.com\/fr-fr\/blog\/glossaire\/definition-solutions-crm-et-gestion-de-la-relation-client\/\">CRM<\/a><\/strong> de type multicanal en recoupant les donn\u00e9es issues :<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li>des sites Web de l&rsquo;entreprise, <\/li>\n\n\n\n<li>des distributeurs <\/li>\n\n\n\n<li>des commerciaux et de leur CRM. <\/li>\n<\/ul>\n\n\n\n<p>Ces donn\u00e9es peuvent \u00eatre enrichies de sources de donn\u00e9es externes tr\u00e8s diverses. En corr\u00e9lant les donn\u00e9es de ventes en magasin \u00e0 celles de la m\u00e9t\u00e9o, ceux-ci vont pouvoir d\u00e9terminer si les produits commercialis\u00e9s par l&rsquo;entreprise sont \u00ab m\u00e9t\u00e9o sensibles \u00bb et, par cons\u00e9quent, d\u00e9livrer des pr\u00e9visions de ventes en fonction de la m\u00e9t\u00e9o annonc\u00e9e. De m\u00eame, les donn\u00e9es d\u00e9mographiques peuvent \u00eatre pertinentes pour <strong>optimiser un r\u00e9seau de distribution<\/strong>. Aliment\u00e9 ainsi de multiples sources de donn\u00e9es, le Data Lake permet aux Data Scientists de rechercher des corr\u00e9lations parfois inattendues, mais qui peuvent donner l&rsquo;avantage \u00e0 l&rsquo;entreprise sur certains march\u00e9s.<\/p>\n\n\n\n<p>Par sa capacit\u00e9 \u00e0 manipuler de gros volumes de donn\u00e9es, le <strong>Data Lake<\/strong> est consid\u00e9r\u00e9 comme le pr\u00e9requis indispensable \u00e0 toute strat\u00e9gie de mise en \u0153uvre de l&rsquo;<a href=\"https:\/\/www.sage.com\/fr-fr\/blog\/intelligence-artificielle-2019-guide\/\">Intelligence Artificielle<\/a> en entreprise. En effet, pour mener l&rsquo;apprentissage des algorithmes apprenants tels que le <strong><a href=\"https:\/\/www.sage.com\/fr-fr\/blog\/glossaire\/machine-learning-definition\/\" type=\"link\" id=\"https:\/\/www.sage.com\/fr-fr\/blog\/glossaire\/machine-learning-definition\/\">Machine Learning<\/a><\/strong> ou le <strong>Deep Learning<\/strong>, les mod\u00e8les ont besoin de beaucoup de donn\u00e9es. Le Data Lake est donc le socle n\u00e9cessaire aux d\u00e9ploiements de technologies digitales expertes de la part des entreprises.<\/p>\n\n\n<div class=\"single-cta\">\n\t<div class=\"single-cta__positioner\">\n\t\t<div class=\"single-cta__wrapper has-dark-background-color\">\n\t\t\t<div class=\"single-cta__content\">\n\t\t\t\t\t\t\t\t<h2 class=\"single-cta__title h3\">Inscrivez-vous \u00e0 la e-newsletter mensuelle<\/h2>\n\n\t\t\t\t\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t<a\n\t\t\t\t\t\thref=\"#gate-a947ade1-e692-455f-94ce-a275d72a9a11\"\n\t\t\t\t\t\tclass=\"single-cta__button button button--primary\"\n\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t\t>Je m&#039;abonne<\/a>\n\t\t\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<img decoding=\"async\" width=\"1024\" height=\"779\" src=\"https:\/\/www.sage.com\/fr-fr\/blog\/wp-content\/uploads\/sites\/4\/2021\/05\/spreadsheets-1024x779-1.jpg\" class=\"single-cta__image\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/www.sage.com\/fr-fr\/blog\/wp-content\/uploads\/sites\/4\/2021\/05\/spreadsheets-1024x779-1.jpg 1024w\" sizes=\"auto, (min-width: 48em) 33vw, 100vw\" \/>\t\t\t<\/div>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>Le Data Lake (ou lac de donn\u00e9es) est une composante cl\u00e9 de la strat\u00e9gie Big Data d&rsquo;une entreprise. Pour r\u00e9sumer, il constitue le r\u00e9ceptacle vers lequel toutes les donn\u00e9es potentiellement int\u00e9ressantes de l&rsquo;entreprise vont converger afin d&rsquo;y \u00eatre stock\u00e9es, historis\u00e9es et analys\u00e9es. Explications. \u00a0Qu&rsquo;est-ce que le Data Lake ? Par opposition \u00e0 une base de [&hellip;]<\/p>\n","protected":false},"author":1128,"featured_media":0,"template":"","meta":{"_sage_video":false,"footnotes":""},"tags":[180,239,224],"class_list":["post-9818","sage_glossary","type-sage_glossary","status-publish","hentry","tag-crm","tag-donnees","tag-ia-digitalisation"],"distributor_meta":false,"distributor_terms":false,"distributor_media":false,"distributor_original_site_name":"Sage Advice France","distributor_original_site_url":"https:\/\/www.sage.com\/fr-fr\/blog","push-errors":false,"_links":{"self":[{"href":"https:\/\/www.sage.com\/fr-fr\/blog\/api\/wp\/v2\/sage_glossary\/9818","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.sage.com\/fr-fr\/blog\/api\/wp\/v2\/sage_glossary"}],"about":[{"href":"https:\/\/www.sage.com\/fr-fr\/blog\/api\/wp\/v2\/types\/sage_glossary"}],"author":[{"embeddable":true,"href":"https:\/\/www.sage.com\/fr-fr\/blog\/api\/wp\/v2\/users\/1128"}],"version-history":[{"count":2,"href":"https:\/\/www.sage.com\/fr-fr\/blog\/api\/wp\/v2\/sage_glossary\/9818\/revisions"}],"predecessor-version":[{"id":29370,"href":"https:\/\/www.sage.com\/fr-fr\/blog\/api\/wp\/v2\/sage_glossary\/9818\/revisions\/29370"}],"wp:attachment":[{"href":"https:\/\/www.sage.com\/fr-fr\/blog\/api\/wp\/v2\/media?parent=9818"}],"wp:term":[{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.sage.com\/fr-fr\/blog\/api\/wp\/v2\/tags?post=9818"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}