Com modernitzar la teva arquitectura de Business Intelligence amb Data Lakehouse

Blog ABAST

Com modernitzar la teva arquitectura de Business Intelligence amb Data Lakehouse

26 de març de 2024

Data Warehouse, Data Lake, Data Lakehouse… Avui dia els nostres diccionaris evolucionen d’una manera vertiginosa i moltes vegades no tenim temps per entendre els nous conceptes que van apareixent al sector de l’anàlisi de dades. Des de finals dels 80, els Data Warehouse han anat evolucionant de moltes maneres: noves eines d’ETL, motors de base de dades més potents i més facilitat per crear models de dades entre d’altres.

Per Àlex Ginés, BI & BA Business Manager

Entrats els 2000, es va començar escoltar la paraula Data Lake i van aparèixer les primeres mencions a tecnologies com MapReduce, Hadoop, Spark i fins i tot Hive, i amb totes aquestes tecnologies apareixen també un munt de paraules inintel·ligibles per a la gent corrent.

Què tenen de bo els Data Lake? Els Data Lakes ofereixen un clar avantatge en flexibilitat i capacitat per gestionar dades no estructurades i semi-estructurades. Tot i això, la contrapartida principal consisteix en l’organització d’aquestes dades, ja que solen emmagatzemar-se en fitxers que poden resultar difícils de gestionar.

I llavors… què és un Data Lakehouse? És ajuntar el millor dels dos mons: la potència per tractar dades de tota mena juntament amb les característiques analítiques habituals de tenir un Data Warehouse.

Per desplegar aquest tipus de solucions, necessitem noves eines i metodologies. Per exemple, els anomenats Data Lakehouse se solen estructurar en tres capes anomenades Bronze, Silver i Gold:

  1. Bronze: dades en estat original i sense processament
  2. Silver: dades processades i netes, però de manera bàsica
  3. Gold: dades processades amb lògica de negoci aplicada i llestos per ser explotats.

Una arquitectura típica per exemplificar aquest ecosistema, en aquest cas dins d’Azure i sota el paraigua de Microsoft, seria la següent:

Captura de pantalla 2024-03-25 173011

Cada peça daquesta arquitectura compleix una funció important:

  • Azure Data Lake: repositori on residirà el nostre Data Lakehouse
  • Azure Data Factory: integrador de dades dels orígens al Data Lake
  • Azure Databricks: motor de processament de dades i encarregat d’executar les transformacions de dades
  • Azure Key Vault & DevOps: securització de credencials i control de codi
  • Power BI: eina de Business Intelligence que ens permetrà analitzar les dades de manera àgil i visual

Al final del dia, el que busquem són resultats i prendre decisions al moment oportú. Per això, plataformes com l’anterior són excel·lents perquè s’ajusten a les nostres necessitats en temps real. El núvol juga un paper clau en ser un catalitzador de la innovació.

En properes entrades del bloc, us explicarem més detalladament com funciona aquesta arquitectura i cadascuna de les seves peces i us donarem consells perquè li traieu el màxim partit.

Si estàs interessat a conèixer més sobre les darreres tendències en anàlisi de dades o si t’agradaria provar la tecnologia Data Lakehouse amb un cas pràctic, no dubtis a posar-te en contacte amb nosaltres

Últims posts publicats al Blog d'ABAST

Transforma el teu IT amb una Estratègia de Núvol Híbrid Intel·ligent

El núvol híbrid intel·ligent s'ha convertit en la resposta per a aquelles organitzacions que busquen combinar la flexibilitat del núvol públic amb la seguretat i…
Leer más

Com aprofitar la Intel·ligència Artificial?

No hi ha cap dubte que des que OpenAI va fer el llançament públic de ChatGPT el novembre de 2022, moltes coses han canviat. Des…
Leer más

Tecnologia Sostenible: Caminant cap a un futur més verd

La sostenibilitat ha esdevingut un pilar clau en el desenvolupament tecnològic. A mesura que les empreses busquen reduir la seva empremta ambiental, la tecnologia té…
Leer más

Registration

Forgotten Password?