Com modernitzar la teva arquitectura de Business Intelligence amb Data Lakehouse

Blog ABAST

Com modernitzar la teva arquitectura de Business Intelligence amb Data Lakehouse

26 de març de 2024

Data Warehouse, Data Lake, Data Lakehouse… Avui dia els nostres diccionaris evolucionen d’una manera vertiginosa i moltes vegades no tenim temps per entendre els nous conceptes que van apareixent al sector de l’anàlisi de dades. Des de finals dels 80, els Data Warehouse han anat evolucionant de moltes maneres: noves eines d’ETL, motors de base de dades més potents i més facilitat per crear models de dades entre d’altres.

Per Àlex Ginés, BI & BA Business Manager

Entrats els 2000, es va començar escoltar la paraula Data Lake i van aparèixer les primeres mencions a tecnologies com MapReduce, Hadoop, Spark i fins i tot Hive, i amb totes aquestes tecnologies apareixen també un munt de paraules inintel·ligibles per a la gent corrent.

Què tenen de bo els Data Lake? Els Data Lakes ofereixen un clar avantatge en flexibilitat i capacitat per gestionar dades no estructurades i semi-estructurades. Tot i això, la contrapartida principal consisteix en l’organització d’aquestes dades, ja que solen emmagatzemar-se en fitxers que poden resultar difícils de gestionar.

I llavors… què és un Data Lakehouse? És ajuntar el millor dels dos mons: la potència per tractar dades de tota mena juntament amb les característiques analítiques habituals de tenir un Data Warehouse.

Per desplegar aquest tipus de solucions, necessitem noves eines i metodologies. Per exemple, els anomenats Data Lakehouse se solen estructurar en tres capes anomenades Bronze, Silver i Gold:

  1. Bronze: dades en estat original i sense processament
  2. Silver: dades processades i netes, però de manera bàsica
  3. Gold: dades processades amb lògica de negoci aplicada i llestos per ser explotats.

Una arquitectura típica per exemplificar aquest ecosistema, en aquest cas dins d’Azure i sota el paraigua de Microsoft, seria la següent:

Captura de pantalla 2024-03-25 173011

Cada peça daquesta arquitectura compleix una funció important:

  • Azure Data Lake: repositori on residirà el nostre Data Lakehouse
  • Azure Data Factory: integrador de dades dels orígens al Data Lake
  • Azure Databricks: motor de processament de dades i encarregat d’executar les transformacions de dades
  • Azure Key Vault & DevOps: securització de credencials i control de codi
  • Power BI: eina de Business Intelligence que ens permetrà analitzar les dades de manera àgil i visual

Al final del dia, el que busquem són resultats i prendre decisions al moment oportú. Per això, plataformes com l’anterior són excel·lents perquè s’ajusten a les nostres necessitats en temps real. El núvol juga un paper clau en ser un catalitzador de la innovació.

En properes entrades del bloc, us explicarem més detalladament com funciona aquesta arquitectura i cadascuna de les seves peces i us donarem consells perquè li traieu el màxim partit.

Si estàs interessat a conèixer més sobre les darreres tendències en anàlisi de dades o si t’agradaria provar la tecnologia Data Lakehouse amb un cas pràctic, no dubtis a posar-te en contacte amb nosaltres

Últims posts publicats al Blog d'ABAST

Com modernitzar la teva arquitectura de Business Intelligence amb Data Lakehouse

Data Warehouse, Data Lake, Data Lakehouse… Avui dia els nostres diccionaris evolucionen d'una manera vertiginosa i moltes vegades no tenim temps per entendre els nous…
Leer más

IA i Ciberseguretat: avantatges i amenaces

La Intel·ligència Artificial (IA) i la ciberseguretat han esdevingut protagonistes en el panorama digital actual i en aquest article explorem com la IA està transformant…
Leer más

Tecnologia de contenidors. Implementació i conceptes bàsics.

Hem passat de veure els contenidors com una tecnologia nova a tenir molt clar que ja són una realitat. És un nou enfocament que probablement…
Leer más

Registration

Forgotten Password?