ETL Fundamentals met Databricks
Met deze 3 daagse training leer je de basis van ETL en om te kunnen werken binnen een unified data analytics platform als Databricks.
Voor wie is deze training
Deze training is ideaal voor professionals die de basis van ETL willen begrijpen en deze kennis willen toepassen met behulp van Databricks, dat de kracht van data lakes en data warehouses combineert in een “Lakehouse architectuur”. Deze training is geschikt voor:
- Data professionals: Data-analisten, database beheerders, en BI-specialisten die betrokken zijn bij data-integratie, data warehousing, en data management.
- IT-professionals: Systeembeheerders en softwareontwikkelaars die ETL-processen willen begrijpen
- Projectmanagers en consultants in data en analytics: Die verantwoordelijk zijn voor het leiden van data-integratieprojecten en die de operationele efficiëntie van deze projecten willen verbeteren.
Inhoud Training
Deze training is gericht op het onderwijzen van de fundamentele principes van Extract, Transform, Load (ETL) processen, met speciale nadruk op de implementatie van deze principes via het Databricks platform. De cursus biedt deelnemers een diepgaand inzicht in het opzetten en beheren van ETL-taken, het bouwen van data pipelines, en het optimaliseren van data-integratie en -transformatieprojecten met behulp van Databricks. Deelnemers leren de basisfunctionaliteiten en geavanceerde features van Databricks kennen. De training omvat praktische oefeningen om de opgedane kennis toe te passen in het bouwen van robuuste data-oplossingen, met continue begeleiding en feedback van ervaren instructeurs.
Belangrijkste onderwerpen die worden behandeld:
- Wat is Databricks en Apache Spark (MPP): Deelnemers leren over de basisprincipes van Databricks en hoe de Massively Parallel Processing (MPP) engine van Apache Spark zorgt voor snelle en efficiënte dataverwerking door taken op te splitsen en tegelijkertijd te verwerken.
- Werken met de Databricks workspace: Dit omvat het opzetten van Git-repositories, het configureren van clusters en het gebruiken van notebooks voor interactieve data-analyse.
- ETL-stromen creëren met (Py)Spark: De training behandelt het bouwen van end-to-end data pipelines en het reinigen en verbeteren van data met behulp van PySpark-functies.
- Medallion Architectuur: Deelnemers krijgen inzicht in dit data-ontwerppatroon voor het logisch organiseren van data in een lakehouse, met als doel de datakwaliteit stapsgewijs te verbeteren.
- Delta Lake: Deze open-source opslaglaag brengt betrouwbaarheid naar data lakes met ACID-transacties, schaalbare metadataverwerking en ondersteuning voor zowel batch- als streamingdata.
- Unity Catalog: De training behandelt unified governance voor gecentraliseerde toegangscontrole, auditing, lineage en data discovery binnen Databricks workspaces.
- Monitoring en praktijkoefeningen: De cursus omvat praktische oefeningen voor het opzetten en uitvoeren van pipelines en het gebruik van monitoringtools.
Aanvangsniveau
Deze training wordt gegeven op HBO werk en denkniveau. Voor deze training is geen specifieke vooropleiding nodig. Het volgen van de SQL fundamentals training en Dimensioneel modelleren training is een pré voor het volgen van deze training.
Studiematerialen
Tijdens de training worden u alle benodigde ICT middelen en handouts ter beschikking gesteld om de training te volgen.
Niveau training
Minimaal HBO denk- en werkniveau
Studiebelasting
De studiebelasting beperkt zicht tot de tijd van de training, 8 uur per trainingsdag. Buiten de trainingsdagen heeft u geen voorbereidingstijd.
Te behalen kwalificaties en vrijstellingen
Na deelname aan deze training ontvang je een certificaat van deelname. Er wordt niet opgeleid voor een af te nemen examen of voor het behalen van een (internationaal) erkend diploma. Met het voltooien van deze cursus ontvang je geen vrijstelling voor andere trainingen/opleidingen.
Locatie
Van Nelleweg 1714
3044 BC Rotterdam
KVL kantoor op de 7e verdieping, ingang 2
Datum training
11, 12 en 13 november. Vul het formulier hieronder in om een offerte op te vragen of om je aan te melden.
In-house training of maatwerk behoeften?
Laat ons weten wat jouw wensen zijn. Wij geven graag invullen aan jouw ontwikkelbehoeften of die van jouw collega’s. Neem hieronder contact met ons op.
Neem, geheel vrijblijvend, contact op!
Of contacteer direct een van onze experts
Piet van Duijn
Operations Manager
kvlhelpt@kvl.nl