Leer de basisbeginselen van Apache Spark en ontdek hoe het
bewerkingen op gegevens mogelijk maakt met zowel zijn eigen
bibliotheekmethoden als met SQL.
Daarnaast ga je echte datasets analyseren met behulp van de
DataFrame API-methoden. Je leert hoe je bewerkingen optimaliseert
met behulp van gedeelde variabelen en hoe je gegevens uit meerdere
DataFrames kunt combineren met joins.
Tot slot leer je een Spark DataFrame te analyseren door het te
behandelen alsof het een relationele databasetabel is en leer hoe
je een weergave maakt vanuit een Spark DataFrame. Je leert ook
SQL-query’s uitvoeren en gegevens in Windows kunt definiĆ«ren en
verkennen.
Uw Resultaat:
Je bent bekend met de fundamenten van Apache Spark en hoe je je
data kunt analyseren met behulp van de DataFrame API-methoden.
Voorkennis:
Er is geen specifieke voorkennis benodigd.