Opleiding Mind Mapping®
- formation par NCOI Learning
- Louvain, Hasselt, Gand
Maak kennis met Spark, het ideale framework voor data-analyse in de cloud, tijdens deze tweedaagse ABIS-opleiding!
Iedereen is tegenwoordig aan de slag met AI, Data Science, en "big data". Ook u wil ongetwijfeld uw volumineuze databronnen (click streams, sociale media, relationele data, cloud-data, sensor-data, ...) ondervragen, en botst hierbij op de tekortkomingen van de traditionele data-analyse-tools. Dan hebt u misschien behoefte aan de rekenkracht van een cluster --en z'n parallelle verwerkingsmogelijkheden-- om uw distributed data stores te ondervragen.
Indien "fast prototyping" en verwerkingssnelheid prioritair zijn, dan komt u ongetwijfeld bij Spark terecht. Apache Spark is een open source-platform dat zich vooral toespitst op snelheid, gebruiksgemak, flexibiliteit, en analytics. Het is een interessant alternatief voor de MapReduce-aanpak van Hadoop met Hive (cf. onze cursus Big data in de praktijk met Hadoop). Spark heeft ondertussen Hadoop aangevuld, en eigenlijk vervangen, dankzij het hogere niveau van abstractie van Spark's APIs en z'n snellere in-memory processing.
In het bijzonder laat Spark toe om op een eenvoudige manier databronnen te raadplegen op HDFS, in een NoSQL-database (b.v. Cassandra of HBase), in een relationele database, in de cloud (b.v. AWS S3) of in lokale bestanden. Onafhankelijk daarvan kan een Spark-job eenvoudig draaien op hetzij de lokale machine (als ontwikkelomgeving), of op een Hadoop-cluster (met Yarn), of een Mesos-omgeving, of Kubernetes, of in de cloud. En dit alles via een eenvoudig Spark script of via een complexer (Java- of Python-)programma of via een web-based notebook (b.v. Zeppelin of Databricks).
Deze cursus bouwt verder op de context van de overzichtscursus Big data architectuur en infrastructuur.
Klassikale training, waarbij de nadruk ligt op praktische voorbeelden en uitgebreide praktijkoefeningen.
Een interactieve, live training – gegeven in een fysiek klaslokaal of online, of in een hybride vorm. De cursus kan gegeven worden in het Nederlands, Engels of Frans.
Vertrouwdheid met de concepten van data clusters en distributed processing is noodzakelijk; zie hiervoor onze cursus Big data architectuur en infrastructuur. Verder is minimale kennis van SQL en van Linux een pluspunt. In elk geval is minimale ervaring met een programmeertaal (b.v. Java, Python, Scala, Perl, JavaScript, PHP, C++, C#, ...) noodzakelijk.
Eenieder die praktisch aan de slag wil met Spark: ontwikkelaars, data-architecten, en iedereen die met data science technologie moet kunnen werken.