ICT-Projectmanagement in de praktijk
- formation par Syntra Antwerpen & Vlaams-Brabant
- Malines, Anvers & Port d'Anvers, Louvain
Data-analisten zijn enorm gewild op de arbeidsmarkt. Veel organisaties hebben moeite om goed opgeleide data- en BI-analisten te vinden, terwijl de vraag naar data-experts blijft groeien - zeker met de opkomst van AI en machine learning.
Naast kernvaardigheden zoals statistiek, data blending en datavisualisatie, wordt van een moderne data analist ook verwacht dat hij of zij sterk is in communicatie, BI-organisatie, data governance en het opstellen van overtuigende businesscases. Daarnaast spelen consultancyvaardigheden een belangrijke rol bij het vertalen van data-inzichten naar strategische beslissingen.
Deze 10-daagse opleiding tot data-analist is bedoeld voor iedereen zich wil verdiepen in data-analyse, de theorie van data-analyse in de dagelijkse praktijk wil brengen en een boost wil geven aan zijn of haar carrière. Je leert niet alleen de theorie van data-analyse, maar past deze ook direct toe in realistische situaties, inclusief AI-gestuurde technieken en machine learning-modellen. Of je nu je carrière een boost wilt geven of je vaardigheden in data-analyse naar een hoger niveau wilt tillen, deze opleiding geeft je de tools en inzichten om impact te maken in het datagedreven tijdperk.
Er wordt veel verwacht van een data-analist. Aan data-analyse 'doen' betekent zoveel meer dan alleen programmeren in R of Python. In deze opleiding volg je de verschillende stappen die worden uitgevoerd in een data analyseproject:
Per onderwerp wordt voor elke fase gekeken naar de verschillende taken die een data analist uitvoert.
De opleiding biedt dé volledige toolbox die je nodig hebt om je rol als data analist met kennis van zaken aan te pakken. Je krijgt de veelgevraagde hard en soft data-analysevaardigheden onder de knie: statistische analyse, datamining (inclusief machine learning), Python, R, datavisualisatie en -presentatie, data preprocessing ... Na deze opleiding kan je vragen vanuit de business correct vertalen naar de juiste dataprobleemstelling en daarna gefundeerde aanbevelingen doen op basis van een data-analyseproces.
Kaderen van de rol van de data analist en stilstaan bij de hard en soft skills die van hem of haar verwacht worden. Op die manier wordt de structuur duidelijk waarop de rest van de opleiding gebaseerd is. Daarna volgt een introductie van de case die tijdens de opleiding als rode draad wordt gebruikt om de onderwerpen praktisch in te vullen. Laatste deel: antwoorden op vragen als: Waar kan je gegevens vinden? Hoe kan je er toegang toe krijgen? Ben je vrij om ze commercieel te gebruiken? Dit is concreet de 1e fase van elk data-analyseproject en wordt als dusdanig onmiddellijk toegepast op de dataset die je doorheen deze opleiding gebruikt.
Trainer: Ann Van Eyken
Vooraleer je te verdiepen in de data zelf, is het noodzakelijk om een sterke theoretische basis te hebben. Enkel zo kan je je kansen op succes, en daarbij de kwaliteit van de resultaten, maximaliseren. Een essentieel theoretisch element is het belang van en de mogelijke soorten databases.
Trainer: Ann Van Eyken
In dit gedeelte maak je kennis met de complexiteit van de big data-wereld en de manier waarop we ermee omgaan. Je bestudeert het ontwerp van de relationele database die nodig is voor de case en bekijkt enkele alternatieve NoSQL-indelingen om een deel van de informatie op te slaan. Tot slot vergelijk je de verschillende alternatieven.
Trainer: Ann Van Eyken
In dit gedeelte leer je hoe je van een vervuilde en onvolledige dataset een schone dataset maakt die klaar is voor analyse. Je leert over opschonen, integreren, transformeren, reduceren en discretiseren van onbewerkte gegevens, zowel in theorie als in de praktijk.
Gedurende deze dag gebruik je voornamelijk de tool OpenRefine om de ruwe data van de case voor te bereiden.
Trainer: Ann Van Eyken
In dit gedeelte leer je waarom BI waardevol is, wie je nodig hebt in je team en waar je moet beginnen. Je praat over data warehousing en dimensioneel modelleren en waarom het zo belangrijk is.
Ten slotte ontwerp je een dimensionaal model voor de case en extraheer, laad en transformeer je de gegevens die je tot nu toe hebt gevonden en verwerk je deze in een datawarehouse.
Trainer: Ann Van Eyken
R verwijst naar een open-sourceprogrammeertaal en softwareomgeving en is zeer relevant in de context van datamining en statistiek.
Je geraakt op weg met R, de basisbeginselen en ziet een aantal geavanceerde functies. Je gebruikt R om enkele modellen voor de dataset in de case te bouwen en probeert ook een aantal voorspellingen te doen.
Trainer: Ann Van Eyken
Een gefundeerde beslissing maken over welke tests kunnen leiden tot nuttige en relevante resultaten, is heel belangrijk. Daarbij mag statistiek niet ontbreken. Door een dag de tijd te nemen om de onderdelen te bespreken die bepalen hoe statistische principes leiden tot specifieke soorten tests, kan je als data analist op een gefundeerde manier keuzes maken als je naar de effectieve implementatie van je analyse overgaat.
Trainer: Marie Bauwens
EDA of Exploratory Data Analysis is de fase waarin je voor het eerst de data onder de loep neemt vanuit een descriptief standpunt. De essentie van deze stap is om de eigenschappen van de dataset te begrijpen en zo de verdere analyse een meer geschikte vorm te geven. In dit onderdeel combineer je R, dat op dag 5 aan bod komt, met de theoretische benadering in de voormiddag en pas je het toe op de case.
Datamining is het proces waarbij patronen in datasets worden herkend, vaak met behulp van AI en machine learning. In dit gedeelte onderzoek je verschillende soorten patronen en leer je o.a. hoe je AI-gestuurde modellen kunt inzetten om businessvragen te beantwoorden. Bijvoorbeeld: het identificeren van verschillende klantsegmenten met machine learning-clustering, het voorspellen van klantverloop (churn) met geavanceerde AI-algoritmes of het ontdekken van terugkerende patronen in koopgedrag. Je maakt gebruik van een tool om enkele relevante machine learning-algoritmes toe te passen en waardevolle inzichten uit data te halen.
Trainer: Ann Van Eyken
Trainer: Ann Van Eyken
Python is een open-sourceprogrammeertaal waarbij simpliciteit en leesbaarheid van de code centraal staan. Daarnaast bestaat er een heel gamma aan packages die specifiek zijn toegespitst op data analyse. Om die reden is Python onmisbaar in de toolkit van elke data analist.
Gedurende de dag maak je kennis met de basisbeginselen van programmeren in Python, maar ook met de meest gebruikte packages voor data analyse en machine learning.
Trainer: Ann Van Eyken
Als je het punt bereikt waar je de gevormde inzichten kan communiceren naar de klant, moet je beslissen welke visualisaties hiervoor het meest geschikt zijn. Niet elke grafieksoort of infographic draagt dezelfde boodschap. Het kan daarom schadelijk zijn om in de laatste fases toch nog de verkeerde keuzes te maken, ondanks alle moeite die ervoor in het project werd gestopt. De essentie van elk project blijft namelijk dat je de klant moeten kunnen overtuigen om de inzichten om te zetten naar actie. In het eerste onderdeel van deze voormiddag krijg je vanuit de theorie een overzicht van de belangrijkste visualisaties en hun eigenschappen.
Dat wordt opnieuw praktisch ingevuld door de case om te zetten naar een Power BI-dashboard. In het tweede onderdeel van de voormiddag bespreek je de werking van Power BI en hoe het kan worden gebruikt om inzichten weer te geven op een overzichtelijke manier.
Trainer: Olivier Drybooms
In de namiddag gaat het verder over visualisaties, maar dan in Python. Ook hier onderzoek je de manieren waarmee je data en bevindingen kan voorstellen met allerhande grafieken. Je leert hoe je de meest gebruikte grafieken kan tekenen in Python en hoe je ze in een mooi overzicht toont aan de klant via Jupyter Notebooks in samenwerking met de visualisatiepackage matplotlib.
Trainer: Ann Van Eyken
Olivier Drybooms