Scrum Master
- opleiding door Syntra Antwerpen & Vlaams-Brabant
- Antwerpen & Haven
Pendent cette formation pratique ABIS de 3 jours, vous apprenez analyser des données et construire des modèles IA en utilisant des outils ML avec Python, comme scikit-learn.
l'Intelligence Artificielle (IA, AI) nous promet que, si nous disposons de grandes quantités de données pertinentes (textes, images, détails des ventes, clics sur un site web, etc.), elle peut les utiliser pour construire un modèle. Un modèle est une représentation simplifiée de la réalité qui nous permet de décrire, d'expliquer et même de prédire des phénomènes. En effet, le modèle a détecté des «patterns» récurrents dans les données, ou plus précisément des relations entre les «caractéristiques» (features) des données. Il peut ainsi «deviner» (ou prédire) une caractéristique cible (mot suivant, pixel, pronostic de ventes par produit, tentative d'effraction, etc.) basé sur les autres données: p.ex. générer de nouveaux textes et images, ou déclencher une alarme.
Le processus semi-automatisé d'apprentissage et de mise à disposition des modèles IA est appelé apprentissage automatique (Machine Learning, ML) :
Ce processus s'applique à toutes les disciplines, de la physique et de l'économie au traitement d'images et au langage naturelle.
Des algorithmes de machine learning éprouvés ont été développés au cours des dernières décennies et ont été implémentés dans plusieurs langages.
Aujourd'hui, Python, et plus particulièrement des packages comme scikit-learn et PyTorch, sont des interfaces très populaires et conviviales pour cette vaste collection d'algorithmes disponibles. Les données, quel que soit leur format (fichier), peuvent facilement être chargées dans un Data Frame Python (Pandas), divisées en données d'entraînement et de validation, puis soumises aux processus de construction et d'évaluation de modèles. Python permet également de visualiser facilement un Data Frame.
L'un des modèles d'apprentissage automatique les plus simples et les plus fondamentaux est la régression linéaire. Ce modèle suppose que la relation entre les caractéristiques d'entrée et les caractéristiques cibles peut être exprimée comme une somme pondérée des entrées. Entraîner un modèle de régression linéaire implique de trouver les pondérations qui minimisent l'erreur de prédiction. Bien que souvent trop simpliste en soi, la régression linéaire est essentielle comme élément de base: les modèles plus avancés l'utilisent souvent en interne car sa modélisation est rapide et, de plus, elle évite «overfitting» (surapprentissage) aux données d'entraînement (ce qui rendrait les modèles moins prédictifs sur des données nouvelles et inédites).
Les réseaux de neurones artificiels (neural networks) étendent la logique de la régression linéaire à un cadre beaucoup plus flexible et puissant. Inspirés des neurones biologiques, ces modèles sont constitués de couches de nœuds interconnectés, chacun traitant les entrées via une somme pondérée et une fonction d'activation non linéaire. Des couches cachées transforment les entrées en représentations de plus en plus abstraites, permettant au réseau de capturer des relations complexes et non linéaires. Les réseaux de neurones effectuent ce que l'on appelle deep learning et constituent le fondement d'une grande partie de l'intelligence artificielle moderne.
Les réseaux de neurones peuvent être construits en Python, p.ex. avec le package PyTorch. Leur construction et leur évaluation sont certes plus chronophages et gourmandes en mémoire, mais promettent des résultats remarquablement bons, notamment dans les domaines du traitement d'images (par exemple, données de caméras de surveillance) et du traitement du langage naturel (NLP), grâce aux «large language models» (LLM).
Enseignement en classe, axé sur des exemples pratiques et soutenu par des exercices approfondis et une pratique individuelle.
Formation interactive en temps réel – disponible en personne ou en ligne ou dans un format hybride. La formation peut être effectuée en français, en anglais ou en néerlandais.
Une bonne connaissance du langage de programmation Python est un prérequis (voir Python: cours de base). De l'expérience avec Pandas (voir cours Python pour l'analyse des données) et Jupyter Notebook est un avantage.
Toute personne souhaitant pratiquer Machine Learning pour résoudre des problèmes concrets.