Module 1 : Les fondamentaux de la Data Science
- Kit de survie (GitHub, Jupyter Notebook, PyCharm)
- Python pour la Data Science (Pandas, Matplotlib, NumPy, SciPy)
- Fondamentaux mathématiques (algèbre linéaire, statistiques, probabilités)
Module 2 : Data Analysis
- Data analysis et data cleaning (SQL, API)
- Data Visualization (Bokeh, Seaborn, Plotly)
- Data Exploration (exploration des données en Python)
Module 3 : Machine Learning
- Apprentissage supervisé / non supervisé (SVM, kNN, PCA, Random Forest)
- Généralisation des modèles (méthodes de régularisation)
- Natural Language Processing (NLTK, SpaCy)
Module 4 : Data Engineering
- Manipulation d’API
- Mise en production (dockerisation, clusters Kubernetes)
- Cloud (AWS, Google Cloud, monitoring des serveurs)
Module 5 : Big Data Engineering
- Écosystème Hadoop (architecture et cas d’usage)
- Bases de données SQL/NoSQL (MongoDB, ElasticSearch, Neo4J)
- Data Streaming (pipeline de streaming, Kafka)
Module 6 : Deep Learning & IA
- Réseaux de neurones (construction et entraînement)
- Computer Vision (détection et classification d’images)
- Deep Reinforcement Learning et réseaux récurrents (RNN)
Module 7 : Gérer une proposition commerciale
- Techniques de communication écrite et commerciale
- Coaching et développement des soft skills.