Tous les Articles

Intelligence Artificielle Mar 24, 2026 20 min de lecture

Un guide pratique pour packager un projet Python autour d'un jeu de cartes

Un tour d'horizon pratique du packaging Python : organisation du projet, pyproject.toml, publication sur PyPI, tests avec pytest, documentation avec Sphinx et CI/CD avec GitHub...

#devops #python

Lire la suite →

Intelligence Artificielle Mar 01, 2026 22 min de lecture

Les Text Embeddings en pratique : construire un système de recommandation de contenu en cold-start

Un tour d'horizon pratique des text embeddings, des fondamentaux à la mise en production — sélection de modèles, stockage vectoriel, métriques de similarité et validation,...

#nlp #llm

Lire la suite →

Intelligence Artificielle Feb 16, 2026 13 min de lecture

Reconstruire mon blog avec le Vibe Coding : Expérience et réflexions

J'ai passé un week-end à reconstruire mon blog Jekyll en utilisant Claude Code et le vibe coding. Le résultat ? Un site web fonctionnel en...

#workflow #llm

Lire la suite →

Intelligence Artificielle Sep 06, 2025 17 min de lecture

Pourquoi 95% des projets d'IA 'échouent' — et comment y remédier

Démystifier le mythe de l'échec de l'IA en analysant le rapport du MIT, en discutant de la mesure du ROI, des défis d'intégration et de...

#thoughts

Lire la suite →

Data Engineering & Analyse Aug 23, 2025 14 min de lecture

Mon manuel Databricks

Après des années de construction de plateformes ML internes, nous avons migré vers Databricks en décembre 2024. Ce manuel partage des astuces et conseils pratiques...

#dataops #mlops

Lire la suite →

Intelligence Artificielle Jun 01, 2025 14 min de lecture

Analyser du HTML avec des LLM : Une quête arthurienne

Construire un dataset d'une émission TV française en utilisant des LLM pour l'analyse HTML, comparer le prompting zero-shot et few-shot, et explorer le fine-tuning pour...

#nlp #llm #dataset

Lire la suite →

Carrière Feb 13, 2025 43 min de lecture

Mon parcours d'une décennie dans les données et l'IA

Réflexions sur une décennie en data science et IA, couvrant les tendances technologiques, les changements organisationnels, la gestion de projet et les leçons apprises à...

#thoughts

Lire la suite →

Carrière Nov 25, 2024 22 min de lecture

Retour de Recsys 2024

Points clés de RecSys 2024 incluant les avancées en factorisation matricielle, l'intégration des LLM, et les dernières recherches de Netflix, Spotify et GroupLens.

#conference

Lire la suite →

Systèmes de Recommandation Aug 11, 2024 22 min de lecture

Comment la factorisation matricielle transforme les retours utilisateurs

Un aperçu complet des techniques de factorisation matricielle pour les systèmes de recommandation, de SVD aux approches de deep learning, avec des conseils d'implémentation pratiques....

#algorithm #mlops #dataops

Lire la suite →

Systèmes de Recommandation Jun 23, 2024 11 min de lecture

Former un maître du jeu Suika : Créer le terrain de jeu

Construire un terrain de jeu d'apprentissage automatique pour le jeu Suika en utilisant la simulation physique, créer des agents de base et configurer un cadre...

#video-game #reinforcement-learning

Lire la suite →

Systèmes de Recommandation Apr 07, 2024 26 min de lecture

Fonctionnalités et principes de conception d'un système de recommandation

Un guide complet pour concevoir des systèmes de recommandation en 2024, couvrant les fonctionnalités principales, les principes de conception et les stratégies d'implémentation pratiques.

#system-design #algorithm

Lire la suite →

Carrière Feb 24, 2024 12 min de lecture

Étape du Meetup : Naviguer ma première année en tant qu'organisateur

Cela fait maintenant 1 an que j'ai commencé à m'impliquer dans l'organisation de deux groupes de meetup à MTL avec Pydata MTL et MLOps Community...

#thoughts

Lire la suite →

Intelligence Artificielle Jan 31, 2024 19 min de lecture

Explorer la transcription de podcasts français avec OpenAI Whisper

Expérimenter avec Whisper d'OpenAI pour transcrire des podcasts français, comparer différentes stratégies de déploiement, et évaluer les coûts et performances.

#algorithm #audio

Lire la suite →

Intelligence Artificielle Jan 06, 2024 15 min de lecture

Data scientist & Machine learning engineer : Décoder les rôles

Explorer les rôles des data scientists et des machine learning engineers, leurs différences, et comment ils se complètent dans les projets ML modernes.

#thoughts #conference

Lire la suite →

Carrière Dec 03, 2023 18 min de lecture

Retour de la conférence Apply(ops) 23

Points clés de la conférence Apply(ops) 23 avec des insights d'Uber, Lidl, Hello Fresh et Pinterest sur les plateformes MLOps, les stratégies multi-cloud et le...

#conference

Lire la suite →

Carrière Nov 13, 2023 22 min de lecture

Retour de Recsys 2023

Récapitulatif complet de RecSys 2023 couvrant les pratiques de l'industrie, la recherche sur la reproductibilité, les nouveaux ensembles de données, les transformers dans les recommandations...

#conference

Lire la suite →

Systèmes de Recommandation Aug 19, 2023 10 min de lecture

Fallbacks et règles de service - Les piliers sous-estimés du succès des systèmes de recommandation

Explorez les stratégies de fallback et les règles de service dans les systèmes de recommandation. Découvrez comment ces piliers sous-estimés garantissent des prédictions fiables dans...

#system-design

Lire la suite →

Intelligence Artificielle Mar 05, 2023 24 min de lecture

Cinq ans de préparation, mon parcours MLOps dans l'industrie du jeu vidéo

Cinq ans de parcours MLOps chez Ubisoft construisant des plateformes ML pour les jeux vidéo. Aperçus sur les défis, outils, flux de travail et leçons...

#thoughts

Lire la suite →

Systèmes de Recommandation Jan 15, 2023 14 min de lecture

Plus de démarrage à froid : utiliser les transformers pour construire des decks dans Marvel Snap

Abordez le problème du démarrage à froid dans les systèmes de recommandation avec les transformers. Construisez un système de recommandation de decks Marvel Snap gérant...

#algorithm #video-game #nlp

Lire la suite →

Systèmes de Recommandation Dec 29, 2022 15 min de lecture

Mettre le Machine Learning en production chez Ubisoft (PydataMTL June22)

Explorez la mise en production du machine learning de la R&D chez Ubisoft. Apprenez à créer une plateforme ML pour soutenir les data scientists dans...

#conference

Lire la suite →

Carrière Dec 27, 2022 14 min de lecture

Naviguer dans Unity en tant que praticien ML: Un parcours personnel

L'article suivant se concentrera sur mes premières expériences en tant que praticien ML dans Unity, un moteur de jeu populaire. Tout d'abord, nous commencerons par...

#video-game #experiment

Lire la suite →

Carrière Sep 29, 2022 19 min de lecture

Retour de Recsys 2022

Bonjour, c'est l'automne et qui dit automne dit période Recsys, et cette année Seattle était l'endroit où il fallait être. J'ai assisté numériquement à la...

#conference

Lire la suite →

Data Engineering & Analyse Sep 23, 2022 13 min de lecture

Déployez votre pipeline de données avec Docker et AWS ECS

J'ai récemment décidé d'expérimenter avec des conteneurs Docker pour construire des applications autonomes afin d'optimiser le flux d'opération de mes différents pipelines de données/scraper. J'ai...

#devops #dataops

Lire la suite →

Intelligence Artificielle Apr 28, 2022 12 min de lecture

Concevez et versionnez votre workflow ML avec DVC (compétition Kaggle)

Depuis quelques mois, je voulais tester DVC, un toolkit autour du versioning pour les projets ML construit par iterative. Je l'ai essayé un peu chez...

#mlops #dataops

Lire la suite →

Systèmes de Recommandation Mar 14, 2022 14 min de lecture

Filtrage collaboratif et système de recommandation à deux étapes avec Surprise

Explorez Surprise, un package Python scikit pour construire des systèmes de recommandation sur des notes explicites. Apprenez le filtrage collaboratif et les implémentations de recommandation...

#algorithm

Lire la suite →

Data Engineering & Analyse Jan 28, 2022 10 min de lecture

Démarrez votre projet de séries temporelles (analyse, prévision et détection d'anomalies) avec Kats

Récemment, j'ai entendu parler d'un package développé par Facebook research (META research !?) appelé KATS, publié par l'équipe Infrastructure Data Science de Facebook fin de...

#forecasting

Lire la suite →

Data Engineering & Analyse Nov 27, 2021 13 min de lecture

Déployer un pipeline pour collecter des données sur Twitter et Google trends

Bonjour, dans cet article, je vais vous faire un rapide tour d'un projet que j'ai récemment ressuscité pour collecter les données en ligne de l'élection...

#nlp #dataset #dataops

Lire la suite →

Intelligence Artificielle Nov 01, 2021 15 min de lecture

Construire un prédicteur de pression de ventilateur pour Google Brain

Je voulais depuis longtemps participer sérieusement à une compétition Kaggle (je pense avoir fait quelques tests il y a quelques années mais rien de sérieux);...

#competition

Lire la suite →

Carrière Oct 01, 2021 18 min de lecture

Points clés de RecSys 2021

Encore une fois, j'ai assisté (virtuellement) cette année avec certains de mes collègues à RecSys 2021 à Amsterdam. Dans cet article, je vais récapituler les...

#conference

Lire la suite →

Intelligence Artificielle Sep 25, 2021 11 min de lecture

Construire un classifieur d'images avec fastai

J'ai récemment commencé à prototyper un classifieur d'images au travail, et ce travail m'a conduit au package fastai que j'avais dans mon backlog de bibliothèques...

#webscraping

Lire la suite →

Systèmes de Recommandation Sep 01, 2021 16 min de lecture

Évaluation des systèmes de recommandation (métriques et modèles de base)

Je me suis concentré sur ce sujet pendant les trois dernières années chez Ubisoft, mais je n'ai jamais trouvé de jeux de données appropriés à...

#algorithm #mlops

Lire la suite →

Intelligence Artificielle Jun 27, 2021 17 min de lecture

Optimisez votre workflow de machine learning avec weights and biases, mljar automl, hyperopt, shapash et evidently

Je voulais écrire depuis quelques semaines sur des bibliothèques ml/ds que j'ai dans mon backlog de choses à essayer. Un article par bibliothèque était peut-être...

#mlops #workflow

Lire la suite →

Data Engineering & Analyse Apr 05, 2021 14 min de lecture

Lancer un projet big data avec AWS EMR et Pyspark

Bonjour lecteurs, je voulais depuis longtemps écrire un article sur un service AWS que j'utilise dans mon travail quotidien appelé EMR. Ce service permet de...

#dataset #dataops #video-game

Lire la suite →

Carrière Nov 12, 2020 12 min de lecture

Retours et découvertes sur RecSys 2020

Dans cet article, il y aura une description de la conférence Recsys qui s'est déroulée en septembre 2020 virtuellement (Merci Ubisoft de m'avoir offert la...

#conference

Lire la suite →

Intelligence Artificielle Oct 24, 2020 14 min de lecture

Être plus productif et autonome pour produire des applications ML avec AWS Sagemaker

Dans cet article, il y aura un aperçu du service AWS Sagemaker. L'idée sera de voir de mon point de vue DS comment le service...

#dataops #mlops #workflow

Lire la suite →

Data Engineering & Analyse Sep 09, 2020 8 min de lecture

Prévision de séries temporelles et analyse causale en R avec Facebook Prophet et Google CausalImpact

Cet article fera partie de ma plongée annuelle en R ; l'idée sera d'utiliser deux bibliothèques R en prévision de séries temporelles et inférence causale....

#dataset #forecasting

Lire la suite →

Systèmes de Recommandation May 12, 2020 11 min de lecture

Initiation aux bases de données graphe avec neo4j et Beat Saber

Dans cet article, il y aura une introduction à la base de données graphe Neo4j, exploiter la technologie à des fins d'analyse et de recommandation....

#algorithm #workflow #video-game

Lire la suite →

Intelligence Artificielle Apr 14, 2020 10 min de lecture

Introduction de TensorFlow 2.0

Dans cet article, je vais présenter certaines de mes découvertes sur mon exploration de TensorFlow, l'idée sera avec TensorFlow de construire et surveiller des modèles...

#mlops #workflow

Lire la suite →

Systèmes de Recommandation Feb 09, 2020 12 min de lecture

Récupération d'informations musicales avec LibROSA et Beat Saber

Dans cet article, je vais illustrer certains des travaux autour de l'information musicale sur lesquels je travaille depuis les dernières semaines appliqués à un jeu...

#audio #video-game

Lire la suite →

Intelligence Artificielle Jan 25, 2020 12 min de lecture

Être plus efficace pour produire des pipelines machine learning avec Metaflow

Pour cet article, je vais décrire mon expérience pratique sur une nouvelle bibliothèque qui a été récemment open-sourcée par Netflix pour opérer et versionner des...

#mlops #workflow

Lire la suite →

Data Engineering & Analyse Jan 18, 2020 11 min de lecture

Comment construire un jeu de données pour un classificateur d'images à partir de zéro (lié aux voitures)

Dans cet article, je vais présenter un pipeline que j'ai construit il y a quelques semaines pour collecter des données (texte et images) du site...

#webscraping

Lire la suite →

Data Engineering & Analyse Jan 15, 2020 9 min de lecture

Plongée dans HearthStone d'un point de vue data

Bonjour, dans cet article, je vais détailler un jeu de données que j'ai construit il y a quelques semaines sur le jeu Hearthstone.

#dataset #analysis #video-game

Lire la suite →

Intelligence Artificielle Nov 13, 2019 12 min de lecture

Être plus efficace pour produire des modèles de machine learning avec mlflow

La version utilisée pour cet article est mlflow 1.4.0

#mlops #workflow

Lire la suite →

Intelligence Artificielle Oct 04, 2019 6 min de lecture

Crossfit Games - Rétrospective de l'Open 2019

Bonjour, la saison de l'Open commence à nouveau cette année (encore une fois !?) donc j'écris cet article pour:

#dataset #sport

Lire la suite →

Intelligence Artificielle Aug 14, 2019 8 min de lecture

Doctor Who - Aperçu de NLTK

- présenter un dataset que j'ai construit au cours des dernières semaines

#nlp #dataset

Lire la suite →

Data Engineering & Analyse Jul 17, 2019 9 min de lecture

PUBG - Faire des analyses avec AWS et plotly

Pour cet article, je vais commencer l'analyse des données extraites avec le pipeline expliqué dans cet article. L'objectif de cet article est de:

#video-game #analysis

Lire la suite →

Intelligence Artificielle Mar 23, 2019 11 min de lecture

Analyse des certificats de performance énergétique avec Dataiku DSS

Depuis que j'ai publié l'article sur les compteurs intelligents de Londres et les analyses possibles des données, je reçois régulièrement des messages de personnes intéressées...

#workflow #energy #analysis

Lire la suite →

Data Engineering & Analyse Feb 01, 2019 9 min de lecture

Construire un pipeline de données sur AWS

J'ai démarré ce projet en écho à la compétition Kaggle liée à PUBG, où l'objectif était de prédire le classement du joueur dans la partie,...

#dataops #workflow

Lire la suite →

Data Engineering & Analyse Mar 30, 2018 13 min de lecture

Web scraping et analyse des données des Opens de Crossfit

Apprenez à créer un système de web scraping pour collecter et analyser les données du Crossfit Open, incluant les profils d'athlètes, les informations sur les...

#dataset #sport #webscraping

Lire la suite →

Data Engineering & Analyse Feb 26, 2018 13 min de lecture

Construire un tableau de bord avec Dash (plotly), AWS et Heroku

Apprenez à créer un tableau de bord interactif en utilisant Dash (Plotly) pour visualiser des données personnelles de fitness et de santé provenant d'appareils Nokia,...

#dataops

Lire la suite →

Data Engineering & Analyse Jan 18, 2018 9 min de lecture

Analyse des données de compteurs intelligents à Londres (Royaume-Uni)

Bonjour, l'objectif de cet article est d'offrir une description claire de l'ensemble de données que j'ai téléchargé en novembre 2017 sur Kaggle, suivi de quelques...

#energy #dataset #forecasting

Lire la suite →

Data Engineering & Analyse Nov 15, 2017 8 min de lecture

Créer un système de prévision de la consommation énergétique nationale française

Bonjour lecteurs, pour cet article je vais expliquer mon approche pour créer un système de prévision de la consommation énergétique française (métropolitaine). Ce type de...

#energy #dataset #forecasting

Lire la suite →

Data Engineering & Analyse Sep 15, 2017 7 min de lecture

Comment déployer un bot Messenger en Python

Bonjour lecteur, dans cet article je vais expliquer mon approche pour déployer un chatbot en Python sur la plateforme Messenger.

#workflow #experiment

Lire la suite →

Carrière Aug 04, 2017 1 min de lecture

Bonjour le monde

Bienvenue sur mon blog où je partage des projets et des idées de mon travail en tant que data scientist chez EDF Energy en Angleterre,...

Lire la suite →