Reconstruire mon blog avec le Vibe Coding : Expérience et réflexions
J'ai passé un week-end à reconstruire mon blog Jekyll en utilisant Claude Code et le vibe coding. Le résultat ? Un site web fonctionnel en...
Lire la suite →Explorez tous les articles sur la data science, le machine learning et l'IA
J'ai passé un week-end à reconstruire mon blog Jekyll en utilisant Claude Code et le vibe coding. Le résultat ? Un site web fonctionnel en...
Lire la suite →
Démystifier le mythe de l'échec de l'IA en analysant le rapport du MIT, en discutant de la mesure du ROI, des défis d'intégration et de...
Lire la suite →
Après des années de construction de plateformes ML internes, nous avons migré vers Databricks en décembre 2024. Ce manuel partage des astuces et conseils pratiques...
Lire la suite →
Construire un dataset d'une émission TV française en utilisant des LLM pour l'analyse HTML, comparer le prompting zero-shot et few-shot, et explorer le fine-tuning pour...
Lire la suite →
Réflexions sur une décennie en data science et IA, couvrant les tendances technologiques, les changements organisationnels, la gestion de projet et les leçons apprises à ...
Lire la suite →
Points clés de RecSys 2024 incluant les avancées en factorisation matricielle, l'intégration des LLM, et les dernières recherches de Netflix, Spotify et GroupLens.
Lire la suite →
Un aperçu complet des techniques de factorisation matricielle pour les systèmes de recommandation, de SVD aux approches de deep learning, avec des conseils d'implémentation pratiques....
Lire la suite →
Construire un terrain de jeu d'apprentissage automatique pour le jeu Suika en utilisant la simulation physique, créer des agents de base et configurer un cadre...
Lire la suite →
Un guide complet pour concevoir des systèmes de recommandation en 2024, couvrant les fonctionnalités principales, les principes de conception et les stratégies d'implémentation pratiques.
Lire la suite →
Cela fait maintenant 1 an que j'ai commencé à m'impliquer dans l'organisation de deux groupes de meetup à MTL avec Pydata MTL et MLOps Community...
Lire la suite →
Expérimenter avec Whisper d'OpenAI pour transcrire des podcasts français, comparer différentes stratégies de déploiement, et évaluer les coûts et performances.
Lire la suite →
Explorer les rôles des data scientists et des machine learning engineers, leurs différences, et comment ils se complètent dans les projets ML modernes.
Lire la suite →
Points clés de la conférence Apply(ops) 23 avec des insights d'Uber, Lidl, Hello Fresh et Pinterest sur les plateformes MLOps, les stratégies multi-cloud et le...
Lire la suite →
Récapitulatif complet de RecSys 2023 couvrant les pratiques de l'industrie, la recherche sur la reproductibilité, les nouveaux ensembles de données, les transformers dans les recommandations...
Lire la suite →
Explorez les stratégies de fallback et les règles de service dans les systèmes de recommandation. Découvrez comment ces piliers sous-estimés garantissent des prédictions fiables dans...
Lire la suite →
Cinq ans de parcours MLOps chez Ubisoft construisant des plateformes ML pour les jeux vidéo. Aperçus sur les défis, outils, flux de travail et leçons...
Lire la suite →
Abordez le problème du démarrage à froid dans les systèmes de recommandation avec les transformers. Construisez un système de recommandation de decks Marvel Snap gérant...
Lire la suite →
Explorez la mise en production du machine learning de la R&D chez Ubisoft. Apprenez à créer une plateforme ML pour soutenir les data scientists dans...
Lire la suite →
L'article suivant se concentrera sur mes premières expériences en tant que praticien ML dans Unity, un moteur de jeu populaire. Tout d'abord, nous commencerons par...
Lire la suite →
Bonjour, c'est l'automne et qui dit automne dit période Recsys, et cette année Seattle était l'endroit où il fallait être. J'ai assisté numériquement à la...
Lire la suite →
J'ai récemment décidé d'expérimenter avec des conteneurs Docker pour construire des applications autonomes afin d'optimiser le flux d'opération de mes différents pipelines de données/scraper. J'ai...
Lire la suite →
Depuis quelques mois, je voulais tester DVC, un toolkit autour du versioning pour les projets ML construit par iterative. Je l'ai essayé un peu chez...
Lire la suite →
Explorez Surprise, un package Python scikit pour construire des systèmes de recommandation sur des notes explicites. Apprenez le filtrage collaboratif et les implémentations de recommandation...
Lire la suite →
Récemment, j'ai entendu parler d'un package développé par Facebook research (META research !?) appelé KATS, publié par l'équipe Infrastructure Data Science de Facebook fin de...
Lire la suite →
Bonjour, dans cet article, je vais vous faire un rapide tour d'un projet que j'ai récemment ressuscité pour collecter les données en ligne de l'élection...
Lire la suite →
Je voulais depuis longtemps participer sérieusement à une compétition Kaggle (je pense avoir fait quelques tests il y a quelques années mais rien de sérieux);...
Lire la suite →
Encore une fois, j'ai assisté (virtuellement) cette année avec certains de mes collègues à RecSys 2021 à Amsterdam. Dans cet article, je vais récapituler les...
Lire la suite →
J'ai récemment commencé à prototyper un classifieur d'images au travail, et ce travail m'a conduit au package fastai que j'avais dans mon backlog de bibliothèques...
Lire la suite →
Je me suis concentré sur ce sujet pendant les trois dernières années chez Ubisoft, mais je n'ai jamais trouvé de jeux de données appropriés à ...
Lire la suite →
Je voulais écrire depuis quelques semaines sur des bibliothèques ml/ds que j'ai dans mon backlog de choses à essayer. Un article par bibliothèque était peut-être...
Lire la suite →
Bonjour lecteurs, je voulais depuis longtemps écrire un article sur un service AWS que j'utilise dans mon travail quotidien appelé EMR. Ce service permet de...
Lire la suite →
Dans cet article, il y aura une description de la conférence Recsys qui s'est déroulée en septembre 2020 virtuellement (Merci Ubisoft de m'avoir offert la...
Lire la suite →
Dans cet article, il y aura un aperçu du service AWS Sagemaker. L'idée sera de voir de mon point de vue DS comment le service...
Lire la suite →
Cet article fera partie de ma plongée annuelle en R ; l'idée sera d'utiliser deux bibliothèques R en prévision de séries temporelles et inférence causale....
Lire la suite →
Dans cet article, il y aura une introduction à la base de données graphe Neo4j, exploiter la technologie à des fins d'analyse et de recommandation....
Lire la suite →
Dans cet article, je vais présenter certaines de mes découvertes sur mon exploration de TensorFlow, l'idée sera avec TensorFlow de construire et surveiller des modèles...
Lire la suite →
Dans cet article, je vais illustrer certains des travaux autour de l'information musicale sur lesquels je travaille depuis les dernières semaines appliqués à un jeu...
Lire la suite →
Pour cet article, je vais décrire mon expérience pratique sur une nouvelle bibliothèque qui a été récemment open-sourcée par Netflix pour opérer et versionner des...
Lire la suite →
Dans cet article, je vais présenter un pipeline que j'ai construit il y a quelques semaines pour collecter des données (texte et images) du site...
Lire la suite →
Bonjour, dans cet article, je vais détailler un jeu de données que j'ai construit il y a quelques semaines sur le jeu Hearthstone.
Lire la suite →
La version utilisée pour cet article est mlflow 1.4.0
Lire la suite →
Bonjour, la saison de l'Open commence à nouveau cette année (encore une fois !?) donc j'écris cet article pour:
Lire la suite →
- présenter un dataset que j'ai construit au cours des dernières semaines
Lire la suite →
Pour cet article, je vais commencer l'analyse des données extraites avec le pipeline expliqué dans cet article. L'objectif de cet article est de:
Lire la suite →
Depuis que j'ai publié l'article sur les compteurs intelligents de Londres et les analyses possibles des données, je reçois régulièrement des messages de personnes intéressées...
Lire la suite →
J'ai démarré ce projet en écho à la compétition Kaggle liée à PUBG, où l'objectif était de prédire le classement du joueur dans la partie,...
Lire la suite →
Apprenez à créer un système de web scraping pour collecter et analyser les données du Crossfit Open, incluant les profils d'athlètes, les informations sur les...
Lire la suite →
Apprenez à créer un tableau de bord interactif en utilisant Dash (Plotly) pour visualiser des données personnelles de fitness et de santé provenant d'appareils Nokia,...
Lire la suite →
Bonjour, l'objectif de cet article est d'offrir une description claire de l'ensemble de données que j'ai téléchargé en novembre 2017 sur Kaggle, suivi de quelques...
Lire la suite →
Bonjour lecteurs, pour cet article je vais expliquer mon approche pour créer un système de prévision de la consommation énergétique française (métropolitaine). Ce type de...
Lire la suite →
Bonjour lecteur, dans cet article je vais expliquer mon approche pour déployer un chatbot en Python sur la plateforme Messenger.
Lire la suite →
Bienvenue sur mon blog où je partage des projets et des idées de mon travail en tant que data scientist chez EDF Energy en Angleterre,...
Lire la suite →