Mon manuel Databricks
Après des années de construction de plateformes ML internes, nous avons migré vers Databricks en décembre 2024. Ce manuel partage des astuces et conseils pratiques...
Lire la suite →Pipelines ETL, traitement de données, infrastructure, analyse, visualisation et découverte d'insights
Après des années de construction de plateformes ML internes, nous avons migré vers Databricks en décembre 2024. Ce manuel partage des astuces et conseils pratiques...
Lire la suite →
J'ai récemment décidé d'expérimenter avec des conteneurs Docker pour construire des applications autonomes afin d'optimiser le flux d'opération de mes différents pipelines de données/scraper. J'ai...
Lire la suite →
Récemment, j'ai entendu parler d'un package développé par Facebook research (META research !?) appelé KATS, publié par l'équipe Infrastructure Data Science de Facebook fin de...
Lire la suite →
Bonjour, dans cet article, je vais vous faire un rapide tour d'un projet que j'ai récemment ressuscité pour collecter les données en ligne de l'élection...
Lire la suite →
Bonjour lecteurs, je voulais depuis longtemps écrire un article sur un service AWS que j'utilise dans mon travail quotidien appelé EMR. Ce service permet de...
Lire la suite →
Cet article fera partie de ma plongée annuelle en R ; l'idée sera d'utiliser deux bibliothèques R en prévision de séries temporelles et inférence causale....
Lire la suite →
Dans cet article, je vais présenter un pipeline que j'ai construit il y a quelques semaines pour collecter des données (texte et images) du site...
Lire la suite →
Bonjour, dans cet article, je vais détailler un jeu de données que j'ai construit il y a quelques semaines sur le jeu Hearthstone.
Lire la suite →
Pour cet article, je vais commencer l'analyse des données extraites avec le pipeline expliqué dans cet article. L'objectif de cet article est de:
Lire la suite →
J'ai démarré ce projet en écho à la compétition Kaggle liée à PUBG, où l'objectif était de prédire le classement du joueur dans la partie,...
Lire la suite →
Apprenez à créer un système de web scraping pour collecter et analyser les données du Crossfit Open, incluant les profils d'athlètes, les informations sur les...
Lire la suite →
Apprenez à créer un tableau de bord interactif en utilisant Dash (Plotly) pour visualiser des données personnelles de fitness et de santé provenant d'appareils Nokia,...
Lire la suite →
Bonjour, l'objectif de cet article est d'offrir une description claire de l'ensemble de données que j'ai téléchargé en novembre 2017 sur Kaggle, suivi de quelques...
Lire la suite →
Bonjour lecteurs, pour cet article je vais expliquer mon approche pour créer un système de prévision de la consommation énergétique française (métropolitaine). Ce type de...
Lire la suite →
Bonjour lecteur, dans cet article je vais expliquer mon approche pour déployer un chatbot en Python sur la plateforme Messenger.
Lire la suite →