← Tous les projets
02 · Data Eng · ML

BooksData - Pipeline Big Data livres

Pipeline de données complet sur un catalogue de livres : ingestion, nettoyage, analyse statistique et modèle de prédiction des notes. Les résultats sont exposés via une API REST et un tableau de bord interactif.

IngestionNettoyageAnalyseFastAPIStreamlitML
FastAPI · Streamlit · MongoDB · MLVoir le code ↗
Architecture du pipeline BooksData
FIG. 01Architecture du pipeline BooksDataDe l'ingestion du catalogue au modèle de prédiction des notes, exposés via une API REST et un tableau de bord.
Dashboard interactif (Streamlit)
FIG. 02Dashboard interactif (Streamlit)Exploration des statistiques du catalogue et des prédictions dans une interface Streamlit.
WordCloud des titres de livres
FIG. 03WordCloud des titres de livresAnalyse textuelle des titres pour faire ressortir les thèmes dominants.