Datalake souverain : dbt-duckdb dans k8s un data lakehouse souverain à la main @OrangeB2B !
Speakers
Description
Un an après avoir présenté DuckDB et les Data Contracts au DataDays Lille 2025, Cédric Olivier (Orange) & Antoine Giraud (Ippon) reviennent pour raconter la construction — en conditions réelles — d’un data lakehouse souverain chez Orange B2B, basé sur dbt-duckdb & déployé dans Kubernetes, le tout dans une philosophie DataOps & Data/Infra as code.
Ils partageront les défis concrets rencontrés : - contexte & enjeux métiers (sortir de hadoop) - génération via data contract odcs des artefacts dbt (sources, models, sql, exposures) - industrialisation d’un repo dbt-duckdb (matérialisation external vs ducklake) - packaging et déploiement as code vers Kubernetes (grâce à to be continuous) - orchestration via Airflow par domaine métier
En bonus, mention de - outils Streamlit pour la sécurité et le self‑service
Une conférence sans langue de bois, centrée sur le terrain, les choix d’architecture, les pièges évités et les patterns réutilisables pour bâtir un data platform moderne, souverain et maintenable.