Conexia — Plateforme RAG multi-tenant pour le Pacifique

Contexte

Conexia est une agence basée à Tahiti qui voulait industrialiser une offre de chatbots IA pour ses clients du Pacifique : retail, assurance, services. L’enjeu n’était pas de prouver qu’un LLM peut répondre à une question, c’était de faire tourner un produit multi-tenant, opérable à plusieurs depuis un atoll, avec une latence raisonnable malgré la distance aux datacenters européens.

Trois contraintes structuraient tout : isoler proprement les tenants (chaque client a ses données, ses sources, ses secrets), réduire le coût d’onboarding d’un nouveau client à quelque chose qui se mesure en heures et pas en sprints, et tenir la barre opérationnelle d’une équipe restreinte.

Mon rôle

CTO. J’ai owned la conception end-to-end de la plateforme, les choix d’infra, le code des agents, les pipelines de delivery, l’observabilité, et la définition du contrat d’onboarding client.

Ce que j’ai construit

Agents RAG avec recherche sémantique sur bases vectorielles, routage entre plusieurs LLMs selon le coût et la criticité de la requête
UI conversationnelle riche côté client : composants interactifs, pas un simple flux texte
Pipelines de web scraping parallèles qui alimentent les bases vectorielles à partir des sources métier de chaque tenant
Orchestration de 100+ workflows alimentant les agents (collecte, normalisation, indexation, contrôle qualité, déclencheurs métier)
Connecteurs omnicanaux : web, Gmail, Messenger, le tout abstrait derrière une couche commune
Infra Scaleway : clusters Kubernetes, Terraform pour tout ce qui se déploie, Helm + ArgoCD pour le GitOps, GitLab CI/CD avec isolation stricte des secrets par tenant
Observabilité : Prometheus + Thanos pour le long terme, alerting temps réel sur les SLO critiques
Onboarding client réduit à un seul fichier de configuration : zéro code custom à écrire pour ajouter un tenant, ce qui change le modèle économique de l’agence

Le point dur : faire tenir l’isolation multi-tenant proprement à tous les étages (vector DB, secrets, observabilité, quotas LLM) sans dupliquer la plateforme par client.

Résultats

La plateforme est en production et continue de monter en charge. L’onboarding qui prenait du dev custom passe par un fichier de config, ce qui change la marge brute par client. La supervision tient avec une équipe restreinte grâce au GitOps et au stack d’observabilité.