Conexia — Plateforme RAG multi-tenant pour le Pacifique
J'ai construit la plateforme de chatbots IA multi-tenant qui sert les clients retail, assurance et services de Conexia, depuis Tahiti.
- Kubernetes
- Scaleway
- Terraform
- Helm
- ArgoCD
- GitLab CI/CD
- Prometheus
- Thanos
- RAG
- LLM routing
- Vector DB
- Web scraping
Contexte
Conexia est une agence basée à Tahiti qui voulait industrialiser une offre de chatbots IA pour ses clients du Pacifique : retail, assurance, services. L’enjeu n’était pas de prouver qu’un LLM peut répondre à une question, c’était de faire tourner un produit multi-tenant, opérable à plusieurs depuis un atoll, avec une latence raisonnable malgré la distance aux datacenters européens.
Trois contraintes structuraient tout : isoler proprement les tenants (chaque client a ses données, ses sources, ses secrets), réduire le coût d’onboarding d’un nouveau client à quelque chose qui se mesure en heures et pas en sprints, et tenir la barre opérationnelle d’une équipe restreinte.
Mon rôle
CTO. J’ai owned la conception end-to-end de la plateforme, les choix d’infra, le code des agents, les pipelines de delivery, l’observabilité, et la définition du contrat d’onboarding client.
Ce que j’ai construit
- Agents RAG avec recherche sémantique sur bases vectorielles, routage entre plusieurs LLMs selon le coût et la criticité de la requête
- UI conversationnelle riche côté client : composants interactifs, pas un simple flux texte
- Pipelines de web scraping parallèles qui alimentent les bases vectorielles à partir des sources métier de chaque tenant
- Orchestration de 100+ workflows alimentant les agents (collecte, normalisation, indexation, contrôle qualité, déclencheurs métier)
- Connecteurs omnicanaux : web, Gmail, Messenger, le tout abstrait derrière une couche commune
- Infra Scaleway : clusters Kubernetes, Terraform pour tout ce qui se déploie, Helm + ArgoCD pour le GitOps, GitLab CI/CD avec isolation stricte des secrets par tenant
- Observabilité : Prometheus + Thanos pour le long terme, alerting temps réel sur les SLO critiques
- Onboarding client réduit à un seul fichier de configuration : zéro code custom à écrire pour ajouter un tenant, ce qui change le modèle économique de l’agence
Le point dur : faire tenir l’isolation multi-tenant proprement à tous les étages (vector DB, secrets, observabilité, quotas LLM) sans dupliquer la plateforme par client.
Résultats
La plateforme est en production et continue de monter en charge. L’onboarding qui prenait du dev custom passe par un fichier de config, ce qui change la marge brute par client. La supervision tient avec une équipe restreinte grâce au GitOps et au stack d’observabilité.