
Agents IA et base de données : pourquoi les fichiers ne suffisent plus
En une session, nous avons migré 23 fichiers JSON vers 9 tables SQL. Retour d'expérience concret sur l'architecture DB-first pour agents IA.
Nous exploitons un système de 30 agents IA et 96 automates Python en production depuis janvier 2026. Pendant six mois, toutes les données de nos agents — emails clients, backlog, activité, cicatrices d'apprentissage — étaient stockées dans des fichiers JSON et Markdown. Le système fonctionnait. Jusqu'au jour où un agent a servi des données périmées depuis un fichier fallback pendant trois heures sans que personne ne s'en aperçoive. Ce jour-là, nous avons décidé de tout migrer en base de données. En une seule session de travail, nous avons supprimé 23 fichiers JSON, créé 9 tables SQL et 5 modules PrestaShop. 22 000 lignes de fichiers statiques remplacées par 607 lignes structurées en base. Voici pourquoi cette migration change tout pour les architectures multi-agents, et pourquoi aucun outil IA du marché ne propose cette approche.
Le vrai problème des fichiers comme mémoire IA
Cet article fait partie de notre dossier Stratégie › intelligence-artificielle.
| Problématique | Avec des fichiers | Avec une base de données |
|---|---|---|
| Source de vérité | Multiple (core + docker + backup) | Unique |
| Requêtabilité | Impossible (grep dans du JSON) | SQL natif |
| Persistance inter-sessions | Rechargement complet | On-demand |
| Multi-tenant | Un fichier par client, sync manuelle | Une table, clause WHERE |
| Concurrence d'écriture | Corruption si 2 process écrivent | Transactions ACID |
| Contexte IA | Chargé à chaque message (tokens gaspillés) | Requêté uniquement quand nécessaire |
| Audit / traçabilité | git blame sur du JSON | Colonnes date_add, updated_by |
Pourquoi les fichiers ne tiennent pas en production
La plupart des outils IA — Cursor, GitHub Copilot, ChatGPT, même Claude Projets — utilisent des fichiers comme contexte. Des .md dans un dossier, des .json dans server/data/, des YAML de configuration. Ça fonctionne pour un prototype. Ça ne tient pas en production.
Trois raisons fondamentales :
- Les fichiers dérivent silencieusement. Un fichier
modules.jsonexistait en deux copies (source et Docker). Quand nous avons migré les modules en base de données, le fichier Docker n'a pas été mis à jour. Pendant des heures, la preprod servait des données obsolètes via un fallback que personne n'avait vérifié. - Les fichiers polluent le contexte. Notre fichier MEMORY.md faisait 227 lignes et 30 Ko — tronqué à chaque session. Des items « à faire lundi » côtoyaient des règles permanentes. Tout était chargé systématiquement, qu'il soit pertinent ou non. Après migration du backlog en base (
ps_ac_backlog), le fichier est tombé à 120 lignes. Les TODO sont requêtés uniquement quand c'est nécessaire. - Les fichiers ne sont pas requêtables. « Quels emails clients sont non traités ? » Avec un JSON, il faut charger le fichier, parser, filtrer. Avec la base :
SELECT * FROM ps_ac_inbox_emails WHERE status = 'new'. Une ligne contre quinze.
Ce que nous avons migré en une session
Neuf tables créées, chacune remplaçant un ou plusieurs fichiers JSON :
ps_ac_inbox_emails— emails clients avec statuts (new, seen, resolved)ps_ac_daily_meet— briefing de session (49 items migrés)ps_ac_agent_activity+ps_ac_agent_heartbeat— activité temps réel des agentsps_ac_expertise— 194 articles techniques (12 000 lignes de JSON supprimées)ps_ac_academy_mentor— 15 mentors historiques de l'Academyps_ac_automates— 96 automates Python classifiés en 6 castesps_ac_backlog— roadmap et TODO (remplace 13 fichiers mémoire)ps_ac_cicatrices— registre des erreurs corrigées par agent
Pourquoi aucun outil IA ne fait ça
Les outils IA actuels (Cursor, Windsurf, Copilot, Devin) lisent le code. Ils ne se connectent pas à votre base de données de production. Ils ne font pas de docker exec sur vos containers. Ils ne scannent pas vos VPS en SSH pour inventorier les modules installés.
Notre architecture — Claude Code avec accès direct à MariaDB, Docker et SSH sur 7 VPS — permet à l'agent de requêter ses propres données au lieu de les charger en contexte. La différence est fondamentale : un SELECT ciblé consomme zéro token de contexte. Un fichier .md chargé à chaque message en consomme des milliers, qu'il soit utile ou non.
Les résultats concrets
| Donnée | Avant (fichier) | Après (DB) | Gain |
|---|---|---|---|
| Emails clients | inbox-alerts.json (8 Ko, 100 max) | ps_ac_inbox_emails | Historique illimité + statuts |
| Briefing session | daily-meet.json (65 Ko) | ps_ac_daily_meet | Requêtable par sévérité |
| Activité agents | agent-activity.json (146 Ko) | 2 tables (heartbeat + activity) | Temps réel, pas de cap |
| Articles expertise | 392 fichiers JSON (22 000 lignes) | ps_ac_expertise (194 rows) | -99% de fichiers |
| Modules installés | JSON + hardcodé | ps_ac_moduleslist | MAJ sans rebuild |
| Backlog/TODO | 13 fichiers .md en mémoire | ps_ac_backlog | Requêté on-demand |
| Registre VPS | clients.json (readFileSync) | ps_ac_client_vps | La Flotte, scan SSH auto |
Conclusion
La migration fichiers vers base de données n'est pas une optimisation technique. C'est un changement d'architecture qui transforme vos agents IA de scripts stateless en systèmes persistants capables d'apprendre, de se souvenir et de se coordonner.
Chez CodeMyShop, chaque client dispose de sa propre base de données sur un VPS souverain. Ses agents, ses données, ses cicatrices d'apprentissage — tout lui appartient. Pas de fichiers partagés qui dérivent. Pas de JSON fantôme qui sert des données périmées. Une seule source de vérité.
Vous exploitez des agents IA en production et vos données sont encore dans des fichiers ? Prenez 30 minutes pour en discuter — on vous montre comment structurer ça proprement.
Sources
- Documentation Anthropic — Building Agentic Systems (2025)
- Martin Fowler — Patterns of Enterprise Application Architecture, « Single Source of Truth »
- Session de migration réelle — Alexandre Carette, 2 avril 2026 (23 JSON → 9 tables, 607 rows)
Questions fréquentes
Tout ce que vous devez savoir sur ce sujet.
Une question ?
Contactez-nous directement.
Discussion
Nos conseils liés à Strategie
Service design IA : 3 agents auditent un thème e-commerce en direct
Comment 3 agents IA du Synedre — Itten, Coco, Eames — auditent un design system e-commerce. Cadres cognitifs, méthode et recommandations concrètes.
J'ai arrêté de construire des sites — je construis une usine à navires
Monorepo PrestaShop Headless transformé en PaaS souverain single-tenant : EventBus, Constitution Industrielle, déploiement client en 120s.
Dust, ChatGPT Enterprise, Synedre : trois IA d'entreprise comparées
Dust.tt, ChatGPT Enterprise, Synedre : trois familles d'IA d'entreprise comparées honnêtement. Quel choix pour une PME française en 2026 ?