Fondements scientifiques

Research-Driven Engineering — chaque choix technique adossé à la recherche

Research-Driven Engineering : quand l'ingénierie s'appuie sur la science

Diagramme de workflow illustrant la méthodologie scientifique de BrainDup

BrainDup n'invente rien dans le vide. Chaque brique du framework est une implémentation concrète de recherches publiées et évaluées par les pairs. Ce n'est pas un détail méthodologique : c'est ce qui sépare un framework de production d'un prototype.

Pourquoi cela compte-t-il autant ? Trois raisons fondamentales :

  • Reproductibilité. Un choix technique adossé à un article scientifique peut être vérifié, reproduit, contesté. Pas de "magie noire" dans le pipeline.
  • Crédibilité. Face à un décideur, un partenaire technique ou un auditeur, chaque composant de BrainDup renvoie à une publication identifiable.
  • Pérennité. Les modes passent. Les résultats scientifiques restent. Construire sur l'état de l'art, c'est s'assurer que les fondations tiendront.

L'article pivot — GraphRAG Agent avec Neo4j et Milvus

En septembre 2024, Enzo publie sur le blog Neo4j un article technique décisif : la description d'une architecture hybride combinant Neo4j pour les relations structurées et le contexte graphique, et Milvus pour la recherche vectorielle sémantique. L'idée centrale est simple mais puissante : le vecteur seul ne suffit pas. Pour répondre avec précision à des questions complexes, il faut aussi comprendre les relations entre les concepts.

C'est le point de départ technique de BrainDup. La première implémentation arrive avec MethodMIND — un moteur de recherche sémantique sur corpus scientifique, construit sur Milvus seul. L'étape suivante est PST2RAG, où l'architecture devient réellement hybride : un dual-schema associant Milvus (vecteurs) et Neo4j (graphe de connaissances). La maturité production est atteinte avec IA-ACTES.

BrainDup est la mise en oeuvre industrielle de cette architecture. Le framework extrait, généralise et rend réutilisable ce qui a été validé en production sur des cas réels.

Validation externe — L'étude du CETIC

Graphe de base de données illustrant le dual-schema vectoriel et graphe

En avril 2025, Leandro Collier publie au CETIC (Centre d'Excellence en Technologies de l'Information et de la Communication, Belgique) une étude intitulée "Au-delà du simple chatbot". Cette analyse indépendante compare les approches RAG classiques (vectorielles) aux architectures GraphRAG.

Précision

ContexteGraphRAGRAG vectoriel seul
Général81,67 %57,50 %
Industrie90,63 %46,88 %

Efficacité

  • Réduction de 97 % de la consommation de jetons. Le graphe permet de cibler précisément l'information pertinente au lieu d'envoyer des blocs de texte massifs au LLM.
  • Traçabilité améliorée du cheminement logique des réponses. Chaque réponse peut être rattachée aux noeuds et relations du graphe qui l'ont produite.

Ces chiffres valident exactement l'architecture que BrainDup implémente : la combinaison vecteurs + graphe n'est pas un luxe technique, c'est un impératif de précision.

Cartographie science → technique

Chaque choix technique dans BrainDup est adossé à au moins un article scientifique publié.

Choix technique BrainDup Article scientifique Ce que ça prouve
Architecture RAG modulaire Modular RAG: Transforming RAG Systems into LEGO-like Reconfigurable Frameworks (arXiv 2407.21059) BrainDup implémente le cadre LEGO-like recommandé par la recherche
Dual-schema Milvus + Neo4j Knowledge Graph RAG for LLM-based Recommendation (arXiv 2501.02226) + étude CETIC Le graphe de connaissances double la précision (81,6 % vs 57,5 %)
Agents IA autonomes (BMAD) Agentic RAG: A Survey on Agentic RAG (arXiv 2501.09136) L'orchestration par agents est l'état de l'art 2025 du RAG
Conversion documentaire GPU (Docling) Docling Technical Report (arXiv 2408.09869) + Docling Toolkit (arXiv 2501.17887) Outil validé scientifiquement, utilisé en production dans IA-ACTES
Extraction structurée de factures/bilans Invoice Information Extraction (arXiv 2510.15727) Méthodes d'extraction évaluées, appliquées dans IA-ACTES (96,1 %)
RAG sur documents complexes hiérarchiques BookRAG (arXiv 2512.03413) Structure hiérarchique pour documents longs (PRD 124 pages, corpus juridique)
RAG enrichi par métadonnées Metadata-Driven RAG for Financial QA (arXiv 2510.24402) Les métadonnées améliorent la pertinence
Prompt engineering structuré The Prompt Report (arXiv 2406.06608) Techniques de prompting systématisées dans les agents BMAD
Recherche sémantique sur corpus scientifique Searching for Best Practices in RAG (arXiv 2407.01219) Le pipeline MethodMIND suit les meilleures pratiques identifiées
Meta-analyse à grande échelle PERELMAN (arXiv 2512.21727) Pattern d'extraction/agrégation applicable à de nouveaux domaines

Ce tableau constitue la carte de traçabilité scientifique de BrainDup. Pour chaque composant, on peut remonter à la source, vérifier les résultats, et comprendre pourquoi cette approche a été retenue.

Ce que cela signifie concrètement

BrainDup n'est pas un prototype expérimental construit sur des intuitions. C'est un framework dont chaque composant est scientifiquement justifié — de l'architecture duale vecteurs/graphe validée par le CETIC, jusqu'aux agents autonomes décrits dans les surveys les plus récents.

Quand vous déployez BrainDup, vous ne faites pas un pari sur une technologie émergente. Vous implémentez un état de l'art documenté, testé, et déjà éprouvé en production.

Research-Driven Engineering, ce n'est pas un slogan. C'est une méthode. Et c'est ce qui fait de BrainDup un socle sur lequel on peut construire avec confiance.