Projets de référence

MethodMIND, PST2RAG, IA-ACTES — preuves par le terrain

Connecteur symbolisant l'intégration entre les briques techniques de BrainDup

BrainDup n'est pas un concept théorique. C'est un framework qui a mûri à travers des projets réels dans des domaines différents — recherche scientifique, archivage email, production juridique. Chaque projet a confronté l'architecture à des contraintes nouvelles, renforcé le socle technique et validé des choix de conception.

Ce qui distingue BrainDup d'un énième "framework IA", c'est précisément cette trajectoire : nos projets passés n'ont pas été conçus pour illustrer le framework. C'est le framework qui a émergé de ces projets, par accumulation de patterns éprouvés et de leçons de terrain.

MethodMIND

Gestion de documents scientifiques

Contexte

Projet réalisé dans le cadre du Bootcamp Le Wagon Barcelona, batch #1829, octobre-décembre 2024. Équipe de cinq développeurs.

Le problème

Les chercheurs en neurosciences passent des semaines à lire des articles pour identifier des méthodologies expérimentales validées. Les LLM généralistes hallucinent — ils inventent des références qui n'existent pas. Pour un chercheur, une hallucination bibliographique est un risque pour l'intégrité de ses travaux.

La solution

  • Corpus : 2 000 abstracts PubMed indexés en 2 heures
  • Embeddings : SciBERT (vecteurs 768 dimensions), modèle spécialisé pour le langage scientifique
  • Stockage vectoriel : Milvus, pour la recherche de similarité à grande échelle
  • Reranking : T5 MonoT5-MSMarco, pour affiner la pertinence des résultats
  • Sécurité : Firewall anti-injection basé sur les keywords de la base
  • Interface : Streamlit

Pipeline technique

User Input → Firewall → Query Enhancement → SciBERT Embedding → Milvus Similarity Search → PubMed Retrieval → T5 Reranking → LLM Generation → Output avec abstracts et liens

Résultats

Recherche sémantique instantanée avec références vérifiables. Chaque réponse inclut les abstracts sources et des liens directs vers les articles originaux sur PubMed.

Enseignement pour BrainDup

MethodMIND a validé le pipeline RAG vectoriel avec Milvus dans un contexte exigeant : un corpus massif, des utilisateurs experts, et une tolérance zéro pour les hallucinations. C'est le premier projet, le noyau fondateur de l'architecture BrainDup.

PST2RAG

IA archiviste d'email

Le problème

Des années de savoirs organisationnels enfouis dans les archives email. Les fichiers PST (Microsoft Outlook) concentrent l'historique des échanges, des décisions, des relations — mais ce format propriétaire est totalement inaccessible aux technologies IA modernes.

La solution

Extraction et transformation :

  • PST → MBOX (via libpst/readpst) → Markdown
  • Extraction d'entités (personnes, organisations, pièces jointes)
  • Chunking intelligent adapté à la structure des emails

Indexation duale :

  • Milvus (recherche sémantique, embeddings 384 dimensions) : retrouve les contenus par similarité de sens
  • Neo4j (graphe de relations) : modélise les liens structurels — Email, Chunk, Person, Entity, Attachment, Organization

Cibles métier

  • Compliance et e-discovery : retrouver rapidement des échanges pertinents dans un contexte réglementaire ou contentieux
  • Forensique numérique : reconstituer des chaînes de communication et identifier des patterns
  • Gestion des connaissances : exploiter l'historique décisionnel d'une organisation
  • Intelligence métier : cartographier les réseaux d'influence et les flux d'information

Résultats

Recherche sémantique pleinement opérationnelle — "préoccupations budgétaires" retrouve effectivement "soucis financiers". Analyse relationnelle fonctionnelle : "qui communique avec qui sur quoi ?". Requêtes hybrides croisant recherche vectorielle et traversée de graphe.

Enseignement pour BrainDup

PST2RAG a introduit le dual-schema Milvus + Neo4j — le pattern architectural qui deviendra le coeur de BrainDup. Le vectoriel pour le sens, le graphe pour la structure. Les deux ensemble pour la fiabilité.

IA-ACTES

Production de documents juridiques

Le problème

La rédaction d'un acte de cession de pharmacie prend 7 heures par dossier. 169 champs à remplir manuellement. 103 documents à traiter par dossier. 35 blocs conditionnels à valider selon le contexte de l'affaire. C'est un travail d'expert, répétitif mais exigeant, où chaque erreur a des conséquences juridiques réelles.

La solution

Stack technique :

  • Backend : Django + FastAPI + n8n (orchestration des 84 tâches automatisées)
  • IA : Milvus + Neo4j + Ollama (inférence locale)
  • Documents : Nextcloud + Collabora + Docling GPU
  • Infrastructure : NVIDIA Blackwell — aucune donnée ne quitte le serveur

Architecture RAG dual-schema :

  • Schéma "Dossier" : les documents d'affaire du client
  • Schéma "Corpus juridique" : les textes légaux de référence
  • 3 modes de requête : recherche dans le dossier, recherche dans le corpus, recherche croisée

Conformité EU AI Act et RGPD : validation humaine obligatoire à chaque étape critique.

Résultats

IndicateurValeur
Temps par acte7h → 1h (gain x7)
Taux d'extraction documentaire96,1 % sur 56 documents test
Champs de fusion automatisés169 (43 % par API publiques, 57 % par IA)
Documents gérés par dossier103
Tâches automatisées84
Modèle de générationGLM-4.7-Flash (30B-A3B)
Modèle d'embeddingsE5-Mistral-7B (vecteurs 4096D)

Complexité du projet : 124 pages de PRD, 11 EPICs, 35 FRs, 10 NFRs. Développé intégralement avec Claude Code et la méthode BMAD.

Enseignement pour BrainDup

IA-ACTES est la preuve de maturité industrielle. Ce n'est plus un prototype. C'est un système de production qui gère des documents juridiques réels, avec des contraintes de conformité réglementaire et un gain de productivité mesurable. IA-ACTES valide l'ensemble : l'architecture technique BrainDup, la méthodologie BMAD et Claude Code comme outil de développement principal.

Synthèse : une progression cumulative

MethodMIND a posé les fondations. Le pipeline RAG vectoriel avec Milvus, la recherche sémantique sur un corpus massif, le firewall anti-hallucination.

PST2RAG a ajouté la dimension relationnelle. Le dual-schema Milvus + Neo4j transforme une recherche de contenu en une véritable intelligence documentaire.

IA-ACTES a prouvé la maturité production. L'architecture complète, déployée sur un cas métier exigeant, avec des résultats mesurables et une conformité réglementaire.

Cette progression — RAG vectoriel → dual-schema graphe → maturité production + méthodologie BMAD — n'a pas été planifiée. Elle a émergé du terrain. Et c'est précisément ce qui fait la solidité de BrainDup.