Projets de référence
MethodMIND, PST2RAG, IA-ACTES — preuves par le terrain
BrainDup n'est pas un concept théorique. C'est un framework qui a mûri à travers des projets réels dans des domaines différents — recherche scientifique, archivage email, production juridique. Chaque projet a confronté l'architecture à des contraintes nouvelles, renforcé le socle technique et validé des choix de conception.
Ce qui distingue BrainDup d'un énième "framework IA", c'est précisément cette trajectoire : nos projets passés n'ont pas été conçus pour illustrer le framework. C'est le framework qui a émergé de ces projets, par accumulation de patterns éprouvés et de leçons de terrain.
MethodMIND
Gestion de documents scientifiques
Contexte
Projet réalisé dans le cadre du Bootcamp Le Wagon Barcelona, batch #1829, octobre-décembre 2024. Équipe de cinq développeurs.
Le problème
Les chercheurs en neurosciences passent des semaines à lire des articles pour identifier des méthodologies expérimentales validées. Les LLM généralistes hallucinent — ils inventent des références qui n'existent pas. Pour un chercheur, une hallucination bibliographique est un risque pour l'intégrité de ses travaux.
La solution
- Corpus : 2 000 abstracts PubMed indexés en 2 heures
- Embeddings : SciBERT (vecteurs 768 dimensions), modèle spécialisé pour le langage scientifique
- Stockage vectoriel : Milvus, pour la recherche de similarité à grande échelle
- Reranking : T5 MonoT5-MSMarco, pour affiner la pertinence des résultats
- Sécurité : Firewall anti-injection basé sur les keywords de la base
- Interface : Streamlit
Pipeline technique
Résultats
Recherche sémantique instantanée avec références vérifiables. Chaque réponse inclut les abstracts sources et des liens directs vers les articles originaux sur PubMed.
Enseignement pour BrainDup
MethodMIND a validé le pipeline RAG vectoriel avec Milvus dans un contexte exigeant : un corpus massif, des utilisateurs experts, et une tolérance zéro pour les hallucinations. C'est le premier projet, le noyau fondateur de l'architecture BrainDup.
PST2RAG
IA archiviste d'email
Le problème
Des années de savoirs organisationnels enfouis dans les archives email. Les fichiers PST (Microsoft Outlook) concentrent l'historique des échanges, des décisions, des relations — mais ce format propriétaire est totalement inaccessible aux technologies IA modernes.
La solution
Extraction et transformation :
- PST → MBOX (via libpst/readpst) → Markdown
- Extraction d'entités (personnes, organisations, pièces jointes)
- Chunking intelligent adapté à la structure des emails
Indexation duale :
- Milvus (recherche sémantique, embeddings 384 dimensions) : retrouve les contenus par similarité de sens
- Neo4j (graphe de relations) : modélise les liens structurels — Email, Chunk, Person, Entity, Attachment, Organization
Cibles métier
- Compliance et e-discovery : retrouver rapidement des échanges pertinents dans un contexte réglementaire ou contentieux
- Forensique numérique : reconstituer des chaînes de communication et identifier des patterns
- Gestion des connaissances : exploiter l'historique décisionnel d'une organisation
- Intelligence métier : cartographier les réseaux d'influence et les flux d'information
Résultats
Recherche sémantique pleinement opérationnelle — "préoccupations budgétaires" retrouve effectivement "soucis financiers". Analyse relationnelle fonctionnelle : "qui communique avec qui sur quoi ?". Requêtes hybrides croisant recherche vectorielle et traversée de graphe.
Enseignement pour BrainDup
PST2RAG a introduit le dual-schema Milvus + Neo4j — le pattern architectural qui deviendra le coeur de BrainDup. Le vectoriel pour le sens, le graphe pour la structure. Les deux ensemble pour la fiabilité.
IA-ACTES
Production de documents juridiques
Le problème
La rédaction d'un acte de cession de pharmacie prend 7 heures par dossier. 169 champs à remplir manuellement. 103 documents à traiter par dossier. 35 blocs conditionnels à valider selon le contexte de l'affaire. C'est un travail d'expert, répétitif mais exigeant, où chaque erreur a des conséquences juridiques réelles.
La solution
Stack technique :
- Backend : Django + FastAPI + n8n (orchestration des 84 tâches automatisées)
- IA : Milvus + Neo4j + Ollama (inférence locale)
- Documents : Nextcloud + Collabora + Docling GPU
- Infrastructure : NVIDIA Blackwell — aucune donnée ne quitte le serveur
Architecture RAG dual-schema :
- Schéma "Dossier" : les documents d'affaire du client
- Schéma "Corpus juridique" : les textes légaux de référence
- 3 modes de requête : recherche dans le dossier, recherche dans le corpus, recherche croisée
Conformité EU AI Act et RGPD : validation humaine obligatoire à chaque étape critique.
Résultats
| Indicateur | Valeur |
|---|---|
| Temps par acte | 7h → 1h (gain x7) |
| Taux d'extraction documentaire | 96,1 % sur 56 documents test |
| Champs de fusion automatisés | 169 (43 % par API publiques, 57 % par IA) |
| Documents gérés par dossier | 103 |
| Tâches automatisées | 84 |
| Modèle de génération | GLM-4.7-Flash (30B-A3B) |
| Modèle d'embeddings | E5-Mistral-7B (vecteurs 4096D) |
Complexité du projet : 124 pages de PRD, 11 EPICs, 35 FRs, 10 NFRs. Développé intégralement avec Claude Code et la méthode BMAD.
Enseignement pour BrainDup
IA-ACTES est la preuve de maturité industrielle. Ce n'est plus un prototype. C'est un système de production qui gère des documents juridiques réels, avec des contraintes de conformité réglementaire et un gain de productivité mesurable. IA-ACTES valide l'ensemble : l'architecture technique BrainDup, la méthodologie BMAD et Claude Code comme outil de développement principal.
Synthèse : une progression cumulative
MethodMIND a posé les fondations. Le pipeline RAG vectoriel avec Milvus, la recherche sémantique sur un corpus massif, le firewall anti-hallucination.
PST2RAG a ajouté la dimension relationnelle. Le dual-schema Milvus + Neo4j transforme une recherche de contenu en une véritable intelligence documentaire.
IA-ACTES a prouvé la maturité production. L'architecture complète, déployée sur un cas métier exigeant, avec des résultats mesurables et une conformité réglementaire.
Cette progression — RAG vectoriel → dual-schema graphe → maturité production + méthodologie BMAD — n'a pas été planifiée. Elle a émergé du terrain. Et c'est précisément ce qui fait la solidité de BrainDup.