Waimia.
§ Case 09

Une stack self-hosted qui traite 3,2 × plus d'appels d'offres classifiés — sans sortir de l'infra.

Client
Caserne (pseudonym)
Secteur
Défense · collectivité + opérateur
Durée
14 sem · Q4 2025
Stack
Llama 3 70B · Ollama · Qdrant
Prestations
Self-hosted · RAG privé · SecNumCloud
§ 01 · Context
Le brief

Caserne a une contrainte que l'industrie IA ignore : aucun modèle américain, aucune sortie de l'infrastructure souveraine, classification Confidentiel Défense. Les analystes étaient saturés, les délais de réponse aux appels d'offres trop longs, et chaque démo SaaS arrivait fermée à clé.

Notre brief : déployer une stack 100% open-source self-hosted sur SecNumCloud. Llama 3 70B servi par Ollama, RAG privé Qdrant, agents d'analyse. Pas de Claude. C'est exactement ce que demande le contexte.

§ 02 · L'approche

Quand le contexte exige Llama, on livre Llama.

Waimia n'est pas Claude-only. Pour ce cas, le bon outil est open-source self-hosted. Notre méthode reste la même : audit conformité → stack → agents → transfert.

01
Conformité

Audit SecNumCloud

Trois semaines d'audit conformité SecNumCloud + cartographie complète de la classification data. Aucun raccourci.

02
Stack

Llama 3 70B + Qdrant

Stack open-source 100% self-hosted : Ollama pour servir Llama 3 70B, Qdrant pour le RAG privé. Zéro modèle US.

03
Agents

Analyse documentaire

Agents d'analyse + résumé de documents techniques classifiés. Chaque inférence reste sur l'infrastructure souveraine.

04
Transfert

Formation analystes

Formation des analystes internes + transfert complet de compétences. Waimia se retire, l'équipe opère seule.

Témoignage
« Notre contrainte n'était pas négociable : aucune sortie d'infra, aucun modèle américain, aucune télémétrie. Waimia est arrivée avec une stack ouverte qui tient ces trois lignes — et qui livre les résultats. »
Responsable SI · Direction sécurité · Caserne
Mesures
−65%
Temps de pré-analyse
100%
Souveraineté data
+220%
Capacité appels d'offres
0
Incident classification leak
§ 04 · La stack

Volontairement ouverte. Llama 3 70B pour la cognition, Ollama pour servir, Qdrant pour le RAG. Toute la pile reste sur SecNumCloud, sous contrôle Caserne.

Llama 3 70B Ollama Qdrant SecNumCloud VirtuoseOS
§ Acte VIII — Pour ceux qui livrent

Prêt à livrer un agent,
pas un slide deck ?

Audit IA en 5 jours. Premier agent en production en 4 semaines. ROI mesuré, jamais estimé.

Réserver un audit Voir la pyramide ◉ Booking T3 2026 · 4 places