RAG + Claude Haiku

L'IA qui respecte vos donnees

Recherche semantique RAG sur l'integralite du parc + brief IA contextualise par Claude Haiku. Embedding 100% local, audit complet, marqueurs cliquables vers les sources.

En chiffres
embedding 100% local
cout/brief 0.0015 USD
latence moyenne 1.2s

"Le RAG sur notre catalogue, c'est magique. Je tape 'immeuble haussmannien Paris' et les 2 vrais haussmanniens sortent en tete. Sans aucune indexation manuelle."

Marc D. - Head of Asset Mgmt, Atrium Capital

Ce que ce module change pour vous

Quatre benefices concrets, mesurables, des le premier jour.

Embedding local

bge-m3 (1024d) sur Ollama, sur votre serveur. Vos donnees ne quittent jamais votre infrastructure.

RAG semantique

Recherche par sens, pas par mots-cles. 'Immeuble haussmannien Paris' marche meme si le mot 'haussmannien' n'apparait pas dans la fiche.

Brief Tiers IA

Synthese auto d'un Tiers par Claude Haiku : opportunites en cours, baux actifs, immeubles lies. Cout < 0.002 USD.

Marqueurs cliquables

Chaque reference dans la reponse IA est un lien : [imm:CODE], [opp:CODE], [bail:PK].

Apercu

Recherche semantique en langage naturel

Recherche IA
"Quels sont nos immeubles avec WALT > 6 ans en region parisienne ?"
Synthese IA

5 immeubles correspondent. La [imm:PAR-OPE-007] Tour Atrium presente le meilleur WALT a 6.8 ans avec un yield de 5.8%. La [imm:DEF-LIB-003] Tour Liberation suit avec un WALT de 7.2 ans mais un yield moindre de 4.9%.

Reponse generee en 1.2s · 408 documents indexes · bge-m3 + Claude Haiku

Toutes les fonctions du module Intelligence Artificielle

Recherche RAG

Modele bge-m3

Embeddings multilingues 1024d via Ollama. Tres bon en francais (mieux que nomic-embed).

Index pgvector

Extension PostgreSQL, index HNSW cosinus. 408 entites indexees en 137s sur SRVAPP01 GPU.

Filtres hybrides

Extraction ville/code postal de la requete + post-filtre strict. Top_k=500 quand filtre actif.

UI HTMX dans topbar

Loupe + chips de filtre par type. Responsive mobile. Resultats en cards avec scoring.

Synthese et brief

Claude Haiku 4.5

Modele Anthropic. Latence ~2.5s, cout moyen 0.0015 USD par brief. PII masquees dans les prompts.

Modele local optionnel

Qwen2.5:3b sur Ollama pour la synthese. Latence ~6s sur CPU. Zero cout marginal.

Audit LLMCallLog

Chaque appel : utilisateur, tokens, cout, prompt/response excerpts. Conforme RGPD art. 30.

Synthese RAG sur recherche

Une recherche peut declencher une synthese IA des resultats (chat). Endpoint separe lazy-loade.

Cas d'usage typiques

Comment vos equipes l'utilisent au quotidien.

Asset Manager

Cherche 'immeubles avec WALT > 6 ans en Ile-de-France yield > 5%' en langage naturel.

Broker

Demande un brief auto sur un nouveau Tiers avant un RDV. Il a la synthese en 3s.

DPO

Audite tous les appels IA du mois : qui a demande quoi, pour quel cout, sur quelles donnees.

"Le RAG sur notre catalogue, c'est magique. Je tape 'immeuble haussmannien Paris' et les 2 vrais haussmanniens sortent en tete. Sans aucune indexation manuelle."

M.
Marc D.
Head of Asset Mgmt - Atrium Capital

Voir Intelligence Artificielle en action

30 minutes en visio avec un expert metier. Sans engagement.