RAG + Claude Haiku

L'IA qui respecte vos donnees

Recherche semantique RAG sur l'integralite du parc + brief IA contextualise par Claude Haiku. Embedding 100% local, audit complet, marqueurs cliquables vers les sources.

Demander une demo Voir tous les modules

En chiffres

embedding 100% local

cout/brief 0.0015 USD

latence moyenne 1.2s

"Le RAG sur notre catalogue, c'est magique. Je tape 'immeuble haussmannien Paris' et les 2 vrais haussmanniens sortent en tete. Sans aucune indexation manuelle."

Marc D. - Head of Asset Mgmt, Atrium Capital

Ce que ce module change pour vous

Quatre benefices concrets, mesurables, des le premier jour.

Embedding local

bge-m3 (1024d) sur Ollama, sur votre serveur. Vos donnees ne quittent jamais votre infrastructure.

RAG semantique

Recherche par sens, pas par mots-cles. 'Immeuble haussmannien Paris' marche meme si le mot 'haussmannien' n'apparait pas dans la fiche.

Brief Tiers IA

Synthese auto d'un Tiers par Claude Haiku : opportunites en cours, baux actifs, immeubles lies. Cout < 0.002 USD.

Marqueurs cliquables

Chaque reference dans la reponse IA est un lien : [imm:CODE], [opp:CODE], [bail:PK].

Apercu

Recherche semantique en langage naturel

Recherche IA

"Quels sont nos immeubles avec WALT > 6 ans en region parisienne ?"

Synthese IA

5 immeubles correspondent. La [imm:PAR-OPE-007] Tour Atrium presente le meilleur WALT a 6.8 ans avec un yield de 5.8%. La [imm:DEF-LIB-003] Tour Liberation suit avec un WALT de 7.2 ans mais un yield moindre de 4.9%.

Reponse generee en 1.2s · 408 documents indexes · bge-m3 + Claude Haiku

Toutes les fonctions du module Intelligence Artificielle

Recherche RAG

Modele bge-m3

Embeddings multilingues 1024d via Ollama. Tres bon en francais (mieux que nomic-embed).

Index pgvector

Extension PostgreSQL, index HNSW cosinus. 408 entites indexees en 137s sur SRVAPP01 GPU.

Filtres hybrides

Extraction ville/code postal de la requete + post-filtre strict. Top_k=500 quand filtre actif.

UI HTMX dans topbar

Loupe + chips de filtre par type. Responsive mobile. Resultats en cards avec scoring.

Synthese et brief

Claude Haiku 4.5

Modele Anthropic. Latence ~2.5s, cout moyen 0.0015 USD par brief. PII masquees dans les prompts.

Modele local optionnel

Qwen2.5:3b sur Ollama pour la synthese. Latence ~6s sur CPU. Zero cout marginal.

Audit LLMCallLog

Chaque appel : utilisateur, tokens, cout, prompt/response excerpts. Conforme RGPD art. 30.

Synthese RAG sur recherche

Une recherche peut declencher une synthese IA des resultats (chat). Endpoint separe lazy-loade.

Cas d'usage typiques

Comment vos equipes l'utilisent au quotidien.

Asset Manager

Cherche 'immeubles avec WALT > 6 ans en Ile-de-France yield > 5%' en langage naturel.

Broker

Demande un brief auto sur un nouveau Tiers avant un RDV. Il a la synthese en 3s.

DPO

Audite tous les appels IA du mois : qui a demande quoi, pour quel cout, sur quelles donnees.

"Le RAG sur notre catalogue, c'est magique. Je tape 'immeuble haussmannien Paris' et les 2 vrais haussmanniens sortent en tete. Sans aucune indexation manuelle."

Marc D.

Head of Asset Mgmt - Atrium Capital

Aussi a explorer

Les modules les plus complementaires.

Asset Management

Le cockpit de votre patrimoine

Decouvrir

CRM commercial

Opportunites sous controle

Voir Intelligence Artificielle en action

30 minutes en visio avec un expert metier. Sans engagement.

Demander une demo Nous ecrire