Back to flin
flin

Mise en cache des résultats de recherche

Comment le système de mise en cache des résultats de recherche de FLIN utilise l'éviction LRU, l'expiration TTL et l'invalidation tenant compte des entités pour éliminer les calculs de recherche redondants.

Juste A. Gnimavo (Thales) & Claude | March 26, 2026 1 min flin
EN/ FR/ ES
flincachingsearchperformanceoptimization

La recherche est coûteuse. Une recherche hybride dans FLIN implique la génération d'embeddings, la traversée d'index HNSW, le scoring BM25, la Reciprocal Rank Fusion et la sérialisation des résultats. Pour une seule requête, la latence totale est acceptable -- 20 à 40 millisecondes. Pour la même requête exécutée 100 fois en une minute, le coût cumulé est du gaspillage.

Le système de cache utilise l'éviction LRU, l'expiration TTL et l'invalidation tenant compte des entités pour éliminer les calculs redondants tout en garantissant que les résultats périmés sont rafraîchis quand les données sous-jacentes changent.


Ceci est la partie 187 de la série « Comment nous avons construit FLIN », documentant comment un CEO à Abidjan et un CTO IA ont conçu et construit un langage de programmation à partir de zéro.

Navigation de la série : - [186] Patterns de résilience aux erreurs - [187] Mise en cache des résultats de recherche (vous êtes ici) - [188] Tests d'intégration GC, CLI et HTTP

Share this article:

Responses

Write a response
0/2000
Loading responses...

Related Articles

Thales & Claude deblo

Le jour où Déblo a refusé une bonne réponse — deux fois

Une trace de production a montré Déblo K12 rejetant deux fois de suite la bonne réponse d’un élève de Terminale. Huit heures d’analyse, quatre commits, une rotation A/B de modèles et un benchmark sur 6 modèles plus tard, le tuteur de maths était corrigé. Ce qui a cassé, ce que nous avons changé, et ce que l’échec surprenant de GPT-5.4-mini au test socratique nous a appris sur le choix des modèles pour l’IA éducative.

32 min May 3, 2026
debloclaude-opus-4.7claude-codemethodology +14
Thales & Claude deblo

Web Claude a trouvé le bug. Puis il a failli l’aggraver.

Comment un prompt vocal de 270 lignes pour le tuteur Ultravox de Deblo produisait la même phrase d’accueil scriptu00e9e à chaque appel. Web Claude a diagnostiqué le problème parfaitement, puis a prescrit une correction qui aurait doublé la taille du prompt avec des hooks backend inexistants. Le filtre qui a gardé le diagnostic et rejeté la prescription.

17 min Apr 28, 2026
debloclaude-opus-4.7methodologyprompt-engineering +7
Thales & Claude deblo

Pourquoi j’ai dû corriger Web Claude deux fois sur la stratégie de la page d’accueil de Deblo

Comment une conversation de 48 heures avec Web Claude a failli entraîner Deblo dans le piège généraliste « ChatGPT pour l’Afrique », et pourquoi la connaissance du marché par le fondateur a dû prendre le dessus sur les suggestions stratégiques de l’IA à deux reprises.

26 min Apr 26, 2026
debloclaude-opus-4.7methodologystrategy +6