Back to flin
flin

Requêtes graphe et recherche sémantique

Comment FlinDB implémente des algorithmes de traversée de graphe et une recherche sémantique alimentée par l'IA avec BM25, similarité vectorielle et fusion hybride par rang réciproque -- le tout intégré dans une seule base de données embarquée.

Juste A. Gnimavo (Thales) & Claude | March 26, 2026 2 min flin
EN/ FR/ ES
flinflindbgraphsemantic-searchai

Les phases 3 et 4 de la session 166 ont ajouté des capacités pour lesquelles la plupart des bases de données facturent un supplément. Requêtes graphe -- plus court chemin, PageRank, composantes connexes, détection de cycles, tri topologique. Recherche sémantique -- embeddings vectoriels, classement par mots-clés BM25, recherche hybride.

FlinDB a les deux. Intégrés dans la même base de données embarquée. Pas de services supplémentaires. Pas d'appels réseau.

Requêtes graphe

Le système de références d'entités de FlinDB forme naturellement un graphe. Chaque référence d'une entité à une autre est une arête.

Plus court chemin : BFS entre entités. Cas d'usage : réseaux sociaux, hiérarchies organisationnelles, graphes de dépendances.

Traversée multi-sauts : traverse() parcourt le graphe de relations à une profondeur configurable.

PageRank : calcul de scores d'influence à travers les graphes d'entités.

Composantes connexes : identifie les groupes d'entités connectées par des références.

Détection de cycles : détecte les références circulaires dans les graphes d'entités.

Tri topologique : ordonne les entités pour que les dépendances viennent avant les dépendants.

Recherche sémantique

Classement BM25 par mots-clés

FlinDB implémente BM25 -- le même algorithme de classement utilisé par Elasticsearch et Solr.

rustdb.keyword_search("comfortable office chair", "Product", "description", 10)?;

Recherche par similarité vectorielle

Pour la compréhension sémantique au-delà de la correspondance par mots-clés, FlinDB génère des embeddings vectoriels pour les champs semantic text.

flinentity Product {
    name: text
    description: semantic text
}

// Search by meaning
results = db.semantic_search("comfortable seating for work", "Product", "description", 10)

Recherche hybride : le meilleur des deux mondes

La recherche hybride combine les deux en utilisant la fusion par rang réciproque (RRF) :

RRF_score(d) = 1/(k + rank_keyword(d)) + 1/(k + rank_semantic(d))

Pourquoi ces fonctionnalités vont ensemble

Une architecture traditionnelle pour une application alimentée par l'IA nécessiterait : PostgreSQL pour les données relationnelles, Neo4j pour les requêtes graphe, Elasticsearch pour la recherche par mots-clés, Pinecone pour la recherche vectorielle.

Quatre bases de données. Quatre chaînes de connexion. Quatre schémas. FlinDB fournit les quatre capacités dans une seule base de données embarquée.


Ceci est la partie 9 de la série « How We Built FlinDB ».

Navigation de la série : - [062] Relationships and Eager/Lazy Loading - [063] Transactions and Continuous Backup - [064] Graph Queries and Semantic Search (vous êtes ici) - [065] The EAVT Storage Model - [066] Database Encryption and Configuration

Share this article:

Responses

Write a response
0/2000
Loading responses...

Related Articles

Thales & Claude thales

Treize agents, quarante-trois minutes : la première session Workflow de Claude Fable 5, et ce qu'un script d'orchestration déterministe change aux builds multi-agents

Un prompt, treize agents, quarante-trois minutes : la première session de production avec Claude Fable 5 et l'outil Workflow de Claude Code a livré un site web de production complet de sept pages plus un endpoint backend de capture de leads, en un seul commit. Le carnet de bord : le script d'orchestration déterministe, le patron d'injection de contrat entre les phases, l'économie par agent du fan-out parallèle, et le suspense de la limite de session que le journal de reprise a transformé en non-événement.

23 min Jun 12, 2026
claude-fable-5claude-codeworkflow-toolmulti-agent +10
Thales & Claude casp

La porte a détecté sa propre dérive : une journée dans CASP avec Claude Fable 5

Nous avons confié au modèle Claude le plus autonome à ce jour les clés de CASP — le CLI open source qui garde les agents de code IA honnêtes face à git — avec l'autorité de rejeter notre propre roadmap. Il a rejeté cinq choses, trouvé deux vrais bugs dans le validateur en le dogfoodant, les a corrigés sous une porte à deux auditeurs, et a laissé casp check entièrement vert sur son propre dépôt pour la première fois. CASP 0.3.0 en est le résultat.

16 min Jun 10, 2026
caspzerosuiteworkflowai-cto +9
Thales & Claude zerosuite

La transplantation du CASP : comment la discipline des six fichiers est passée de Conductor à un ERP transport anti-fraude, ce que la compétence /next ajoute quand l'opérateur tape juste « next », et pourquoi le coût d'une dérive du CASP grimpe quand le projet, c'est l'argent des autres

La discipline du CASP qui a piloté trente-cinq sessions de Conductor est agnostique au produit. Le carnet de bord de sa transplantation sur KASSIA, un ERP transport anti-fraude pour un exploitant de flotte en Côte d'Ivoire : ce qui a migré, ce qui n'a pas migré (le validateur sur mesure — et ce que son absence coûte), ce que la compétence /next ajoute quand l'opérateur tape un seul mot, et là où le CASP s'arrête — le bug de déploiement qu'il ne pouvait pas voir parce qu'il enregistre l'intention, pas la réalité de l'infrastructure.

23 min Jun 8, 2026
kassiaerp-kassia-transport-logistiquezerosuiteCASP +15