Back to flin
flin

Intégration chunk-embedding

Comment FLIN relie le découpage de documents aux embeddings vectoriels -- la couche d'intégration qui transforme les PDF téléversés en connaissances recherchables avec une seule instruction save.

Juste A. Gnimavo (Thales) & Claude | March 26, 2026 2 min flin
EN/ FR/ ES
flinembeddingschunksvector-storagesemantic-search

Vous pouvez découper du texte en morceaux. Vous pouvez générer des embeddings à partir de texte. Mais connecter ces deux opérations -- de manière fiable, efficace et avec un suivi approprié des métadonnées -- est là où la plupart des implémentations RAG s'effondrent. La session 222 a construit la couche d'intégration qui comble ce fossé. Neuf nouvelles fonctions, 19 tests et un pipeline complet de bout en bout qui prend des octets bruts de document et produit des vecteurs indexés et recherchables en un seul appel de fonction.

La fonction la plus puissante, ingest_document, prend des octets bruts de document et produit des vecteurs stockés et indexés : extraire, découper, embedder, stocker et retourner le nombre. L'appelant fournit les octets et les métadonnées ; la fonction gère tout le reste.

Quand une application FLIN sauvegarde une entité avec un champ semantic text, le runtime déclenche le pipeline complet automatiquement. Le développeur n'appelle jamais une fonction de découpage, ne gère jamais d'embeddings et n'interagit jamais directement avec le magasin de vecteurs.


Ceci est la partie 131 de la série « Comment nous avons construit FLIN », documentant comment un CEO à Abidjan et un CTO IA ont conçu et construit un langage de programmation à partir de zéro.

Navigation de la série : - [130] Stratégies de découpage de texte - [131] Intégration chunk-embedding (vous êtes ici) - [132] Extraction de texte depuis CSV, XLSX, RTF et XML

Share this article:

Responses

Write a response
0/2000
Loading responses...

Related Articles

Thales & Claude thales

Treize agents, quarante-trois minutes : la première session Workflow de Claude Fable 5, et ce qu'un script d'orchestration déterministe change aux builds multi-agents

Un prompt, treize agents, quarante-trois minutes : la première session de production avec Claude Fable 5 et l'outil Workflow de Claude Code a livré un site web de production complet de sept pages plus un endpoint backend de capture de leads, en un seul commit. Le carnet de bord : le script d'orchestration déterministe, le patron d'injection de contrat entre les phases, l'économie par agent du fan-out parallèle, et le suspense de la limite de session que le journal de reprise a transformé en non-événement.

23 min Jun 12, 2026
claude-fable-5claude-codeworkflow-toolmulti-agent +10
Thales & Claude casp

La porte a détecté sa propre dérive : une journée dans CASP avec Claude Fable 5

Nous avons confié au modèle Claude le plus autonome à ce jour les clés de CASP — le CLI open source qui garde les agents de code IA honnêtes face à git — avec l'autorité de rejeter notre propre roadmap. Il a rejeté cinq choses, trouvé deux vrais bugs dans le validateur en le dogfoodant, les a corrigés sous une porte à deux auditeurs, et a laissé casp check entièrement vert sur son propre dépôt pour la première fois. CASP 0.3.0 en est le résultat.

16 min Jun 10, 2026
caspzerosuiteworkflowai-cto +9
Thales & Claude zerosuite

La transplantation du CASP : comment la discipline des six fichiers est passée de Conductor à un ERP transport anti-fraude, ce que la compétence /next ajoute quand l'opérateur tape juste « next », et pourquoi le coût d'une dérive du CASP grimpe quand le projet, c'est l'argent des autres

La discipline du CASP qui a piloté trente-cinq sessions de Conductor est agnostique au produit. Le carnet de bord de sa transplantation sur KASSIA, un ERP transport anti-fraude pour un exploitant de flotte en Côte d'Ivoire : ce qui a migré, ce qui n'a pas migré (le validateur sur mesure — et ce que son absence coûte), ce que la compétence /next ajoute quand l'opérateur tape un seul mot, et là où le CASP s'arrête — le bug de déploiement qu'il ne pouvait pas voir parce qu'il enregistre l'intention, pas la réalité de l'infrastructure.

23 min Jun 8, 2026
kassiaerp-kassia-transport-logistiquezerosuiteCASP +15