Back to flin
flin

Intégration chunk-embedding

Comment FLIN relie le découpage de documents aux embeddings vectoriels -- la couche d'intégration qui transforme les PDF téléversés en connaissances recherchables avec une seule instruction save.

Juste A. Gnimavo (Thales) & Claude | March 26, 2026 2 min flin
EN/ FR/ ES
flinembeddingschunksvector-storagesemantic-search

Vous pouvez découper du texte en morceaux. Vous pouvez générer des embeddings à partir de texte. Mais connecter ces deux opérations -- de manière fiable, efficace et avec un suivi approprié des métadonnées -- est là où la plupart des implémentations RAG s'effondrent. La session 222 a construit la couche d'intégration qui comble ce fossé. Neuf nouvelles fonctions, 19 tests et un pipeline complet de bout en bout qui prend des octets bruts de document et produit des vecteurs indexés et recherchables en un seul appel de fonction.

La fonction la plus puissante, ingest_document, prend des octets bruts de document et produit des vecteurs stockés et indexés : extraire, découper, embedder, stocker et retourner le nombre. L'appelant fournit les octets et les métadonnées ; la fonction gère tout le reste.

Quand une application FLIN sauvegarde une entité avec un champ semantic text, le runtime déclenche le pipeline complet automatiquement. Le développeur n'appelle jamais une fonction de découpage, ne gère jamais d'embeddings et n'interagit jamais directement avec le magasin de vecteurs.


Ceci est la partie 131 de la série « Comment nous avons construit FLIN », documentant comment un CEO à Abidjan et un CTO IA ont conçu et construit un langage de programmation à partir de zéro.

Navigation de la série : - [130] Stratégies de découpage de texte - [131] Intégration chunk-embedding (vous êtes ici) - [132] Extraction de texte depuis CSV, XLSX, RTF et XML

Share this article:

Responses

Write a response
0/2000
Loading responses...

Related Articles

Thales & Claude deblo

Le jour où Déblo a refusé une bonne réponse — deux fois

Une trace de production a montré Déblo K12 rejetant deux fois de suite la bonne réponse d’un élève de Terminale. Huit heures d’analyse, quatre commits, une rotation A/B de modèles et un benchmark sur 6 modèles plus tard, le tuteur de maths était corrigé. Ce qui a cassé, ce que nous avons changé, et ce que l’échec surprenant de GPT-5.4-mini au test socratique nous a appris sur le choix des modèles pour l’IA éducative.

32 min May 3, 2026
debloclaude-opus-4.7claude-codemethodology +14
Thales & Claude deblo

Web Claude a trouvé le bug. Puis il a failli l’aggraver.

Comment un prompt vocal de 270 lignes pour le tuteur Ultravox de Deblo produisait la même phrase d’accueil scriptu00e9e à chaque appel. Web Claude a diagnostiqué le problème parfaitement, puis a prescrit une correction qui aurait doublé la taille du prompt avec des hooks backend inexistants. Le filtre qui a gardé le diagnostic et rejeté la prescription.

17 min Apr 28, 2026
debloclaude-opus-4.7methodologyprompt-engineering +7
Thales & Claude deblo

Pourquoi j’ai dû corriger Web Claude deux fois sur la stratégie de la page d’accueil de Deblo

Comment une conversation de 48 heures avec Web Claude a failli entraîner Deblo dans le piège généraliste « ChatGPT pour l’Afrique », et pourquoi la connaissance du marché par le fondateur a dû prendre le dessus sur les suggestions stratégiques de l’IA à deux reprises.

26 min Apr 26, 2026
debloclaude-opus-4.7methodologystrategy +6