Back to flin
flin

La crise du choix du modèle d'embeddings

Comment le choix du modèle d'embeddings de FLIN était contraint par la disponibilité des bibliothèques -- et l'architecture que nous avons construite pour changer de modèle sans casser les applications.

Juste A. Gnimavo (Thales) & Claude | March 26, 2026 2 min flin
EN/ FR/ ES
flinbugembeddingsmodel-selectionaivectors

Quand vous construisez un langage de programmation avec des capacités IA intégrées, vous héritez des dépendances de l'écosystème IA. Le 17 janvier 2026, nous avons découvert que le modèle d'embeddings que nous avions prévu d'utiliser (BGE-M3) n'existait pas dans la bibliothèque dont nous dépendions (fastembed Rust crate v4.9.1).

Nous avons choisi multilingual-e5-large comme alternative et construit une architecture qui permet aux utilisateurs de sélectionner leur modèle d'embeddings via la configuration :

flinai {
    embeddings: "local"
    model: "multilingual-e5-large"
}

L'architecture utilise des singletons doubles pour un cache efficace, un parsing de configuration qui accepte les noms complets et abrégés, et un enum EmbeddingModelChoice extensible. Le principe de conception : construisez l'abstraction même quand vous n'avez que deux implémentations. L'abstraction ne coûte presque rien aujourd'hui et économise un refactoring significatif demain.

Les deux choix de modèles sont multilingues -- c'était non négociable. FLIN est construit à Abidjan et utilisé à travers l'Afrique francophone, anglophone et au-delà. Un système de recherche qui ne comprend que l'anglais serait inutile pour la majorité des utilisateurs de FLIN.


Ceci est la partie 169 de la série « Comment nous avons construit FLIN », documentant comment un CEO à Abidjan et un CTO IA ont conçu et construit un langage de programmation à partir de zéro.

Navigation de la série : - [168] Valeurs par défaut des entités et correction du toggle - [169] La crise du choix du modèle d'embeddings (vous êtes ici) - [170] 15 bugs qui ont façonné le langage FLIN

Share this article:

Responses

Write a response
0/2000
Loading responses...

Related Articles

Thales & Claude deblo

Le jour où Déblo a refusé une bonne réponse — deux fois

Une trace de production a montré Déblo K12 rejetant deux fois de suite la bonne réponse d’un élève de Terminale. Huit heures d’analyse, quatre commits, une rotation A/B de modèles et un benchmark sur 6 modèles plus tard, le tuteur de maths était corrigé. Ce qui a cassé, ce que nous avons changé, et ce que l’échec surprenant de GPT-5.4-mini au test socratique nous a appris sur le choix des modèles pour l’IA éducative.

32 min May 3, 2026
debloclaude-opus-4.7claude-codemethodology +14
Thales & Claude deblo

Web Claude a trouvé le bug. Puis il a failli l’aggraver.

Comment un prompt vocal de 270 lignes pour le tuteur Ultravox de Deblo produisait la même phrase d’accueil scriptu00e9e à chaque appel. Web Claude a diagnostiqué le problème parfaitement, puis a prescrit une correction qui aurait doublé la taille du prompt avec des hooks backend inexistants. Le filtre qui a gardé le diagnostic et rejeté la prescription.

17 min Apr 28, 2026
debloclaude-opus-4.7methodologyprompt-engineering +7
Thales & Claude deblo

Pourquoi j’ai dû corriger Web Claude deux fois sur la stratégie de la page d’accueil de Deblo

Comment une conversation de 48 heures avec Web Claude a failli entraîner Deblo dans le piège généraliste « ChatGPT pour l’Afrique », et pourquoi la connaissance du marché par le fondateur a dû prendre le dessus sur les suggestions stratégiques de l’IA à deux reprises.

26 min Apr 26, 2026
debloclaude-opus-4.7methodologystrategy +6