Back to flin
flin

L'opcode dupliqué qui a failli tout casser

Comment un gestionnaire d'opcode CreateMap dupliqué dans la VM de FLIN supprimait silencieusement des clés de map -- découvert pendant l'audit, corrigé en une ligne de Rust.

Juste A. Gnimavo (Thales) & Claude | March 26, 2026 3 min flin
EN/ FR/ ES
flinauditopcodebugbytecodedebugging

Les pires bugs ne sont pas ceux qui plantent votre programme. Les pires bugs sont ceux qui produisent silencieusement de mauvais résultats. FLIN avait un tel bug. Deux implémentations séparées du même opcode, vivant dans le même fichier, à 3 418 lignes d'écart, produisant des résultats subtilement différents selon le chemin d'exécution emprunté par la VM.

L'opcode CreateMap -- responsable de la construction de chaque table de hachage dans chaque programme FLIN -- existait sous deux formes. L'une gérait les clés Value::Text. L'autre non. Et pendant des semaines, les maps de traduction perdaient silencieusement des entrées.

La découverte

Le bug est apparu quand les traductions retournaient des clés brutes au lieu de valeurs traduites. La cause réelle : la VM FLIN a deux blocs match séparés pour le dispatch d'opcodes dans execute_until_return() (pour les appels de fonctions) et run() (pour le code de niveau supérieur). La version dans run() ne gérait pas Value::Text, donc quand les clés de map étaient émises comme Value::Text par le compilateur, ces paires clé-valeur étaient silencieusement ignorées.

La correction

rust// La correction : gérer Value::Text
} else if let Value::Text(s) = key {
    map.insert(s, value);
}

Une ligne de Rust. Trois tokens : else if let. C'était la différence entre des maps de traduction qui fonctionnaient et des maps qui perdaient silencieusement des entrées.

Le problème plus profond : couverture des opcodes

La session 273 a découvert que execute_until_return ne gérait que 35 % de tous les opcodes -- 59 sur 170+. Tout opcode non explicitement géré tombait dans un continue silencieux. Cela signifiait que les boucles for, les requêtes d'entités, les opérations de closures et les manipulations de listes étaient effectivement des no-ops quand exécutées à l'intérieur d'appels de fonctions déclenchés par des interactions utilisateur.

Leçons pour les implémenteurs de langages

  1. Ne jamais dupliquer les tables de dispatch. Si deux fonctions doivent gérer le même ensemble d'opcodes, elles devraient partager un mécanisme unique de dispatch.
  2. Le fallthrough silencieux est toujours faux. Une VM de langage devrait soit gérer un opcode, soit produire explicitement une erreur.
  3. Le choix de représentation de valeur du compilateur ne doit jamais affecter la sémantique.

Ceci est la partie 147 de la série « Comment nous avons construit FLIN », documentant comment un CEO à Abidjan et un CTO IA ont conçu et construit un langage de programmation à partir de zéro.

Navigation de la série : - [146] Auditer 186 000 lignes de code - [147] L'opcode dupliqué qui a failli tout casser (vous êtes ici) - [148] 30 TODO, 5 panics de production, 0 problème de sécurité

Share this article:

Responses

Write a response
0/2000
Loading responses...

Related Articles

Thales & Claude deblo

Le jour où Déblo a refusé une bonne réponse — deux fois

Une trace de production a montré Déblo K12 rejetant deux fois de suite la bonne réponse d’un élève de Terminale. Huit heures d’analyse, quatre commits, une rotation A/B de modèles et un benchmark sur 6 modèles plus tard, le tuteur de maths était corrigé. Ce qui a cassé, ce que nous avons changé, et ce que l’échec surprenant de GPT-5.4-mini au test socratique nous a appris sur le choix des modèles pour l’IA éducative.

32 min May 3, 2026
debloclaude-opus-4.7claude-codemethodology +14
Thales & Claude deblo

Web Claude a trouvé le bug. Puis il a failli l’aggraver.

Comment un prompt vocal de 270 lignes pour le tuteur Ultravox de Deblo produisait la même phrase d’accueil scriptu00e9e à chaque appel. Web Claude a diagnostiqué le problème parfaitement, puis a prescrit une correction qui aurait doublé la taille du prompt avec des hooks backend inexistants. Le filtre qui a gardé le diagnostic et rejeté la prescription.

17 min Apr 28, 2026
debloclaude-opus-4.7methodologyprompt-engineering +7
Thales & Claude deblo

Pourquoi j’ai dû corriger Web Claude deux fois sur la stratégie de la page d’accueil de Deblo

Comment une conversation de 48 heures avec Web Claude a failli entraîner Deblo dans le piège généraliste « ChatGPT pour l’Afrique », et pourquoi la connaissance du marché par le fondateur a dû prendre le dessus sur les suggestions stratégiques de l’IA à deux reprises.

26 min Apr 26, 2026
debloclaude-opus-4.7methodologystrategy +6