Comment nous avons construit un atlas culinaire multilingue avec la traduction IA

Un grain de poivre porte son origine dans son nom. Voatsiperifery est malgache — *voa* signifie fruit, *tsiperifery* la liane grimpante qui le produit. Le dire en français ne change pas ce qu'il est ; *poivre voatsiperifery* laisse les deux moitiés du nom intactes parce qu'aucun mot européen ne désigne la même baie. Le problème de la traduction commence à l'instant où l'on force un nom à travers une langue qui n'a pas le concept de ce qu'elle nomme.

Sapor catalogue 101 épices et herbes d'origine unique dans quatre langues : anglais, français, allemand, espagnol. Chaque ingrédient porte une région, un dossier IGP ou AOP quand il en existe un, un producteur quand nous le connaissons, une phénologie, un profil aromatique, une liste de synonymes botaniques. En lançant le projet, nous savions que la traduction serait difficile. Nous n'avions pas anticipé que le mode de défaillance dominant serait, non pas la mauvaise traduction, mais l'effacement — le nivellement insidieux d'un nom qui signifie quelque chose de précis vers un nom qui ne signifie plus rien.

Le problème posé par l'atlas

Traduire une recette n'est pas le même métier que traduire un atlas. Une recette s'adapte : « shallot » peut devenir « échalote » sans cérémonie, et le plat fonctionne toujours. Un atlas ne peut pas. Quand nous décrivons le poivre de Penja comme un poivre blanc de la plaine volcanique du Moungo, le mot « Penja » n'est pas interchangeable avec « poivre blanc du Cameroun ». Il désigne une seule subdivision administrative, un seul ensemble de sols, un seul dossier IGP déposé à Yaoundé en 2013. Penja est un nom propre au sens strict — un lieu, une communauté, une dénomination enregistrée. Un traducteur qui le traite comme un descripteur de saveur a déjà cassé l'article.

La même logique s'applique au *voatsiperifery*, au Tellicherry, à l'Espelette. Les noms ne sont pas des étiquettes apposées sur des produits génériques ; ils sont les produits eux-mêmes. La perte d'information quand un modèle décide de « simplifier » ou de « localiser » un tel terme n'est pas stylistique. Elle démonte la raison d'être de la page.

Ce que DeepL fait bien, et où il s'arrête

DeepL reste le moteur le plus précis pour la prose ordinaire. Son traitement du registre est excellent — il sait quand une phrase appelle le *vous* formel en français et quand le *du* informel fonctionne en allemand. Pour des paragraphes de description pure, où nous parlons d'altitude, de pluviométrie, de mois de récolte, de pH du sol, DeepL produit une sortie que nous pouvons publier avec une édition légère.

Il s'arrête aux noms propres dès l'instant où ces noms s'éloignent d'une géographie familière. DeepL était convaincu, lors de nos premiers tests, que *Piper longum* devait être traduit par « poivre long » en anglais — correct comme nom vernaculaire, faux comme référence botanique — et tout aussi convaincu que *voatsiperifery* était une faute de frappe. Il corrigeait silencieusement le nom vers un mot français phonétiquement plus proche, supprimait les astérisques autour du binôme, ou remplaçait *Karimunda* par une paraphrase. Aucune de ces erreurs n'est visible sans une relecture experte du domaine.

Pour des bases de données d'ingrédients, DeepL est une excellente première passe. Il ne peut pas être la dernière.

Comparer les modèles génératifs

Le choix du grand modèle de langue pour la deuxième passe nous a pris plus de temps qu'attendu. Notre propre évaluation, tirée du comparateur d'outils IA que nous maintenons où chaque moteur est testé avec un compte payant pendant plusieurs semaines de travail réel, a fini par retenir Claude comme le plus fiable pour la traduction éditoriale lorsqu'il est associé à un prompt précis.

La différence entre les principaux moteurs génératifs, dans nos tests, se résume à deux comportements : avec quelle agressivité un modèle « améliore » le texte de sa propre initiative, et comment il gère l'incertitude sur un nom propre.

GPT, dans ses différentes itérations de classe 4, avait tendance à réécrire. Sollicité pour traduire un paragraphe sur le poivre de Wayanad en allemand, il ajoutait des fioritures stylistiques qui se lisaient comme du marketing — des adjectifs absents de la source, de l'hyperbole douce, une tendance à qualifier les choses d'« exquises » ou d'« uniques » sans justification. Pour un atlas, c'est un problème de discipline. Nous passions du temps en révision à ramener le texte vers le neutre.

Claude avait tendance à préserver. À partir d'une source anglaise nommant *Piper nigrum* et *Karimunda*, les sorties française et allemande de Claude gardaient le binôme intact, gardaient le nom du cultivar en italique, et signalaient brièvement quand il y avait incertitude sur une orthographe régionale. Le modèle répondait également de manière fiable à l'instruction « ne pas paraphraser les noms IGP » — une fois informé, il restait informé pour la durée de la session.

Le choix ne portait pas sur quel modèle est le « plus intelligent ». Il portait sur quel modèle peut être instruit pour se comporter comme un éditeur soigneux plutôt que comme un auteur confiant.

Termes patrimoniaux que les machines traduisent mal par défaut

Un court catalogue des modes de défaillance enregistrés pendant les trois premiers mois de production.

*Penja* était régulièrement reformulé en « poivre blanc camerounais » — géographiquement exact mais juridiquement vide. Le dossier IGP couvre une seule plaine volcanique du département du Moungo, pas un pays.

*Voatsiperifery* était diversement transcrit *voa-tsipérifère*, *voatsi-péri-féry*, ou simplement « poivre sauvage de Madagascar ». Aucune de ces formes n'est le nom inscrit sur la facture du producteur.

*Tellicherry* était paraphrasé en « poivre indien à grosse baie ». Ce qui efface la spécification de grade — Tellicherry est un calibre de tamis, 4,75 mm et plus, pas un synonyme de « gros ».

*Espelette* était occasionnellement traduit par « piment basque » dans les brouillons anglais. Espelette est un village, une AOC depuis 2000, et une variété précise de *Capsicum annuum*. Le mot « basque » est trop large d'un ordre de grandeur.

*Sansho* — le proche-parent japonais du poivre utilisé dans les glaçages d'*unagi* — était rendu par plusieurs modèles comme « poivre de Sichuan japonais ». Il appartient à un autre genre et produit un profil alcaloïde différent.

Chacune est une correction de cinq secondes une fois qu'un humain la repère. Aucune n'apparaît dans un scoring qualité automatisé. Le corpus était assez grand pour que, sans mécanisme de glossaire, les erreurs aient dépassé notre capacité de relecture manuelle en quelques semaines.

Le glossaire qui a rendu le travail possible

Ce qui a débloqué le flux de travail est un fichier de glossaire bilingue — une liste plate de noms propres, de noms IGP, de cultivars, de régions et de noms de producteurs qui ne doivent jamais être traduits, paraphrasés ou « améliorés ». Environ 800 entrées au moment où l'atlas a atteint 101 ingrédients.

Nous passons ce glossaire au modèle dans le contexte système. Chaque passe de traduction commence par : « les termes suivants sont des noms propres et doivent apparaître à l'identique dans la sortie ». Puis la liste. Puis le texte source.

La discipline que cela impose au modèle est substantielle. La traduction devient une tâche structurée plutôt qu'une tâche créative. La liberté du modèle est limitée à la prose entre les termes protégés. La frontière tient bien chez Claude, moins bien chez GPT, et adéquatement chez DeepL une fois intégrée via son API de glossaire Pro.

Le glossaire fait aussi office de liste de contrôle qualité pour nos relecteurs humains. Un paragraphe traduit qui contient la paraphrase d'un terme du glossaire a, par définition, échoué. La vérification est mécanique.

Quand la bonne réponse est de garder le mot d'origine

Certains termes n'ont pas d'équivalent dans la langue cible parce qu'aucun équivalent n'existe. *Voatsiperifery* en anglais, français, allemand et espagnol reste *voatsiperifery*. *Sansho*, dans les quatre langues, reste *sansho*. *Berbere* reste *berbere*. L'atlas les traite comme des emprunts, en italique à la première mention, et explicités dans le texte environnant plutôt que substitués.

C'est un choix éditorial délibéré qui va à l'encontre du comportement par défaut de la plupart des outils de traduction, qui préfèrent trouver un mot dans la langue cible. La raison est la précision. Un lecteur qui apprend *voatsiperifery* apprend quelque chose qu'il peut chercher, sourcer, et commander. Un lecteur qui lit « poivre sauvage de Madagascar » n'apprend rien d'exploitable.

Ce qui passe encore à travers

Les erreurs pour lesquelles nous n'avons pas encore trouvé de garde-fou automatisé propre tombent dans trois catégories.

La première est la dérive silencieuse du genre en français et en allemand. Une traduction préserve correctement un nom propre mais lui attribue le mauvais article ou un accord d'adjectif erroné. *Le voatsiperifery* est correct ; *la voatsiperifery* ne l'est pas. Ces glissements passent au-delà du contrôle de confiance de chaque modèle.

La deuxième est le nom régional qui existe dans deux orthographes : *Espelette* et *Ezpeleta* (basque), *Kampot* et *Kâmpôt* (avec le signe diacritique khmer), *Cinnamomum verum* et *Cinnamomum zeylanicum* (binôme plus ancien). Choisir la mauvaise variante n'est pas une erreur de traduction en soi, mais elle change la trouvabilité de la page dans l'index de recherche de chaque langue.

La troisième est la métaphore. Quand une source française parle de la *tenue en bouche* d'une épice, la traduction littérale anglaise « hold in the mouth » sonne clinique. La bonne formulation dépend du paragraphe environnant. Aucun modèle que nous avons testé ne gère cela de manière fiable. Ces passages requièrent encore une réécriture humaine, phrase par phrase.

Un atlas multilingue n'est pas terminé quand la dernière phrase est traduite. Il est terminé quand un lecteur à Lyon, à Hambourg, à Madrid et à Boston peut tomber sur la même page, trouver les mêmes noms, les mêmes producteurs, les mêmes dossiers IGP, et croire qu'il regarde le même produit. La traduction, faite avec les bons outils et la bonne discipline, rend cette confiance possible. Mal faite, elle la dissout en silence.

Sources