Cómo construimos un atlas culinario multilingüe con traducción IA

Un grano de pimienta lleva su origen en su nombre. Voatsiperifery es malgache — *voa* significa fruto, *tsiperifery* la liana trepadora que lo produce. Decirlo en francés o en español no cambia lo que es; *pimienta voatsiperifery* deja ambas mitades del nombre intactas porque ninguna palabra europea designa esa misma baya. El problema de la traducción comienza en el instante en que se fuerza un nombre a través de una lengua que no posee el concepto.

Sapor cataloga 101 especias y hierbas de origen único en cuatro idiomas: inglés, francés, alemán, español. Cada ingrediente carga con una región, un expediente IGP o DOP cuando existe, un productor cuando lo conocemos, una fenología, un perfil aromático. Al iniciar el proyecto sabíamos que la traducción sería difícil. No anticipamos que el modo de fallo más frecuente no sería la mala traducción sino el borrado — el nivelamiento sutil de un nombre que significa algo preciso hacia uno que ya no significa nada.

Lo que DeepL hace bien, y dónde se detiene

DeepL sigue siendo el motor más preciso para prosa ordinaria. Su manejo del registro es excelente. Para párrafos descriptivos sobre altitud, lluvia, meses de cosecha o pH del suelo, DeepL produce una salida que podemos publicar con edición ligera.

Se detiene en los nombres propios cuando éstos se alejan de la geografía familiar. DeepL estaba convencido en pruebas iniciales de que *voatsiperifery* era una errata. Corregía silenciosamente el nombre a una palabra fonéticamente más cercana, o sustituía *Karimunda* por una paráfrasis. Ninguno de estos errores es visible sin una revisión experta del dominio.

Comparar los modelos generativos

La elección del modelo de lenguaje grande para la segunda pasada nos llevó más tiempo del esperado. Nuestra propia evaluación, extraída del comparador de herramientas IA que mantenemos donde cada motor se prueba con cuenta de pago durante semanas de trabajo real, terminó decantándose por Claude como el más fiable para traducción editorial cuando se le combina con un prompt preciso.

La diferencia entre los principales motores generativos se reduce a dos comportamientos: con qué agresividad un modelo "mejora" el texto por iniciativa propia, y cómo gestiona la incertidumbre sobre un nombre propio.

GPT tendía a reescribir — añadía florituras estilísticas que se leían como marketing. Para un atlas, es un problema de disciplina. Claude tendía a preservar — mantenía intacto el binomio botánico, conservaba el cultivar en cursiva, señalaba dudas. Respondía de forma fiable a la instrucción "no parafrasear los nombres IGP" y mantenía la regla durante toda la sesión.

Términos patrimoniales que las máquinas traducen mal por defecto

*Penja* fue reformulada repetidamente como "pimienta blanca camerunesa" — geográficamente exacta, jurídicamente vacía. El expediente IGP cubre una sola llanura volcánica del departamento de Moungo, no un país. *Tellicherry* fue parafraseada como "pimienta india de grano grande". Eso borra la especificación de calibre: Tellicherry es un tamaño de tamiz, 4,75 mm o más, no un sinónimo de "grande". *Sansho* — el pariente japonés de la pimienta — fue traducido como "pimienta japonesa de Sichuan". Género diferente, perfil alcaloide diferente.

Cada error se corrige en cinco segundos cuando un humano lo detecta. Ninguno aparece en una puntuación automatizada de calidad.

El glosario que hizo posible el flujo

Lo que desbloqueó el flujo fue un glosario bilingüe — una lista plana de nombres propios, denominaciones IGP, cultivares, regiones y productores que jamás deben traducirse, parafrasearse o "mejorarse". Unas 800 entradas al alcanzar el atlas las 101 fichas.

Pasamos el glosario al modelo en el contexto del sistema. Cada pasada empieza por: "los siguientes términos son nombres propios y deben aparecer textualmente en la salida". Luego la lista. Luego el texto fuente. La traducción se convierte así en una tarea estructurada en lugar de creativa.

Cuando la respuesta correcta es conservar la palabra original

Algunos términos no tienen equivalente en la lengua destino porque no existe. *Voatsiperifery* sigue siendo *voatsiperifery* en los cuatro idiomas. *Sansho* sigue siendo *sansho*. *Berbere* sigue siendo *berbere*. El atlas los trata como préstamos, en cursiva en la primera mención, explicados en el texto que los rodea en vez de sustituirlos. Un lector que aprende *voatsiperifery* aprende algo que puede buscar, encargar y comprar. Un lector que lee "pimienta salvaje de Madagascar" no aprende nada explotable.

Lo que aún se nos escapa

Tres clases de errores escapan a nuestra automatización: la deriva silenciosa de género en francés y alemán, los nombres regionales con doble grafía (*Espelette* / *Ezpeleta*, *Kampot* / *Kâmpôt*, *Cinnamomum verum* / *Cinnamomum zeylanicum*), y las metáforas como *tenue en bouche*, cuya traducción literal suena clínica y exige leer el párrafo entero.

Un atlas multilingüe no termina cuando se traduce la última frase. Termina cuando un lector en Lyon, Hamburgo, Madrid y Boston puede aterrizar en la misma página, encontrar los mismos nombres, los mismos productores, los mismos expedientes IGP, y confiar en que está mirando el mismo producto. La traducción, hecha con las herramientas y la disciplina correctas, hace posible esa confianza. Mal hecha, la disuelve en silencio.

Fuentes