141 – Traducción automática, ¿enemiga o aliada? – Rubén de la Fuente

La traducción automática llegó para quedarse y de eso ya no quedan dudas, ¿no? Pero a no desanimarse, que la idea es sacarle provecho y no irse a llorar al rincón. Para entender un poquito más cómo podemos amigarnos con ella invitamos a Rubén de la Fuente.

Rubén de la Fuente estudió latín y griego en la secundaria. Se licenció en Traducción e Interpretación en la Universidad de Granada, lo que le permitió disfrutar cursos de intercambio en Dinamarca y Estados Unidos, así como realizar prácticas de traducción en la Comisión Europea. Confiesa que quería ser traductor literario, pero al terminar la carrera empezó a trabajar en localización de programas informáticos y así fue como creció su interés por la tecnología.

Su primer encuentro con la traducción automática fue como evaluador, pero pronto pasó al otro lado y dedicó 7 años a crear motores personalizados en muchos pares de idiomas. Actualmente trabaja como científico de datos e intenta mejorar la experiencia de usuario mediante el procesamiento del lenguaje natural y la visualización de datos.

Estamos escuchando por todo lados esto de la ciencia de datos (no sé ustedes, yo lo veo hasta en la sopa). Rubén nos explica que hay varios perfiles de científicos de datos y que, como él viene de las letras, está más enfocado a temas que están relacionados con la lingüística computacional. Por ejemplo, si tenés un montón de opiniones de clientes, podés analizar qué temas recurrentes sacar de ahí que te ayuden a mejorar la experiencia del usuario con tu producto o tu servicio.

En cuanto a la traducción automática, Rubén dice que es más vieja de lo que creemos, pero que ahora se dan determinadas condiciones para que esta automatización dé mejores resultados, y por ende, tenga más presencia o repercusión. Él trabajó con tres tecnologías distintas de traducción automática: 1) La traducción automática basada en reglas, que es un diccionario y unas reglas de transferencia; 2) la traducción automática estadística, que aprende las equivalencias a partir de un corpus bilingüe (que suelen ser las memorias de traducción); y la 3) traducción automática neuronal, que está basada en redes neuronales, y es como una evolución de la estadística, capaz de capturar más cosas.

Ahora bien, dentro de la traducción automática, hay distintos tipos de tecnología: están los motores genéricos y los motores personalizados. O sea, Google Translate es un modelo genérico, pero incluso dentro de Google, podés subir tus memorias de traducción y crear un motor personalizado para un determinado dominio o para un determinado cliente. Incluso, agrega, si se utiliza bien la traducción automática, lo ideal es tener un motor personalizado por cliente y, dentro del cliente, por especialidad.

¿Hay algún tipo de industria o de contenido que sea más compatible con la traducción automática? Rubén cree que, si bien se usa en casi todos los sectores hoy en día, es cuestión de evaluar cada caso particular. Quizás uno creería que no se podría aplicar traducción automática en medicina, y sin embargo él cita el ejemplo de la Organización Panamericana de la Salud que tiene su propio motor de traducción automática especializada en temas médicos. En la Unión Europea, por ejemplo, tienen un motor propio para traducir sus textos legislativos. Entonces, no es tanto una cuestión del tema, sino más bien de cuántos datos tenés para entrenar al motor o qué conocimiento tenés para crear un motor personalizado.

Su postura es que no es cuestión de pensarlo como «nosotros o la máquina» sino más bien de ver cómo la máquina nos puede potenciar a nosotros. Y no necesariamente para traducir más rápido, sino que al automatizar algunos procesos repetitivos, se puede mejorar la calidad. Según un estudio que se llevó a cabo en la Unión Europea, los traductores no tardaban menos en hacer el trabajo, sino que dedicaban el tiempo a revisar mejor.

La cuestión es que es imposible no preocuparse o no sentir que nos pasa por encima una ola gigante que no terminamos de entender. ¿Dónde quedarán mi estilo y mi creatividad? ¿Me tendré que dedicar para siempre a revisar y nada más? ¿Cómo se cobra esto? ¿Es justo lo que me están ofreciendo por hacer este trabajo? Ya sabemos que hay más preguntas que certezas.

Su propuesta es que hay que probarlo. Dice que él creó motores personalizados para 20 idiomas distintos y que, si bien no funcionan igual de bien en todas las lenguas, él les proponía a los traductores que lo probaran un par de meses y después le dijeran qué les parecía. Parece ser que tiene unos cuantos conversos en su haber.

En cuanto a cómo se cobran estos trabajos, su propuesta es un poco similar: familiarizarse con la tecnología, ver qué posibilidades tiene y aprender a valuar lo que nos puede redituar. Como consejo práctico Rubén propone que comparemos la ganancia por hora con cada modalidad (con y sin TA). Incluso dice que las CAT tools tienen una funcionalidad que te permite llevar un registro del tiempo que te toma hacer un trabajo. El secreto, dice Rubén, es que nos armemos de conocimientos para poder valuar nuestro trabajo. Porque, aunque suene antipático, toda esta sensación de desconfianza y de río revuelto sobre el tema puede deberse a que llegamos tarde y algunas cuestiones se impusieron en el mercado.

En cuanto a la posedición, Rubén recuerda que cuando trabajaba con traducción automática, esta le parecía el “Lejano Oeste”, más que nada porque cada cual tenía su interpretación, y cuando trataban de definirla, se generaba más confusión todavía.

Hay quienes distinguen entre posedición mínima, que corrige sólo lo indispensable, y posedición completa, en la que se espera que tengas el mismo nivel de calidad que si tradujeras desde cero. En su visión personal, la posedición no es muy distinta de editar fuzzy matches, y aconseja automatizar la corrección de un texto si trabajamos asiduamente con un cliente que comete errores similares.

Aquí les dejo un link que nos compartió de su charla para la ATA, para quien guste ahondar en el tema:

https://www.researchgate.net/publication/303564681_A_Comparative_Study_of_Post-editing_Guidelines

También podés seguirlo en sus redes y enterarte de sus próximas charlas sobre el tema https://www.linkedin.com/in/rubendelafuente/.