Tecnología: traducción automática

Traducción automática

Traducción automática estadística y basada en reglas, usos e implantación de sistemas de traducción automática…

¿Qué es la traducción automática?

 La traducción automática (en inglés MT, por Machine Translation) es el uso de software inteligente capaz de traducir a varios idiomas grandes cantidades de datos fuente. A grandes rasgos, existen tres categorías principales de traducción automática:

Se llama traducción automática “genérica” a una solución pensada para textos no especializados, y se refiere a motores de traducción como el de Google que traduce texto escrito de un idioma a otro, pero que no está enfocado a ninguna área de especialización. Este tipo de traducción lo utilizan usuarios personales o empresas para traducir al instante textos muy cortos. La traducción automática genérica suele contener más errores gramaticales y sintácticos y es mucho menos precisa que la traducción automática “a medida”.

La traducción automática “a medida” requiere que el software de traducción sea “entrenado” o adaptado para reconocer expresiones propias de un campo, industria o empresa específica. Por medio de estadísticas básicas o de tecnologías de traducción basadas en reglas, la traducción automática “a medida” ofrece a las empresas un alto nivel de precisión con un volumen alto.  No obstante, incluso en los casos en que estos motores van unidos a un procesamiento previo de datos y a una interfaz de usuario amigable, la calidad de la traducción puede verse comprometida por las limitaciones propias de la tecnología de traducción empleada.

La traducción automática “corporativa” se constituye como la próxima generación de motores de traducción automática “aumentada”. Emplean una sofisticada tecnología que reproduce el estilo, el formato y la terminología de forma más fiel que otras soluciones. La traducción automática “corporativa” responde a las necesidades de los actuales negocios internacionales, como un gran volumen y una alta velocidad en la localización y en las comunicaciones multilingües en tiempo real.

Traducción Automática: ¿“General”, “A medida” o “Corporativa”? Si bien las tres categorías descritas pueden emplear motores basados en estadísticas, existen importantes diferencias de rendimiento. Los motores de traducción automática “genérica” incorporan cantidades ingentes de datos con la esperanza de que con el tiempo mejore la calidad. No disponen de tecnologías que permitan aportar a las traducciones sutilezas sintácticas o estilísticas del lenguaje corporativo de la empresa.  Las soluciones hechas “a medida”, que “enseñan” o alimentan” a los motores, ofrecen traducciones de mejor calidad y ésta depende directamente de la calidad de los datos incorporados. También presentan limitaciones debidas al efecto de “dilución de datos” y a la tecnología de traducción automática empleada.

Si las comparamos, la traducción automática “corporativa”, gracias a estas tecnologías aumentadas, está diseñada para superar algunas limitaciones de los motores basados en estadísticas, como son los problemas de formato o de adecuación al manual de estilo empleado por la empresa.

¿Cuáles son los principales tipos de traducción automática?

Los sistemas de traducción automática basada en reglas emplean una serie de reglas desarrolladas manualmente por expertos que reflejan en el idioma de destino las estructuras del idioma de origen. El factor humano en los sistemas basados en reglas ayuda a ofrecer traducciones automáticas bastante buenas con resultados predecibles. No obstante, este costoso trabajo manual hace que los sistemas basados en reglas sean muy caros y muy complejos de implantar y mantener. A medida que se añaden reglas y se actualizan, estos sistemas corren el peligro de generar ambigüedades y de que la calidad de sus traducciones empeore.

Los sistemas de traducción automática estadística utilizan algoritmos informáticos para producir la mejor traducción estadísticamente posible a partir de millones de combinaciones. Los modelos estadísticos constan de palabras y frases aprendidas automáticamente a partir de segmentos bilingües correlativos con que se crean bases de datos bilingües de traducciones. El atractivo de los sistemas estadísticos reside en el nivel de automatización, ya que se generan nuevos motores en que se aprovecha su capacidad de aprendizaje. El resultado son unos rápidos tiempos de respuesta y un bajo coste para la implantación y gestión de estos modelos estadísticos. El mayor inconveniente de este tipo de motores es el efecto de “dilución de datos” provocado por la escasez de datos que “alimenten” o “entrenen” a unos sistemas basados en datos.

Traducción automática híbrida. Para abordar las limitaciones de calidad y plazos de comercialización, muchos desarrolladores de motores basados en reglas están mejorando su tecnología combinándola con traducción automática estadística, y han creado soluciones híbridas. Los sistemas híbridos ofrecen considerables mejoras de calidad, pero los costes de los sistemas basados en reglas son caros. A esto se añade la complejidad de combinar ambos sistemas.

La nueva generación. Los nuevos motores de traducción automática “aumentada” están mejorando las posibilidades de la traducción automática estadística y superando sus limitaciones. Estas nuevas soluciones de traducción automática estadística introducen sofisticados sistemas de pre-procesamiento de datos (transformación del lenguaje), tecnologías de optimización del idioma y soluciones de gestión terminológica. Este tipo de motores quieren incorporar las mejoras de calidad propias de los sistemas híbridos.

¿A quién está destinada la traducción automática?

Hoy en día la traducción automática se está extendiendo entre usuarios y empresas. Muchos consumidores la utilizan para obtener traducciones al momento, y las grandes multinacionales la incorporan para comunicarse con clientes y empleados ubicados en cualquier parte del mundo.

Lo cierto es que la traducción automática es realmente de utilidad para grandes empresas multinacionales que necesiten traducir cantidades realmente ingentes de contenido, como manuales de usuario y complejas páginas web multilingües que actualizan su contenido continuamente.  Las grandes corporaciones que inician una fase de localización utilizan la traducción automática para localizar periódicamente su contenido a varios idiomas. Otras empresas que ofrecen ayuda y soporte al usuario a través de chats o de webs de redes sociales, utilizan la traducción automática para ofrecer una experiencia de usuario más personalizada.

La traducción automática también la utilizan algunas agencias de traducción, siempre combinada con una fase posterior de corrección y edición por traductores humanos.

¿Es la traducción automática “lo bastante buena”?

En realidad cabría preguntarse, ¿bastante buena para qué? En la mayoría de casos, y si la calidad de la traducción automática es lo suficientemente buena, se requerirá una fase de post-edición por un traductor humano. Por ejemplo, si el contenido va a ser publicado es imprescindible que el resultado de la traducción automática sea revisado y editado por un humano.  En otros casos, como en las comunicaciones en tiempo real y en traducciones que necesitemos para hacernos una idea de qué se está hablando, una traducción automática “que se entienda” será lo suficientemente buena, y no habrá tiempo ni medios para que un humano edite la traducción.

La traducción automática “corporativa”, enfocada a grandes corporaciones con un lenguaje más o menos controlado y un manual de estilo predefinido, es capaz de producir traducciones automáticas de bastante calidad en que el factor humano puede llegar a ser mínimo, mejorando así la relación coste-eficacia. Las tecnologías de traducción automática “aumentada” son capaces de producir traducciones específicas para una empresa, un mercado y una marca concreta. Para ello se utiliza la traducción automática basada en reglas y la estadística, alineando grandes volúmenes de traducciones y material traducido por la propia empresa. Evidentemente, el uso de estos motores de traducción no es barato.