Linguaserve (www.linguaserve.com), compañía especializada en traducción, servicios lingüísticos y soluciones multilingües de última generación, ha desarrollado un proyecto de actuación en colaboración con la Agencia Tributaria (AEAT) para fomentar el multilingüismo de su portal web (http://www.agenciatributaria.es/).

Linguaserve, en colaboración con Lucy Software y Dublin City University, ha creado el caso de uso Online MT Internationalization con HTML5 e ITS 2.0 dentro del proyecto MLW-LT (Multilingual Web-Language Technology), una iniciativa financiada por el Séptimo Programa Marco de la Unión Europea cuyo objetivo es sentar las bases para la integración de las tecnologías de la lengua en el núcleo de las tecnologías web mediante la creación de un estándar que define tres clases de metadatos: información en el contenido de la web que sea relevante para el procesamiento de tecnología del lenguaje; procesos para la creación de contenido web mediante la localización y gestión del contenido de los flujos de trabajo; y aplicaciones de tecnología del lenguaje y recursos empleados en estas aplicaciones.

MLW-LT cuenta con la colaboración e impulso del World Wide Web Consortium (W3C), organismo internacional que trabaja para el desarrollo de estándares web con el objetivo de guiar a Internet hacia su máximo potencial a través de la implementación de protocolos y pautas que aseguren su crecimiento futuro. Precisamente la recomendación del W3C, denominada Internationalization Tag Set 2.0 (ITS 2.0), facilita y optimiza la creación, el procesamiento y el control de los procesos de traducción y localización multilingüe, entre otros, de contenidos web.

La descripción de ITS 2.0 se puede encontrar en http://www.w3.org/TR/its20/. Esta especificación es estable en términos de contenido técnico y pronto será un estándar de la W3C, cuya aplicación puede verse en el informe de implementación del grupo de trabajo en
http://www.w3.org/International/multilingualweb/lt/drafts/its20/its20-implementation-report.html.

Centrando su atención en los sistemas de publicación multilingüe en tiempo real, el proyecto para la Agencia Tributaria ha permitido adaptar el sistema aplicado ya anteriormente en su web (ATLAS RealTime de Linguaserve) al nuevo estándar ITS 2.0 y aplicarlo, junto con la propia AEAT, al formato HTML5. El sistema ATLAS RealTime incorpora además sistemas de traducción automática basada en reglas (Lucy LT) y estadística (MaTrEx de la Dublin City University).

El proyecto se enmarca en la decidida apuesta por el multilingüismo de la AEAT. Ya en 2005 Linguaserve implantó una pasarela tecnológica que conectaba su sistema Global Business Connector Server (GBC Server) al sistema de gestión documental de la Agencia Tributaria para automatizar la gestión de cartas y documentos para la traducción profesional. Gracias a la Extranet de GBC, la AEAT podía acceder a los servicios de traducción de Linguaserve, así como interactuar de una manera sencilla con el workflow de producción de estos servicios.

En línea con esta actuación, desde el año 2010 la Agencia cuenta con una web multilingüe en la que está implantado el sistema en tiempo real ATLAS RealTime de Linguaserve, que incorpora los motores de traducción automática de Lucy Software, caracterizados por su calidad y elevadas prestaciones. En la actualidad los contenidos del portal son accesibles en español, catalán, gallego, valenciano e inglés y representan un volumen de más de cinco millones de palabras. Este sistema de publicación web multilingüe en tiempo real consiste en una plataforma no intrusiva que convive en paralelo al sistema a traducir. A partir de la base en castellano, toda la web incorpora traducción automática con post-edición parcial al catalán, gallego y valenciano. Asimismo, la parte internacional de la web en inglés incorpora traducción automática post-editada al cien por cien.

De manera paralela, Linguaserve también aporta a la Agencia Tributaria una solución de traducción basa en interoperabilidad para la gestión y producción de contenidos multilingües, así como una consultoría de servicios lingüísticos y de localización de contenidos web.

ATLAS RealTime es instalable, configurable e integrable con las instalaciones de la Agencia Tributaria. Entre otros rasgos particularmente remarcables figuran los siguientes: el sistema es totalmente escalable; tiene la capacidad para albergarse tanto en servidores físicos como virtuales; se instala en servidores web Apache; cuenta con granjas de traductores automáticos; incorpora funcionalidades de balance y balanceo de bases de datos; y dispone de configuración activo/activo.

Como gran ventaja competitiva adicional, ATLAS RealTime garantiza a la Agencia Tributaria que no hace falta manipular lo que se entrega. De esta manera se reduce de manera significativa la complejidad del proceso y los tiempos de preparación del material traducido. Asimismo, el sistema dispone de caché de aceleración capaz de detectar cambios en la página para su retraducción y para hacer accesibles las páginas traducidas a buscadores, facilitando así el desarrollo de todo tipo de estrategias de posicionamiento SEO y SEM, con compatibilidad con enrutadores y sistemas de caché tipo Akamai.

La solución desarrollada plantea dos tipos de nuevos servicios lingüísticos: la post-edición y la terminología aplicada a este tipo de sistemas. En el caso de la primera, conviene advertir que todas las combinaciones requieren un testeo y la revisión de un porcentaje suficiente y de partes especialmente relevantes del contenido (el nivel de post-edición aquilata la calidad demandada); en lo que atañe a la segunda, se requiere una ampliación continua paulatina de los glosarios y léxicos y su codificación en el sistema de traducción automática para mejorar la calidad (nuevos contenidos o nuevas directrices suponen también tareas de mantenimiento de terminología).

Ahora, la integración en el proyecto MLW-LT supone un nuevo paso hacia delante para la Agencia Tributaria, ya que le permitirá beneficiarse de un entorno que facilitará la creación web en los idiomas del mundo, desarrollando métodos estándar para permitir la traducción (automática y manual) y la adaptación de contenidos web a sus necesidades específicas.

Además, se prevé la implantación de soluciones mixtas basadas en sistemas de publicación multilingüe en tiempo real en combinación con sistemas de interoperabilidad con características de sistemas expertos inteligentes, que dispondrán de controles semiautomáticos y automáticos de control de calidad. Todo ello redundará en facilitar la publicación web multilingüe para la empresa española exportadora de forma más potente y caracterizada por una disminución en los plazos, un aumento en los niveles de productividad y un menor coste económico. Esta tecnología abre además posibilidades para las PYMES de acceder de una forma sencilla y asequible para disponer de sus sitios web multilingües siempre actualizados y competir así en un mundo cada vez más globalizado.

Enlaces