Departamento de Gobernanza, Administración Digital y Autogobierno

Sistema de traducción de textos

Descripción

Servicio de traducción de textos entre varias lenguas: euskera a castellano/francés/inglés y viceversa.
Organismo:
Cultura y Política Lingüística - Dirección de Promoción de Euskera.
Responsable:
Miren Josune Irabien Marigorta.
Contacto:
Datos de contacto.
Organismo o entidad responsable a nivel técnico:
EJIE - Soporte al Negocio.
Dominio:
Euskera.
Estado del algoritmo o sistema:
Productivo.
Fecha de implantación:
2020
Socio/empresa proveedora:
Vicomtech.

Más información

Con qué datos se está entrenando el sistema algorítmico y qué datos se procesan cuando está en uso.

Título del conjunto de datos URL (si es pública) Propósito de utilizar los datos en el modelo
Memorias de traducción https://www.ivap.euskadi.eus/izo-traducciones/ Alimentar el modelo
Diccionario Elhuyar https://hiztegiak.elhuyar.eus/ (abre en nueva ventana) Traducir una o dos palabras
Euskalterm Banco terminológico https://ivap.euskadi.eus/euskalterm/ (abre en nueva ventana) Alimentar el modelo
EHU Euskal Institutua ttps://www.ehu.eus/es/web/eins/home (abre en nueva ventana) Alimentar el modelo
Asociación EIZIE https://eizie.eus/es/ (abre en nueva ventana) Alimentar el modelo
AENOR https://www.aenor.com/ (abre en nueva ventana) Alimentar el modelo
eLiburutegia https://www.euskadi.eus/ac37aELiburutegiaPublicaWar/ (abre en nueva ventana) Alimentar el modelo

Se explica de qué forma el sistema procesa automáticamente los datos de entrada para generar los resultados del modelo.

Tecnología utilizada:
MarianNMT
Tipo de algoritmo:
Algoritmo de clasificación no supervisada.
Descripción del algoritmo:
Algoritmo de clasificación no supervisado.
Descripción del algoritmo:
Implantación C++
Un motor para entrenar y decodificar la GPU/CPU.
Formación rápida en GPU y traducción conjunta en GPU/CPU
Dependencia mínima del software externo: CUDA 
Código fuente y auditoría independiente:
Marian es un marco eficaz y libre de la Máquina de Traducción Neuronal, escrito en C++, con dependencias mínimas. Está siendo desarrollado principalmente por el grupo Microsoft Translator. Muchos académicos (sobre todo la Universidad de Edimburgo y en el pasado la Universidad Adam Mickiewicz de Poznaouse) y muchos colaboradores comerciales contribuyen a su desarrollo. En la actualidad, Microsoft Translator es el motor detrás de los servicios de Neural Machine Translation y es desplegado por muchas empresas, organizaciones y proyectos de investigación (ver lista incompleta a continuación)

Se explica, si procede, si ha sido necesario implantar alguna medida para promover la igualdad y la no discriminación por motivos de edad, origen, nacionalidad, idioma, religión, creencia, opinión, actividad política, etc.

Ninguno. El código fuente es propiedad del proveedor en la empresa, el Gobierno no lo ha comprado ni lo tiene disponible. No hay posibilidad de traspasarnoslo.

Se explica de qué forma las personas están al tanto o controlan el sistema, asegurándose de que no produzca efectos adversos o no deseados.

Las traducciones se basan en varios textos y en la mayoría de los textos se han tenido en cuenta criterios de igualdad y discriminación, pero no en todos ellos (sobre todo si son antiguos). Por lo general, las traducciones de textos tienen criterios correctos, pero cuando se detecta que no se han seguido, se hace llegar a la empresa proveedora una solicitud de entrenamiento del modelo para que las traducciones tengan en cuenta estos criterios.
Con la respuesta de la empresa, se realizan pruebas en EJIE hasta asegurarse de que se siguen los criterios.
Se han tenido en cuenta las necesidades de los discapacitados por la disponibilidad de servicios de transcripción y síntesis de voz.

Riesgos conocidos asociados con el sistema y los métodos utilizados para mitigarlos.

No procede. El sistema no necesita supervisión. Tiene plena autonomía.

Fecha de última modificación: