La Tecnología del Lenguaje, campo innovador de la Inteligencia Artificial

1 de junio de 2022

Esta mañana, la Sociedad Española de Procesamiento del Lenguaje Natural (SEPLN) con el apoyo del Departamento de Cultura y Política Lingüística del Gobierno Vasco. y del centro de investigación HiTZ de la UPV/EHU ha celebrado la jornada sobre “Transición Digital Multilingüe en la nueva economía de la Lengua“ en el Palacio de Miramar de Donostia/San Sebastián. El evento ha contado también con la colaboración del CiTIUS de la USC, el CENID, el CEATIC de la Universidad de Jaén y el BSC. Participan en la jornada más de cien personas.

"El lenguaje impulsa la inteligencia humana. El lenguaje es la forma más común y versátil para transmitir y acceder a la información. Usamos el lenguaje, nuestro medio natural de comunicación, para codificar, almacenar, transmitir, compartir y manipular información. La mayor parte de la información digital disponible es información no estructurada en forma de documentos (escritos o hablados) en múltiples idiomas, lo que representa un desafío para cualquier organización que quiera explotar y procesar esta información. Por lo tanto, el lenguaje es y debe estar en el centro de nuestros esfuerzos para desarrollar la Inteligencia Artificial, y viceversa.  La Tecnología del Lenguaje es posiblemente el campo más innovador de la Inteligencia Artificial con un impacto económico de crecimiento acelerado. Desafortunadamente, tal y como demuestran los resultados del proyecto European Language Equality, este notable progreso tecnológico no se desarrolla por igual en todas las lenguas. Existe una distancia abismal entre ellas”, subrayan desde la organización del evento.

En este contexto, el objetivo de esta jornada ha sido dar respuesta a los siguientes retos:

  • Cómo hacer con éxito la transición digital multilingüe; cómo garantizar la pervivencia digital de nuestras lenguas y culturas.
  • Cómo rentabilizar socioeconómicamente el multilingüismo: innovación, servicios, productos y nuevos modelos de negocio. 

Colaboración entre iniciativas públicas es clave

El encuentro ha sido inaugurado por el consejero de Cultura y Política Lingüística del Gobierno Vasco, Bingen Zupiria, la rectora de la UPV/EHU, Eva Ferreira, y el presidente de la SEPLN, Alfonso Ureña. Todos ellos han destacado la importancia de celebrar un evento de estas características contando con la presencia de los responsables de la administración pública, del ámbito industrial y empresarial, y también expertos del ámbito científico y académico. 

El consejero de Cultura y Política Lingüística del Gobierno Vasco, ha señalado como punto de partida de su reflexión que “nuestra sociedad es cada vez más plurilingüe y tecnológica, una realidad que nos lleva a diseñar y ejecutar políticas concretas”. En palabras de Zupiria, “las lenguas deben convivir, grandes y pequeñas; hay espacio para todos, y nuestra obligación es impulsar y llevar a cabo una transición digital exitosa de nuestras lenguas minorizadas”. La integración efectiva del euskera en las tecnologías lingüísticas y en la inteligencia artificial “se centra en el trabajo en común, en el compromiso de las instituciones públicas y en la continua integración del conocimiento y experiencia de los centros de investigación y de las empresas”. Partiendo de este punto de partida, el Departamento de Cultura y Política Lingüística ha puesto en marcha el ‘Plan de Acción de Tecnologías Lingüísticas GAITU 2021-2024’. Se trata de un Plan de Acción Interdepartamental del Gobierno Vasco que recoge los proyectos en marcha y los que se desarrollarán a lo largo de la legislatura. 

La rectora de la UPV/EHU, Eva Ferreira a su vez ha afirmado que “a menudo se habla de la economía global pero no tanto de su irremediable consecuencia: una cultura global. Las lenguas no habitan espacios separados, sino que se superponen, en un mundo donde las fronteras físicas ya han desaparecido y las fronteras políticas, en buena medida, también. Deben construirse puentes entre las distintas lenguas a través de las nuevas tecnologías. Y, en ese sentido, el centro de investigación HiTZ es hoy día una referencia a nivel internacional”. 

En la primera sesión de la jornada se han presentado las iniciativas públicas en marcha sobre Tecnología del Lenguaje. La comisionada especial para la Alianza por la Nueva Economía de la Lengua, Cristina Gallach ha destacado “la necesidad de colaboración iniciativas para el impulso de las lenguas cooficiales en la nueva economía digital, como el proyecto Aina en catalán, el proyecto Gaitu en euskera y Nós en gallego que deben coordinarse con el PERTE para favorecer las sinergias entre las distintas iniciativas y multiplicar su impacto en la sociedad.”; el director de Tecnologías de la Información y la Comunicación del Gobierno Vasco, Xabier Arrieta ha presentado el Plan de acción GAITU; el secretario de Políticas Digitales, Generalidad de Cataluña, David Ferrer ha presentado el Plan de tecnología AINA; el secretario General de Política Lingüística, de la Junta de Galicia, Valentín García el proyecto Nós; y la directora general de Análisis y Políticas Públicas de la Generalidad de Valencia, Ana Berenguer, las iniciativas públicas de la comunidad valenciana.  

En el marco de los fondos de recuperación NextGenerationEU, el 1 de Marzo de 2022 fue aprobado el PERTE ‘Nueva economía de la Lengua’ que se plantea como una oportunidad para aprovechar el potencial del español y de las lenguas cooficiales como factor de crecimiento económico y competitividad internacional en áreas como la IA, la traducción, el aprendizaje, la divulgación cultural, la producción audiovisual, la investigación y la ciencia. Para ello, cuenta con un presupuesto de 1.100 millones de euros de inversión pública, con el objetivo de movilizar otros tantos de inversión privada, dentro de la colaboración público-privada articulada a través de la Alianza para la Nueva Economía de la Lengua. 

Todos los participantes han destacado la importancia del desarrollo conjunto multilingüe, y de la necesidad de apostar de forma decidida por una sociedad multilingüe, y de la imprescindible colaboración en los desarrollos para el español, el catalán, el gallego y el euskara en el marco de las respectivas iniciativas para proporcionar datos, recursos y expertos para realizar con éxito la transición digital multilingüe y garantizar la pervivencia digital de nuestras lenguas y culturas.  

Colaboración Público-Privada

Durante la segunda sesión centrada en la Industria de la Lengua, Diego Vázquez (imaxin|software), Celia Sánchez (1MillionBot), Eudald Camprubí (Nuclia) y Lohitzune Txarola (Langune) han destacado el papel del PERTE como necesario, aunque no suficiente, para llevar a nuestras lenguas a un estado de madurez tecnológica que las sitúe a la vanguardia de la sociedad y economía digitales, y que esto permita a su vez el desarrollo de una industria que pueda liderar incluso a escala mundial los servicios, productos y aplicaciones basados en TL, en particular en español. 

La investigación como clave para liderar la TL

La tercera sesión ha sido moderada por el presidente de la SEPLN Alfonso Ureña y se ha centrado en la Investigación en Tecnología del Lenguaje. Los participantes, todos ellos destacados investigadores, Rodrigo Agerri (HiTZ), Marta Villegas (BSC), Marcos García (CiTIUS) y Rafael Muñoz (CENID) han destacado la importancia del cambio de paradigma que permite traducir más de cien idiomas simultáneamente, crear descripciones de imágenes y fotografías, generar texto indistinguible de la prosa humana, generar guiones de obras de teatro, crear imágenes fotorrealistas a partir de descripciones textuales, proporcionar explicaciones de alta calidad para chistes o sistemas que son capaces de resolver tareas para las que no han sido entrenadas con anterioridad. A pesar de sus impresionantes capacidades, los grandes modelos de lenguaje tienen varios inconvenientes. Actualmente su desarrollo está en manos de grandes multinacionales. Rodrigo Agerri, investigador Ramon y Cajal en el centro HiTZ de la UPV/EHU, subraya que “los modelos más avanzados están disponibles para el inglés, y no está claro que la tecnología actual pueda ser usada con idiomas de menos hablantes. Estos modelos son energéticamente ineficientes y tienen preocupantes sesgos, por ejemplo, de género. Además, no tenemos una comprensión clara de cómo funcionan, cuándo fallan y qué propiedades emergentes presentan. Para poder liderar la TL es imprescindible involucrar a los mejores investigadores del área, dotar esta área de financiación suficiente y promover la colaboración interdisciplinar.” 

La importancia de atraer y capacitar el talento

Durante la última sesión centrada en la formación en Tecnología del Lenguaje, Maite Oronoz (HiTZ) y Maite Martin (CEATIC) han destacado la necesidad urgente de capacitar suficientes expertos en la IA centrada en el lenguaje. “También hacen falta incentivos para atraer talento a esta área, dado que otros países y multinacionales están compitiendo fuertemente por ese talento”, recalca Maite Oronoz, directora del máster Erasmus Mundus en tecnología del lenguaje de la UPV/EHU. “Nunca antes hemos tenido una oportunidad semejante para impulsar la TL en nuestras lenguas y así conseguir realizar con éxito la transición digital multilingüe y garantizar la pervivencia digital de nuestras lenguas y culturas. El reto es lograr rentabilizar socioeconómicamente el multilingüismo: mediante la innovación, la creación de nuevos servicios, productos y modelos de negocio basado en la TL de valor añadido. Tenemos una ventana de oportunidad que tendrá, en todo caso, una duración temporal limitada. En el horizonte del 2025 deberían ser evidentes los resultados del PERTE como plan de choque para la maduración tecnológica de nuestras lenguas. De otro modo se perderá, quizás definitivamente, la oportunidad de que España lidere la economía alrededor de la TL en sus lenguas”, concluye.