Chatbot Canal Web de Encuestas

Catálogo de algoritmos y sistemas de Inteligencia Artificial del Sector Público de la CAE

Descripción

Herramienta informática que utiliza la inteligencia artificial generativa para mantener una conversación con los usuarios en tiempo real y ayudar en las dudas a la hora de rellenar una encuesta de Eustat a la ciudadanía o empresas de Euskadi.

Organismo:

Economía, Trabajo y Empleo - EUSTAT - Instituto Vasco de Estadística.

Responsable:

Belen Muñiz Villanueva.

Contacto:

Datos de contacto.

Organismo o entidad responsable a nivel técnico:

EUSTAT - Instituto Vasco de Estadística.

Dominio:

Atención a la ciudadanía.

Estado del algoritmo o sistema:

Piloto.

Fecha de implantación:

2025.

Socio/empresa proveedora:

WeAreClickers SL.

Más información

Con qué datos se está entrenando el sistema algorítmico y qué datos se procesan cuando está en uso.

Título del conjunto de datos	URL (si es pública)	Propósito de utilizar los datos en el modelo
Manual de rellenado de la encuesta		BBDD conocimiento
Glosario de términos EUSTAT y del ámbito de la encuesta.	https://www.eustat.eus/estadisticas/opt_1/temalista.html	BBDD conocimiento
Plantilla de los cuestionarios a rellenar	https://www.eustat.eus/estadisticas/opt_1/temalista.html	BBDD conocimiento
Preguntas del encuestado		Datos procesados en uso

Se explica de qué forma el sistema procesa automáticamente los datos de entrada para generar los resultados del modelo.

Tecnología utilizada:

Chat GPT de OpenAI

Tipo de algoritmo:

Generativo (Transformers)

Descripción del algoritmo:

Utilizaremos el modelo de lenguaje extendido (LLM) de OpenAI para que este interactue con el usuario y le facilite información relativa a la encuesta en curso. Para ello, previamente se le pasa un conjunto de datos que conformará su base de conocimiento y se configura el modelo para que sólo responda sobre esta información.

Código fuente y auditoría independiente:

No se publica su código fuente desde la versión 2. En estos momentos es de uso abierto, pero no publica su código fuente.

Se explica, si procede, si ha sido necesario implantar alguna medida para promover la igualdad y la no discriminación por motivos de edad, origen, nacionalidad, idioma, religión, creencia, opinión, actividad política, etc.

No se ha considerado necesario implantar medidas de sesgo injusto, ya que el uso del modelo no prevé resultados que puedan contener sesgo de la tipología indicada. Y en el hipotético caso de que se diera, el propio modelo implementa herramientas de salvaguarda frente a sesgos (no generación de frases ofensivas o discriminatorias, evitar estereotipos, ...). En cuanto a la accesibilidad, el sistema se utiliza a través de la web de Eustat, que es la que debe velar por el cumplimiento de las condiciones mínimas de accesibilidad que dicta el RD 1112/2018, sobre accesibilidad de los sitios web.

Se explica de qué forma las personas están al tanto o controlan el sistema, asegurándose de que no produzca efectos adversos o no deseados.

El chatbot de Eustat ha sido probado y entrenado por nuestro personal, para intentar que conteste sólo a las preguntas que sean pertinentes en el rellenado de la encuesta. No obstante, el sistema es generativo por lo que puede inferir a partir de la base de conocimiento facilitada y contestar a preguntas no previstas. Asimismo, está prevista la creación de un log de las conversaciones, que será revisado por el responsable de la encuesta para mejorar las respuestas del chatbot e inmediatamente eliminado. El modelo generativo de respuestas a partir de preguntas es obtenido mediante aprendizaje por refuerzo de personal en OpenAI. En caso de cualquier problema con el chatbot, el encuestado puede contactar con Eustat por los medios habituales (correo electrónico, formulario, ...).

Riesgos conocidos asociados con el sistema y los métodos utilizados para mitigarlos.

Descripción:

Se han identificados una serie de riesgos y se han tomado medidas para mitigarlos (por orden de los riesgos detallados en la siguiente casilla):

Mediante la supervisión posterior de las preguntas y respuestas realizadas se intentará ver cómo ayudar al modelo a comprender preguntas comunes.

Se ha minimizado la base de conocimientos del modelo para que no "invente" y en sus respuestas solo se puede ceñir a lo existente en ella.

Se ha firmado con WeAreClickes un contrato y con OpenAI un acuerdo de procesamiento de datos, de forma que las conversaciones se usen sólo para responder las personas usuarias (no para entrenar sus modelos).

En Eustat se ha establecido un supervisión de los logs y realización de pruebas anual, para garantizar un mínimo de calidad en las respuestas del chatbot.

Riesgos conocidos:

No compresión de las preguntas.

Respuestas erróneas, falsas o que inciten a realizar acciones indebidas (p.ej. descargar malware).

Tratamiento de datos por parte del proveedor (OpenAI).

Necesitan supervisión continua, ya que el modelo LLM en que se basa está en continua evolución.

Fecha de última modificación: 06/02/2025

Gobernanza de los datos

Descripción

Más información