Servicios-Cultura y Creatividad

GoienaHoTTS

Desarrollo de una herramienta que permite escuchar textos escritos, en este caso noticias, con una voz sintética natural que imita la prosodia y el estilo de los periodistas. Haciendo más accesibles los medios de comunicación escritos entre personas con problemas de visión.

Ver más
  • Actividad

    Descripción de la actividad de la organización

    La misión de Goeina es la comunicación y la comunidad: En papel, Revista Goiena y PUNTUA; Televisión; goiena.eus, radio, aplicación de revistas ZUT y revista digital Ttap.

    Sector

    Actividades de programación y emisión de televisión

    Nº de personas empleadas

    52

    Localización

    Otalora lizentziaduna 31. Arrasate, 20690, Arrasate - Mondragón, Gipuzkoa
  • Argumento

    Antecedentes

    Hace 23 años comenzó la difusión masiva de contenidos de Goiena (revistas, televisión, radio, web). El objetivo es llegar al mayor número de personas posible, buscando que la accesibilidad de los productos que ofrecen sea la máxima posible. En los últimos años algunos medios de comunicación han solido instalar sistemas de escucha de noticias escritas, pero no eran voces naturales, eran exentas de emoción. Para dar respuesta a la necesidad, se ha desarrollado una voz sintética natural en euskera, basada en la inteligencia artificial, que tiene en cuenta la entonación adecuada y las emociones.

    Reto

    El principal reto del proyecto de Goiena ha sido conseguir un sistema de locución artificial que imite adecuadamente la prosodia y el estilo de una persona al leer una noticia y alejarse así de las herramientas de las voces sintéticas que no reflejan una sensación y entonación directas. Además, el desarrollo de la voz sintética natural se ha basado en una lengua que no tiene similitudes y que es minoritaria, para la que no existía un modelo, lo que ha obligado a realizar un esfuerzo añadido.

    Razones para ser considerado un Caso Práctico de Innovación

    Porque es la primera herramienta que, aplicando técnicas avanzadas de inteligencia artificial y estrategias tecnológicas de aprendizaje profundo, permite a las personas, especialmente a las personas con dificultades lectoras acceder a noticias narradas oralmente a través de una voz sintética similar a la humana. Esa voz sintética tiene en cuenta la entonación adecuada y las emociones propias de cada noticia en función de las voces periodísticas que hay en la realidad.

  • Descripción

    El Grupo de Comunicación Goiena es una cooperativa de comunicación multimedia en euskera de 52 trabajadores ubicada en Debagoiena. La empresa distribuye su actividad en los siguientes medios de comunicación: Televisión Goiena, Revista Goiena, el semanario Puntua, la página web de Goiena y Arrasate Irratia.

    Goiena tiene una responsabilidad con el desarrollo social y lingüístico y así lo recoge en su estrategia. Entre los objetivos marcados se encuentra el desarrollo e implantación en euskera de las oportunidades que ofrece la tecnología, entre las que se encuentran las acciones dirigidas a mejorar la accesibilidad. En este sentido, Goiena identificó el reto de dar respuesta a las necesidades de las personas con dificultades lectoras (personas ciegas o con problemas de visión) para recibir información local en euskera. Identificó la necesidad de mejorar las herramientas de voces sintéticas existentes para leer noticias y gracias a las posibilidades que ofrecía la tecnología vieron en estas voces la posibilidad de interiorizar las emociones con diferentes entonaciones.

    Colaboraron con Orai NLP Teknologiak, experta en dar respuesta a los retos de inteligencia artificial para la realización del trabajo. La tecnología utilizada fue el aprendizaje profundo o deep learning a través de IA. Lo primero que había que hacer era crear ejemplos en determinados corpus de una manera muy elocuente. Para ello, 3 periodistas de Goiena grabaron horas de audio y los corpus creados con estas grabaciones se entrenaron a través de diferentes algoritmos, es decir, se creó una arquitectura neuronal. Al final se consiguió GoienaHotts, una voz sintética natural en términos de expresividad y naturalidad.

    Para desarrollar la herramientza fue necesaria la labor de 10 personas: Los periodistas de Goiena pusieron voz y los ingenieros de Orain NLP realizaron el marco tecnológico (algoritmos, entrenamiento de la herramienta...). En cuanto a los recursos económicos, Goiena realizó toda la inversión.

    El resultado obtenido ha sido muy positivo, y al contrario que hasta ahora, se ha conseguido una voz sintética natural capaz de leer los textos con emoción. De hecho, las noticias escritas disponibles en la web de Goiena ya se pueden escuchar con la voz sintética.

    De cara al futuro, la herramienta ofrece muchas posibilidades, no sola en medios de comunicación, sino empresas de cualquier sector pueden adaptar la voz sintética natural a sus necesidades. Por ejemplo, para interiorizar voces en documentales en el sector cultural, en máquinas del sector industrial, para incorporar explicaciones en ellas y para sustituir las voces de personas que se utilizan en ascensores o comercios. En este momento siguen probando estas posibilidades y los desarrollos vendrán más adelante.

  • Acciones

    1. En 2021 se celebró una junta de los medios de comunicación íntegramente en euskera, en la que se debatió cómo debería de hacerse el tratamiento de la lengua. Allí se dieron cuenta de que la tecnología permitía crear una herramienta para mejorar la accesibilidad a los medios de comunicación.
    2. Goiena decidió que las posibilidades de las voces sintéticas ya existentes se podían mejorar a través de tecnología y puso en marcha un proyecto para conseguir una voz sintética natural con diferentes entonaciones y emociones. Para llevar a cabo el proyecto, se puso en contacto con la empresa Orai NLP, experta en inteligencia artificial, porque consideraban que para que el tratamiento del euskera fuera el adecuado, la herramienta debía realizarse en Euskadi con tecnología local.
    3. El 1º paso fue grabar las voces de 3 periodistas de Goiena para recoger diferentes entonaciones y formas de expresión. Con todas las grabaciones de los periodistas se creó el corpus con los ejemplos.
    4. Una vez creado el corpus, la empresa Orain utilizó algoritmos y arquitecturas neuronales de aprendizaje profundo que se utilizan para la síntesis del habla para entrenar la herramienta. Crearon patrones a través de redes neuronales y todo eso se trasladó a la producción. Es decir, una vez creada la tecnología, se construyó el puente entre la infraestructura existente en la web y esa tecnología.
    5. Tras evaluar el resultado obtenido se construyeron voces personalizadas o clonadas.
    6. El último paso fue poner la herramienta de la voz sintética natural a disposición de todos y todas en la web de Goiena.

  • Resultados

    □ La herramienta diseñada y desarrollada por Goiena ha permitido que el trabajo que realiza el medio de comunicación tenga una mayor difusión, especialmente entre personas que no tienen facilidad lectora o prefieren escuchar las noticias en forma de podcast antes que leerlas. Es decir, con la herramienta se mejora y garantiza la accesibilidad.
    □ Se ha creado una síntesis neuronal del habla que imita el estilo y la prosodia de tres periodistas de Goiena.
    □ Para poder entrenar la herramienta se han conseguido aplicar técnicas de última generación de inteligencia artificial y red neuronal.
    □ Ya se ha incorporado la barra de herramientas de escucha de textos en la web de Goiena y se pueden escuchar todas las noticias creadas, eligiendo la que se prefiere entre las voces de los tres periodistas
    □ El propio modelo de voz sintética natural GoienaHoTTs es el resultado del proyecto. Se busca la puesta a disposición del modelo desarrollado en otras empresas, no sólo en otros medios de comunicación, sino en empresas de cualquier sector: cultura (documentales), establecimientos comerciales, maquinaria de empresas industriales o ascensores, entre otros. A pesar de que la herramienta aún no está implantada en otros medios de comunicación o empresas, los diferentes medios y empresas de otros sectores ya han mostrado su interés por implantar la herramienta en sus organizaciones.

  • Contacto

    Iban Arantzabal Arrieta (zuzendaria)

    943250505

    [email protected]

    Testimonios

    Iban Arantzabal (Director de Goiena):
    "La lectura de los textos de goiena.eus se ha realizado utilizando la inteligencia artificial y las redes neuronales. Noticias, texto de galerías de fotografías, textos de vídeos… Síntesis vocal aplicada.”

    Josu Aztiria (coordinador de la empresa Orai NLP Teknologiak):
    “Es importante que nosotros, desde el euskera, dispongamos y desarrollemos nuestros propios recursos tecnológicos para que el tratamiento del euskera sea adecuado y con nuestros recursos se ha conseguido imitar las voces de diferentes periodistas y conseguir una agradable sensación de escucha de noticias.”

  • Soluciones relacionadas
    No hay soluciones asociadas