Servicios tecnológicos/I+D

Solución de transcripción y traducción de eventos y reuniones en tiempo real

Partiendo de tecnologías que hasta ahora se utilizaban en off-line, como la transcripción y la traducción, se han combinado ambas, y se han evolucionado y optimizado para poder emplearlas combinadas y en tiempo real, para poder ejercer de “interpretes” en tiempo real.

Ver más
  • Actividad

    Descripción de la actividad de la organización

    Trebe Language Technologies es una spin-off de Vicomtech, creada en Donostia a finales de 2021, y que centra su actividad en el desarrollo de tecnologías y servicios basadas en las tecnologías del habla y del procesamiento de lenguaje natural.

    Sector

    Desarrollo de tecnologías/servicios del habla y del procesamiento de lenguaje natural

    Nº de personas empleadas

    9

    Localización

    Mikeletegi 65, 20009, Donostia - San Sebastián, Gipuzkoa
  • Argumento

    Antecedentes

    El actual contexto marcado por el crecimiento de los contenidos multimedia generados, unido al multilingüismo que caracteriza de manera creciente nuestra sociedad, genera una importancia creciente de servicios varios basados en las tecnologías del habla y del procesamiento de lenguaje natural. En este contexto, Trebe Language Technologies identificó una necesidad creciente y no atendida en el mercado de servicios de transcripción y traducción en tiempo real y de calidad para las lenguas cooficiales del Estado, esto es, castellano, euskera, gallego y catalán.

    Reto

    El reto ha sido generar una solución nueva que permite la transcripción y traducción en tiempo real para las lenguas co-oficiales del Estado, lo que ha supuesto diversos retos técnicos a los que se ha podido dar respuesta mediante diversas innovaciones propias desarrolladas por Trebe y basadas en técnicas de IA. Estas innovaciones han permitido poder ofertar, en último término, un servicio innovador de transcripción y traducción de calidad en tiempo real y que puede ser adaptado a las necesidades individuales de cada cliente y la terminología utilizada en su sector de actividad

    Razones para ser considerado un Caso Práctico de Innovación

    Porque se trata de una solución nueva en el mercado que, partiendo de tecnologías de transcripción y traducción ya existentes y basada en técnicas de Inteligencia Artificial (IA), ha permitido la evolución y optimización de ambas para poder emplearlas combinadas y en tiempo real, lo que permite disponer de una solución de subtitulado y traducción instantánea de calidad, simultánea y fiable, dirigida a las lenguas co-oficiales del Estado.

  • Descripción

    Trebe Language Technologies es una spin-off del Centro Tecnológico Vicomtech, creada en Donostia a finales de 2021, y que centra su actividad en el desarrollo de tecnologías y servicios basadas en las tecnologías del habla y del procesamiento de lenguaje natural. La empresa ofrece soluciones propias de tecnologías del lenguaje basadas en IA para las lenguas co-oficiales del Estado (euskera, gallego y catalán), además de castellano, francés, inglés y portugués. Estas soluciones propias permiten adaptar los modelos a los casos de uso, y se pueden desplegar en CPU y on-premise (lo que evita fugas de datos sensibles). En concreto, Trebe trabaja tres tecnologías, esto es, traducción, transcripción (pasar de voz a texto) y, finalmente, síntesis de voz (pasar de texto a voz), para los que se han generado diversos servicios asociados.

    En el año 2022, Trebe identifica una necesidad no cubierta en el mercado de servicios de transcripción y traducción para estas lenguas co-oficiales y que tenga lugar en tiempo real, para lo que desarrolla exitosamente a lo largo del 2023 una solución propia que combina dos tecnologías basadas en IA (esto es, la transcripción automática y la traducción neuronal). Este desarrollo ha implicado una serie de retos para la empresa. Por un lado, las posibles pérdidas de calidad de las transcripciones en tiempo real (habida cuenta que en este tipo de transcripciones sólo se sabe lo que se ha dicho hasta el momento, frente a una trascripción en diferido en la que se dispone del contexto completo). Por otro lado, la necesidad de contar con frases completas que estén debidamente puntuadas para interpretar correctamente el sentido de la frase. Todo ello sin olvidar que la especialización de Trebe en idiomas minoritarios supone un importante desafío, habida cuenta que estos idiomas cuentan en general con menores recursos sobre los que aprender.

    Para dar respuesta a estos retos técnicos, Trebe ha desplegado diversas soluciones innovadoras propias. Por un lado, la empresa ha desarrollado una solución de transcripción que procesa en paralelo pequeños “trozos” de audio para corregir palabras o frases en caso de que no correspondan con lo que posteriormente se ha dicho. Por otro lado, la empresa ha desarrollado una solución propia que permite puntuar y capitalizar correctamente las transcripciones con unas latencias de 10 mlisegundos, de forma que el proceso de traducción se aplica sobre frases completas y debidamente puntuadas y capitalizadas.

    Desde un punto de vista de los recursos utilizados, Trebe ha utilizado mayoritariamente recursos internos propios en el desarrollo del proyecto, tanto a nivel de personas como de infraestructuras utilizadas, además de ayuda puntual procedente de Vicomtech. Trebe se ha beneficiado de ayudas públicas KSI Berritzaile del Gobierno Vasco

    Los resultados del proyecto han sido exitosos, desarrollándose un nuevo producto, con carácter modular (solo transcribir, o transcribir y traducir), utilizable en tiempo real y que puede utilizarse como producto desplegado on-premise de forma que los datos del cliente no salgan fuera de la organización y puedan ser ejecutados sobre un hardware doméstico. La solución se comercializa en la actualidad y ha sido utilizada exitosamente en diversos eventos públicos desarrollados en los últimos meses.

  • Acciones

    Las principales acciones desarrolladas en el marco del proyecto han sido las siguientes:
    1. El proyecto arranca a principios del 2023, tras identificar las posibilidades comerciales de un servicio de transcripción y traducción en tiempo real.
    2. Entre enero y septiembre del 2023 se han desarrollado diversas innovaciones necesarias para poder contar con un servicio de transcripción y traducción de calidad. Así, se desarrolló y entrenó con ejemplos reales tanto la solución de transcripción que procesa pequeños “trozos” de audio y permite corregir palabras o frases tomando en cuenta las frases completas, además de la solución para poder puntuar y capitalizar correctamente las transcripciones prácticamente en tiempo real (latencias de 10 mlisegundos).
    3. La primera solución desarrollada fue testada en forma de piloto en varios eventos públicos entre noviembre y diciembre del 2023 (e.g. la Conferencia de la Asociación Española de Terminología (AETERM) organizada por UZEI y el III Congreso Internacional de Museos y Estrategias Digitales celebrado en el Museo Guggenheim Bilbao), con resultados muy positivos en ambos casos.
    4. Posteriormente, la solución desarrollada está siendo mejorada y afinada de forma continua por parte de Trebe (por ejemplo, en lo que se refiere al puntuador o la eliminación de disfluencias), al tiempo que la solución ha continuado siendo utilizada en diversos eventos públicos (por ejemplo, la Asamblea General de Innobasque o el Encuentro Empresarial de Elkargi), también con resultados muy positivos.

    Cara a futuro, la empresa está desarrollando una solución que, utilizando motores de traducción externos y el uso de teléfonos móviles, permita extender los servicios de transcripción y traducción de euskera/castellano a un listado extenso de otros 200 idiomas.

  • Resultados

    Los principales resultados obtenidos en el marco del proyecto han sido los siguientes:

    - Desarrollo de una solución innovadora en el mercado y modular, que oferta servicios de transcripción y traducción simultánea, en tiempo real y de calidad, y en todas las lenguas co-oficiales del Estado al castellano, inglés, francés y portugués (y a la inversa). El resultado es un nuevo servicio de calidad en tiempo real, que permite elegir el idioma del audio de entrada, y el idioma en el que se quiere generar la transcripción y la traducción.
    - La solución desarrollada puede utilizarse también como producto desplegado en casa del cliente, permitiendo tanto que sus datos no salgan de la organización y la solución se pueda ejecutar sobre un hardware doméstico.
    - Esta solución ha sido utilizada de forma exitosa en diversos foros y eventos, además de las experiencias piloto realizadas para testar la solución. En concreto, algunos de los eventos en los que se ha utilizado incluyen la Conferencia de la Asociación Española de Terminología (AETERM), el III Congreso Internacional de Museos y Estrategias Digitales, la Asamblea General de Innobasque o el Encuentro Empresarial de Elkargi, entre otros eventos.
    - La solución desarrollada presenta importantes oportunidades de mercado para Trebe Language Technologies, abriéndoles la posibilidad de dar servicio en nichos donde la empresa no tiene presencia en la actualidad, como centros educativos, reuniones corporativas, sistemas de atención al público con clientela internacional, etc.
    Finalmente, la empresa ha recibido un premio correspondiente al European Technology Awards de 2023, concretamente en la categoría de NLP (Natural Language Processing) Solutions.

  • Contacto

    Xabier Garcia de Kortazar

    655802405

    [email protected]

    Testimonios

    David Diaz (Responsable de Desarrollos Digitales, Guggenheim Bilbao Museoa)
    "La tecnología de TREBE se ha utilizado eficazmente en el último Congreso Internacional de Museos y Estrategias Digitales (CIMED) celebrado en el museo, y ha permitido traducir y generar subtítulos en euskera en tiempo real, a partir de las ponencias impartidas en otros idiomas".

    Imanol Urbieta (Director de UZEI)
    "En la jornada organizada por la Sociedad Española de Terminología, la herramienta para la subtitulación de Trebe causó sorpresa, por su precisión, entre los lingüistas".

  • Soluciones relacionadas