Ficha de la Idea

Nombre:
Llamada subtitulada
Categoría:
Personalización de interfaces de usuario y servicios
Autor:
Maria del Mar Martinez Sanchez (Imagen asociada al total de puntos uninnovas del usuario49 Uninnovas)
Universidad:
Grupo de investigación, cátedra, etc.:
Somos dos amigos que nos conocemos desde hace muchos años en el entorno laboral de la consultoría y soluciones de IT. Ambos tenemos gran experiencia en tecnología y muchos recursos de conocimiento (ingeniero informático e ingeniero de telecomunicaciones). Desde hace aproximadamente dos años estamos recabando información y formándonos en técnicas de machine learning/deep learning sobre todo para reconocimiento de lenguaje hablado así como analizando soluciones hardware alternativas (en el marco del creciente movimiento “maker”).

Descripción breve:

Se trata de ofrecer a las personas que tienen gran pérdida auditiva pero que pueden hablar normalmente la posibilidad de mantener una conversación telefónica más fluida leyendo lo que sus interlocutores dicen en tiempo real, sin los inconvenientes de uso de conexión de datos continuada a un servidor en la nube. Y sobre todo debe ser muy fácil de usar.

Desarrollo de la Idea:

A lo largo de los últimos tres años, conforme han avanzado los sistemas de AI para reconocimiento de voz, han ido apareciendo soluciones como la que imaginábamos, tanto de la mano de empresas software como de empresas de telefonía. Pero tienen algunos problemas fundamentales que queremos subsanar: - Suelen requerir de un servicio de tiempo real “en la nube” con lo cual si la conexión de datos del teléfono es pobre, funcionan con muy baja calidad - Enlazado con el punto anterior, si el ritmo de la conversación supera cierto umbral, el servicio empeora notablemente - Están sobre todo especializados en idioma inglés, y no funcionan por ahora demasiado bien con Español y sobre todo si tiene acentos locales - Hay ciertos inconvenientes con ruido de fondo, conversaciones cruzadas etc. SOLUCION TECNICA Y RETOS QUE AFRONTAMOS La solución ideal sería un software capaz de ejecutarse de forma casi completa en un smartphone que subtitulara en tiempo real el audio de una conversación telefónica, utilizando conexiones a un servidor central de inteligencia artificial solo puntualmente para actualizar el aprendizaje y hacer un backup necesario de su aprendizaje continuo. De este modo tenemos dos elementos del servicio: la app móvil y el backend (servidor) de respaldo en red.

Para poder participar en esta idea debe ingresar en la plataforma con su usuario y contraseña. Si aún no se ha registrado puede hacerlo en el siguiente formulario de alta

Ultimos Comentarios:

  • Avatar del usuario Maria del Mar Martinez Sanchez
    30/3/2017 21:56:24 Maria del Mar Martinez Sanchez (Imagen asociada al total de puntos uninnovas del usuario49 Uninnovas) Los retos principales para desarrollar la idea son:
    - Se necesita adaptar y evolucionar alguna de las múltiples soluciones software de “speech-to-text” que existen hoy en día para que se puedan adecuar a las limitadas capacidades de computación de un smartphone actual
    - Hay que realizar un entrenamiento más adaptado al idioma Castellano y sobre todo con acento local (p.e. uno de nosotros es de Almería)

    Alternativamente estamos analizando la posibilidad de crear un dispositivo prototipo de hardware sencillo que tenga mayores prestaciones que un smartphone a un precio asequible y que con la apariencia de un teléfono fijo convencional de sobremesa, lo que permite albergar hardware de más potencia, y que incluya esta funcionalidad en una conexión de voz GSM mediante una SIM comercial corriente.
    Esto requeriría conectar una serie de elementos que se pueden adquirir por separado fácilmente (procesador p.e. Arduino o Raspberry, un módulo GSM/GPRS, una pantalla led, un teclado…) y utilizar una carcasa impresa 3D.

    También existiría la posibilidad de desarrollar el software como una aplicación de escritorio para ordenador, pero esto choca directamente con la facilidad de uso que queremos darle.
  • Fundación ONCE