Categorías
Blog

El reconocimiento automático de voz (ASR) en el pago por teléfono

Al contrario de lo que ocurre con los coches voladores, que (de momento) no nos encontramos en nuestro día a día, sí se ha hecho realidad otro de los sueños de toda una generación: hablar con las máquinas. Y que estas nos entiendan, claro; esto último suena a perogrullada, pero no es tan evidente como parece…

Algo que hace apenas dos décadas nos parecía impensable hoy es posible gracias a la tecnología ASR o reconocimiento automático de voz. Y tiene una presencia fuerte y creciente en una enorme gama de industrias y negocios; en el caso de los pagos por vía telefónica usando tarjeta de crédito se ha convertido en una de sus características esenciales.

¿Qué es el reconocimiento automático de voz?

Explicado de forma sencilla, la automatic speech recognition (de ahí lo de ASR) es una herramienta que habilita la comunicación hablada entre una persona y una computadora. Es capaz de procesar una voz, reconocer el sentido de las palabras y proceder en consecuencia, por ejemplo ejecutando órdenes para cumplir un proceso predefinido.

Esta sencilla explicación encierra complejos desafíos que han exigido desarrollos tecnológicos considerables. Para que una máquina “entienda” realmente lo que dice una persona intervienen cuestiones acústicas, lingüísticas y computacionales, y (otra vez de momento) su capacidad, por impresionante que parezca, es limitada.

¿Cómo funciona el ASR?

Aunque existen varios modelos o generaciones de ASR, el sistema de reconocimiento de voz actual se basa en el empleo de inteligencia artificial para un aprendizaje automático, basado en un corpus (o varios corpora) de naturaleza acústica, fonética y léxica, que mediante tratamientos algorítmicos utilizan modelos de datos que puede irse perfeccionando.

Podemos señalar cuatro fases básicas en el proceso de funcionamiento de un sistema de reconocimiento de voz.

  • Captura de audio: el sistema detecta la actividad de voz, la diferencia de silencios y ruidos, y la convierte en unos y ceros.
  • Análisis y parametrización: el sistema diferencia unidades de sentido (fonéticas, léxicas, semánticas).
  • Identificación: en un proceso retroactivo, el sistema identifica esas unidades y produce un resultado (ejecuta una orden).
  • Respuesta: el sistema es capaz de dar una respuesta en función de su programación y del aprendizaje automático.
reconocimiento automático de voz o ASR

¿Qué aplicaciones tiene?

  • Asistentes de voz. Tal vez el más refinado de los usos del reconocimiento de voz, apoyado en los últimos avances en PLN, Siri y compañía son el caso de éxito por antonomasia de esta tecnología.
  • Control de comandos. Desde controlar un ordenador (o un móvil, o un wearable) simplemente con la voz, hasta transcribir automáticamente de audio a texto; dos formas de “comunicación” con diferentes niveles de dificultad.
  • Sistemas accesibles para personas con discapacidad. La imposibilidad de realizar ciertas tareas o gestos manuales puede suplirse mediante órdenes habladas, por ejemplo con objetos conectados en el IoT.
  • Comunicación telefónica. Por supuesto, con PBX inteligentes ejecutando órdenes, proporcionando información, automatizando procesos, optimizando la atención al cliente, mejorando la eficiencia operativa de las empresas, etc.

¿Qué ventajas aporta en el pago seguro con tarjeta por teléfono?

Los primeros servicios de atención telefónica automatizada empleaban el teclado numérico del teléfono (sistema DTMF o de marcación por tonos), un método muy fiable y que sigue teniendo toda su vigencia. No obstante, los usuarios actuales demandan formas más ágiles, accesibles y naturales para realizar sus actividades cotidianas sin intervención humana.

Entre esas actividades cotidianas, emitir órdenes de pago de viva voz cuando compramos un producto o queremos pagar una tasa municipal es tal vez aquella en la que la intervención humana es menos deseable por cuestiones de seguridad de nuestros datos financieros. Por ello, el empleo de sistemas automatizados es altamente recomendado por toda la industria de las tarjetas de pago.