Biometría de Voz y autenticación segura bajo PSD2 y PSD3 

by | Jun. 2025 | Autenticación Biométrica

En los últimos años, los requisitos de autenticación en los servicios financieros se han transformado profundamente. Ya no se trata solo de validar credenciales; se trata de proteger identidades, preservar la experiencia de usuario y, sobre todo, cumplir con normativas cada vez más estrictas como PSD2 y el próximo reglamento PSD3. 

Uno de los avances más prometedores en este terreno es el uso de la biometría de voz como método de autenticación. Gracias a sus características únicas, esta tecnología basada en inteligencia artificial está ganando protagonismo como mecanismo seguro, cómodo y regulatoriamente válido, tanto como factor único en determinados contextos como componente dentro de esquemas multifactor. 

Descarga el Caso de Uso: Biometría de Voz como solución de autenticación de clientes

El nuevo paradigma de autenticación según PSD2 y PSD3 

La Directiva de Servicios de Pago revisada (PSD2) introdujo el concepto de Strong Customer Authentication (SCA), que obliga a los proveedores de servicios de pago (PSPs) a aplicar al menos dos de los tres siguientes elementos: 

  • Conocimiento: algo que solo el usuario sabe (por ejemplo, una contraseña). 
  • Posesión: algo que solo el usuario posee (como un dispositivo móvil). 
  • Inherencia: algo que el usuario es (por ejemplo, una característica biométrica). 

La biometría de voz pertenece a esta última categoría. 

La propuesta PSD3, actualmente en proceso de desarrollo, no solo mantiene esta estructura, sino que abre la puerta a mayor flexibilidad en cómo se aplican los factores, permitiendo incluso que dos elementos de la misma categoría puedan combinarse si el contexto lo justifica. Esto incluye, por ejemplo, el uso de dos métodos biométricos distintos (como la voz y la huella dactilar) o dos elementos relacionados con posesión. 

El marco normativo también endurece las condiciones de verificación remota de identidad, la trazabilidad de los accesos y la necesidad de mecanismos auditables que puedan demostrar cómo se aplicó la autenticación en cada operación. Es aquí donde las soluciones basadas en IA y específicamente la biometría de voz ofrecen una ventaja competitiva y operativa. 

¿Qué es la biometría de voz y cómo funciona? 

La biometría de voz permite autenticar a una persona a partir de las características únicas de su forma de hablar. A diferencia de las tecnologías de reconocimiento de voz tradicionales, que identifican qué se dice, esta tecnología se centra en quién lo dice. 

Cada voz humana posee patrones únicos derivados de factores fisiológicos (longitud del tracto vocal, tamaño de la laringe) y de comportamiento (entonación, ritmo, pausas). Los sistemas de biometría de voz analizan estos rasgos y crean una huella vocal digital única, también conocida como «voiceprint». 

Cuando un usuario interactúa con el sistema (por ejemplo, al llamar a un centro de atención o al usar un asistente virtual), la IA compara su voz con el patrón registrado y emite una puntuación de coincidencia que determina si la autenticación es válida. 

Biometría de voz como método de autenticación inherente 

La biometría de voz se posiciona como un método de autenticación «inherente» altamente eficaz bajo las exigencias de SCA. Ofrece varias ventajas sobre otros métodos biométricos: 

  • No requiere hardware específico: A diferencia del reconocimiento facial o de huella, solo se necesita un micrófono (presente en cualquier smartphone, ordenador o teléfono). 
  • Funciona en remoto y sin fricción: No requiere interacción física ni gestos complejos. El usuario puede autenticarse simplemente hablando. 
  • Alta precisión y tolerancia a ruido: Gracias al avance de modelos de aprendizaje profundo, los sistemas actuales son capaces de autenticar en entornos ruidosos, incluso con frases cortas o lenguaje natural.

Además, la biometría de voz permite realizar la autenticación de forma pasiva. Es decir, el sistema puede autenticar al usuario mientras este realiza una acción (como solicitar un servicio o dictar un mensaje), sin necesidad de pasos adicionales. 

Como segundo factor de autenticación: seguridad sin fricción 

En muchas implementaciones, la biometría de voz no se utiliza como único factor, sino como parte de un esquema multifactor. Este enfoque híbrido resulta especialmente potente en los casos en que: 

  • Se desea evitar el uso de contraseñas o PINs, considerados débiles o vulnerables. 
  • El usuario no dispone de un canal visual (por ejemplo, en interacciones por teléfono). 
  • Se busca aumentar la seguridad sin sacrificar experiencia de usuario. 

Por ejemplo, una autenticación segura podría consistir en: 

  1. Un código enviado por SMS al dispositivo (posesión). 
  2. La verificación de la voz al responder (inherencia). 

Este enfoque cumple con los requisitos de PSD2/PSD3 para SCA y mejora la usabilidad al evitar métodos más invasivos como el reconocimiento facial en entornos poco adecuados (oficinas, exteriores, etc.). 

Descarga el whitepaper: Biometría de voz como segundo factor de autenticación

Fortalezas frente a otros métodos biométricos 

Método Fortalezas Fortalezas 
Huella dactilar Rápido, familiar Requiere sensor físico 
Reconocimiento facial Alta precisión visual Afectado por luz, posición 
Biometría de voz No intrusivo, manos libres, sin hardware específico, con capacidad de detectar deepfakes Puede verse afectada la rapidez de autenticación por la calidad acústica y el ruido ambiental 

La biometría de voz destaca especialmente en entornos sin pantalla (call centers, dispositivos IoT, interfaces conversacionales) o en segmentos de usuarios donde la facilidad de uso es clave, como personas mayores o con discapacidades visuales. 

Cumplimiento normativo y trazabilidad 

La autenticación por biometría de voz no solo cumple con los principios de SCA, sino que también permite: 

  • Generar evidencia del proceso: Cada autenticación se acompaña de un score de coincidencia, logs de la sesión, etc. Esto facilita su auditoría. 
  • Registrar de forma íntegra y segura: Con tecnologías como la grabación certificada o el hash de interacciones, se puede dejar constancia inviolable del proceso de autenticación. 
  • Proteger la privacidad del usuario: Con técnicas de anonimización y cifrado se garantiza el cumplimiento con el RGPD. 

Estos elementos no solo satisfacen a los reguladores, sino que aportan transparencia ante eventuales disputas sobre accesos no autorizados. 

Casos de uso reales en servicios financieros 

El uso de la biometría de voz como autenticación se está consolidando en diversos escenarios: 

  • Atención telefónica bancaria: El usuario se identifica automáticamente al llamar, evitando preguntas de seguridad y reduciendo el tiempo de llamada. 
  • Acceso a apps de pagos: En asistentes virtuales, el sistema confirma identidad antes de autorizar una operación. 
  • Firma de contratos por voz: Junto a grabación certificada, se valida la voluntad y la identidad del firmante. 
  • Verificación de identidad en onboarding remoto: La voz se usa para complementar el análisis de documento y el reconocimiento facial. 

Todos estos casos son altamente relevantes en el marco PSD2/PSD3, donde el objetivo no es solo autenticar, sino hacerlo con pruebas claras, auditables y con el menor nivel de fricción posible. 

Descubre más sobre las soluciones de IA para Servicios Financiero y Banca

Desafíos y consideraciones técnicas 

Aunque las ventajas son notables, existen aspectos que deben considerarse al implementar biometría de voz: 

  • Protección ante suplantación: La IA debe ser capaz de detectar intentos de fraude por imitación o reproducción de voz (por ejemplo, con grabaciones). Los sistemas modernos ya incluyen detección de “voice spoofing” y de síntesis artificial. 
  • Robustez ante cambios en la voz: Enfermedades, envejecimiento o emociones pueden alterar ligeramente el patrón vocal. Un buen sistema debe adaptarse o permitir reentrenamientos controlados. 
  • Rechazo social o dudas de privacidad: Aunque es menos invasiva, algunas personas pueden mostrarse reticentes. Es clave comunicar de forma clara cómo se protegen los datos y cuál es el beneficio para el usuario. 

¿Qué papel juega la IA en todo esto? 

La biometría de voz moderna se basa en modelos de machine learning entrenados con miles de horas de voz. Estos sistemas: 

  • Aprenden a distinguir voces individuales incluso en condiciones adversas. 
  • Detectan patrones anómalos en tiempo real. 
  • Se actualizan continuamente para adaptarse a nuevos escenarios, amenazas y regulaciones. 

La inteligencia artificial no es un añadido, sino el núcleo que hace posible una autenticación segura, usable y escalable basada en la voz. 

En el contexto actual y futuro marcado por PSD2 y PSD3, la biometría de voz representa una solución estratégica para la autenticación segura, especialmente cuando se integra como parte de una arquitectura más amplia basada en inteligencia artificial. Cumple con los requisitos regulatorios, mejora la experiencia del usuario y permite automatizar procesos que antes requerían intervención humana constante. Ya sea como método único en ciertos entornos o como segundo factor dentro de una estrategia multifactor, su aplicación aporta un equilibrio óptimo entre seguridad, eficiencia y cumplimiento normativo. 

Descubre más sobre cómo funciona la biometría de voz y cómo puede beneficiarte, aquí.