Artículo de blog
16/4/2026

Los agentes de voz marcan un punto de inflexión entre la automatización y la operación real

La voz está volviendo pero no como la conocíamos. En una nueva edición de PATIO Connect celebrada en PATIO Campus,, la conversación giró en torno a un cambio que ya no es teórico: la transformación de la voz en una capa operativa capaz de ejecutar tareas, interactuar con sistemas y generar impacto directo en el negocio. La mesa reunió a perfiles que cubren toda la cadena de valor, desde la tecnología hasta su aplicación real en grandes organizaciones, como Juan José Cerrolaza de Kyndryl, Carlos Becker de Happy Robots, Victoria Navazo de WAYRA, Telefónica y Antonio Barranco de Banco Santander.

Lejos del discurso habitual sobre asistentes virtuales, la sesión puso el foco en una realidad más concreta. Los agentes de voz ya no son una promesa tecnológica, sino una capacidad que empieza a desplegarse en entornos reales. La diferencia es sutil pero estructural. No se trata de interfaces que responden, sino de sistemas que actúan. El paso de navegar a ejecutar, y de interactuar a delegar, redefine completamente el papel de la voz dentro de las organizaciones.

Uno de los mensajes más claros de la mesa fue que el avance ya no depende tanto de la tecnología como de las empresas. Tal y como apuntó Juan José Cerrolaza, Head of AI en Kyndryl, las capacidades técnicas están suficientemente maduras, pero el verdadero reto está en cómo se integran dentro de sistemas complejos y entornos enterprise. En paralelo, Carlos Becker, Founding Engineer de Happy Robots, subrayó una idea clave que atravesó toda la conversación: el humano sigue siendo “el guardián de la excepción”, especialmente en escenarios donde la automatización no puede cubrir todos los casos.

En este contexto, el impacto se está produciendo especialmente en procesos internos. Automatización de tareas, eficiencia operativa y reducción de costes son algunos de los beneficios más inmediatos. Desde la perspectiva de grandes corporaciones, Antonio Barranco, VP AI Startup & Venture Ecosystem Lead de Banco Santander, puso el foco en cómo estos sistemas empiezan a integrarse en operaciones reales, donde la fiabilidad y la regulación son factores críticos. Por su parte, Victoria Navazo, Head of Portfolio en WAYRA Telefónica, aportó la visión de infraestructura y ecosistema, destacando el papel de la colaboración entre startups y corporaciones para acelerar la adopción.

Aun así, la adopción no es homogénea. Los usuarios todavía no han terminado de adaptarse a este nuevo paradigma. Existe una inercia clara hacia la interacción humana, especialmente en situaciones complejas o sensibles. Aunque la tecnología permite ya conversaciones fluidas con voces prácticamente indistinguibles de las humanas, el cambio de comportamiento del usuario avanza a un ritmo diferente.

Este desfase introduce un elemento clave en el despliegue de agentes de voz: el diseño de sistemas híbridos. Los agentes pueden gestionar gran parte de las interacciones, pero requieren supervisión, control y capacidad de escalado progresivo. En este sentido, la posibilidad de realizar pruebas A/B y medir con precisión el rendimiento se convierte en una herramienta fundamental para evolucionar desde pilotos hacia implementaciones reales.

De izq. a dcha: Rafael Rosco, Head of Marketing & Communications de PATIO Campus; Antonio Barranco, VP AI Startup & Venture Ecosystem Lead de Banco Santander; Carlos Becker, Founding Engineer de Happy Robots; Juan José Cerrolaza, Head of AI de Kyndryl; y Victoria Navazo, Head of Portfolio at WAYRA, Telefónica.

Otro de los grandes retos identificados fue precisamente ese salto de piloto a producción. Muchas organizaciones experimentan con agentes de voz, pero pocas consiguen integrarlos de forma estructural. Las barreras no están en la tecnología, sino en la gobernanza, la calidad de los datos y la adaptación de procesos internos a una nueva lógica operativa.

La conversación también abordó los riesgos asociados. Privacidad, seguridad y confianza emergen como elementos críticos en un entorno donde la voz implica una relación más directa con el usuario. Esto obliga a repensar no solo la tecnología, sino también los marcos de responsabilidad dentro de las organizaciones.

En conjunto, la sesión dejó una conclusión clara. La voz ha dejado de ser un canal para convertirse en una capa operativa del negocio. Pero su verdadero potencial no dependerá de lo que la tecnología puede hacer, sino de lo que las organizaciones sean capaces de integrar, gobernar y escalar. Porque, como ocurre con toda transformación profunda, el cambio no empieza en la herramienta, sino en cómo se decide utilizarla.

Compartir
Copiado