
El 17 de julio de 2025, OpenAI presentó ChatGPT Agent, una evolución clave de su ecosistema que combina las funciones de Deep Research (investigación en profundidad) y Operator (navegación autónoma), para ofrecer un agente capaz de ejecutar flujos de trabajo completos sin intervención constante del usuario.
Durante la presentación, el equipo de investigadores (Yash, Jing, Casey e Issa) explicó que la visión era clara: unificar en un solo sistema las capacidades más demandadas por los usuarios, desde la planificación y la gestión de calendarios hasta la creación de documentos y presentaciones.
¿Qué es y qué hace ChatGPT Agent?
ChatGPT Agent es un agente multimodal que combina:
- Navegadores de texto y visuales para leer webs y realizar acciones (clics, formularios).
- Terminal integrado para ejecutar código, generar hojas de cálculo o presentaciones en PowerPoint.
- Soporte para PDFs y generación de imágenes para ilustraciones y gráficos.
En una demostración, el agente recuperó datos del presupuesto de San Francisco, planificó una cena, buscó hoteles en Singapur y organizó un itinerario para un torneo de tenis en Palm Springs, todo en menos de 10 minutos y con mínima supervisión humana.
Automatización avanzada y aprendizaje por refuerzo
El nuevo agente ha sido entrenado con Reinforcement Learning (RL), lo que le permite decidir qué herramienta usar en cada contexto y optimizar su flujo de trabajo.
Durante la demo, generó automáticamente un PowerPoint, calculó tiempos de tráfico hacia el aeropuerto de San Francisco (SFO) y notificó al usuario el itinerario completo, con recomendaciones y enlaces listos para su aprobación.
El cofundador de OpenAI subrayó que el agente realiza entre el 90 % y el 95 % del trabajo más repetitivo y “consumidor de tiempo”, liberando al usuario para enfocarse en tareas estratégicas y creativas.
Conectividad y personalización
Gracias a los “connectors”, el agente puede enlazarse con servicios como Gmail, Dropbox o Google Calendar, interpretando el contexto del usuario.
Por ejemplo, al planificar una cita, el sistema puede reconocer restricciones alimentarias (“mi pareja es celíaca”), buscar restaurantes compatibles y realizar una reserva vía OpenTable sin que el usuario repita cada dato.
Investigación y acción unificadas
El vídeo “ChatGPT agent Does Research & Action” muestra cómo el agente:
- Consulta múltiples fuentes en paralelo para planificar eventos o analizar datos.
- Integra disponibilidad personal (agenda) y contexto real (horarios de vuelos, tráfico).
- Crea itinerarios completos, desde la reserva de hotel hasta la gestión de desplazamientos.
Un ejemplo destacado fue el itinerario de un torneo de tenis en Palm Springs (12-15 de marzo), que incluyó vuelos, horarios de partidos y recomendaciones de restaurantes.
Seguridad y control humano
OpenAI ha implementado medidas de seguridad avanzadas:
- Confirmación antes de enviar correos, compras o reservas.
- Prohibición de introducir datos sensibles como tarjetas de crédito.
- Modo vigilancia, que alerta ante webs sospechosas.
- Posibilidad de interrumpir el flujo en cualquier momento, retomando la tarea como si se tratara de un compañero de equipo.
Disponibilidad y hoja de ruta
- Disponible desde julio de 2025 para usuarios Pro, Plus y Team.
- Se prevé su despliegue en empresas y entornos educativos más adelante.
- La llegada a Europa estará condicionada a la adaptación a la normativa GDPR y los estándares éticos de la UE.
Impacto para despachos profesionales
En el contexto español, donde solo un 9,6 % de las pymes usan IA según ONTSI (2024), herramientas como ChatGPT Agent representan una oportunidad para:
- Automatizar informes y auditorías con datos contrastados.
- Planificar tareas recurrentes (agendas, citas, compras).
- Mejorar la productividad hasta un 30 %, dedicando más tiempo al cliente y al análisis de valor.