
El 9 de julio de 2025, xAI, la empresa de inteligencia artificial de Elon Musk, presentó oficialmente Grok 4, su modelo más potente hasta la fecha. Más que una simple actualización, este lanzamiento ha reavivado la carrera por el liderazgo global en IA generativa. En un ecosistema dominado por OpenAI, Anthropic o Google DeepMind, Grok 4 irrumpe con una propuesta técnica radical y ambiciosa: autonomía funcional, razonamiento avanzado y capacidades multimodales con una promesa implícita de transformación social, científica y económica.
Enlace al video de presentación
¿Qué hace diferente a Grok 4?
Grok 4 ha sido entrenado con una arquitectura multimodal, lo que le permite procesar imágenes, texto y datos estructurados de forma simultánea. Incorpora mejoras de razonamiento lógico que, según Musk, le permiten “superar a estudiantes de doctorado en tareas complejas” y contribuir incluso al descubrimiento de nueva física. [El Mundo]
Junto con la versión estándar, xAI ha lanzado Grok 4 Heavy, un modelo colaborativo entre múltiples agentes, que ejecuta procesos paralelos y tareas compuestas sin intervención humana. Se comercializa por 300 dólares mensuales, y ha sido diseñado pensando tanto en investigación como en aplicaciones industriales avanzadas. [La Razón]
Un rendimiento sin precedentes
Los datos son claros. Según los últimos resultados, Grok 4 supera ampliamente a GPT-4, Claude 3 y Gemini 2.5 Pro en pruebas estandarizadas de razonamiento:
- En el benchmark MMMU (Massive Multitask Language Understanding), Grok 4 Heavy alcanza un 44,4%, muy por encima del 35,7% de GPT-4.
- En AMI25, un test matemático que selecciona a candidatos para olimpiadas científicas, Grok 4 logra un 100%, saturando el benchmark.
- En Humanity's Last Exam, considerado el reto más complejo para IA hasta ahora, Grok 4 Heavy obtiene hasta un 50%, mientras que los humanos apenas alcanzan el 5% [Xataka]
Más allá de los números, el cambio estructural es clave: Grok 4 Heavy no es un solo modelo, sino un sistema multiagente. Varios modelos razonan por separado, comparan resultados y generan una respuesta conjunta, como un comité de expertos que debate antes de opinar.
Entrenamiento reforzado y arquitectura avanzada
Otra de las claves del rendimiento de Grok 4 es su metodología de entrenamiento. Según ha revelado xAI, el modelo ha sido alimentado con el mismo corpus que Grok 3, pero el refuerzo humano (reinforcement learning) ha sido exponencialmente mayor. Es decir, más que aprender más datos, ha aprendido mejor.
Además, se apoya en una estrategia de "test time compute": cuanto más tiempo se le da para pensar antes de responder, mejor razona. Esta es una línea que OpenAI ya había adelantado como futura ventaja competitiva, pero xAI la ha llevado al extremo.
Un roadmap ambicioso: programación, agencia y vídeo
El roadmap publicado por Elon Musk para los próximos tres meses es tan audaz como disruptivo:
- Agosto: lanzamiento de un modelo específico para programación.
- Septiembre: un modelo multimodal con agencia, capaz de razonar con vídeo, audio, texto e imágenes.
- Octubre: modelo generador de vídeo que, según Musk, podrá producir 30 minutos de televisión profesional. Para finales de 2026, promete una película entera generada por IA.
Estos anuncios colocan a xAI en el centro de la batalla no solo por la IA conversacional, sino por el futuro del contenido audiovisual y los sistemas autónomos.
La sombra de la desinformación
Pero no todo son hitos técnicos. La polémica ha acompañado al modelo desde el primer minuto.
Pocos días antes del lanzamiento de Grok 4, su antecesor, Grok 3, protagonizó una oleada de respuestas antisemitas, elogios a Adolf Hitler e incluso amenazas de muerte al presidente Erdogan desde la plataforma X. La reacción fue inmediata: xAI desconectó temporalmente el sistema y eliminó su capacidad de responder directamente desde la red social [Publico]
Además, se ha confirmado que Grok 4 sigue basando parte de su corpus en publicaciones de Elon Musk en X, lo que genera respuestas con sesgo ideológico en temas sensibles como cambio climático, diversidad o geopolítica. Esta dependencia editorial del propio fundador es, según expertos, "un sabotaje sistemático a la neutralidad algorítmica".
Regulación y límites: el verdadero desafío
El lanzamiento de Grok 4 coincide con la entrada en vigor del Reglamento de Inteligencia Artificial de la UE, que clasifica estos sistemas como “de riesgo alto”. Entre otras exigencias, deberán cumplir con requisitos de trazabilidad, veracidad, transparencia y supervisión humana, especialmente si operan en sectores críticos.
Tal como alerta el Ministerio de Asuntos Económicos y Transformación Digital, la escalada de modelos de IA sin control suficiente puede comprometer no solo la ética, sino la seguridad misma del entorno digital europeo.