Google sigue implementando novedades en su chatbot Gemini que OpenAI ya tiene disponibles en ChatGPT desde hace algún tiempo y, ahora, le ha tocado el turno a Deep Thinking, una funcionalidad que lleva al modelo de lenguaje a “pensar” con mayor detenimiento y, por lo tanto, a ofrecer resultados con mayor detalle.
Para ello, Deep Think amplía el tiempo de inferencia del modelo para explorar distintas hipótesis en paralelo antes de entregar una respuesta. Este enfoque da margen para sopesar alternativas, combinar propuestas y refinar el resultado final en problemas complejos, ofreciendo respuestas más desarrolladas y detalladas
Además, desde Google señalan que han incorporado técnicas de aprendizaje por refuerzo al modelo, destinadas a aprovechar esas trayectorias de razonamiento extendidas, con la intención de mejorar la capacidad de resolución progresiva de la herramienta.
La funcionalidad se despliega entre los suscriptores de los planes de pago AI Ultra, a través del cliente web y de la app móvil. En paralelo, la multinacional de Mountain View indica que ofrecerá a un grupo reducido de matemáticos y académicos el acceso a la versión completa del modelo Gemini 2.5 Deep Think utilizado en competiciones.
El lanzamiento llega tras recibir feedback de quienes la han probado y, según evaluaciones internas, la versión ahora disponible alcanza un rendimiento de nivel bronce en el referente de la Olimpiada Internacional de Matemáticas de 2025, con mejoras frente a iteraciones previas.
Para usar Deep Think en la app, los suscriptores deben activar un selector específico al elegir el modelo 2.5 Pro. Su uso está acotado por un número fijo de interacciones diarias, y la herramienta funciona de forma integrada con utilidades como la ejecución de código y la búsqueda en Google, además de generar respuestas más extensas que las habituales.
Desde Google indican que, a lo largo de las próximas semanas, planean habilitar Deep Think, con y sin acceso a herramientas, para un conjunto de probadores de confianza a través de la API de Gemini, con el objetivo de evaluar su utilidad en casos de uso de desarrolladores y empresas.
La compañía sitúa Deep Think en tareas que requieren creatividad, planificación y mejora paso a paso, poniendo como ejemplos el desarrollo iterativo —como la construcción de proyectos complejos de forma modular— y subraya su comportamiento en retos de programación en los que la formulación del problema y la evaluación de compromisos y tiempos de cómputo resultan determinantes. También apunta a posibles usos en investigación científica y matemática para explorar conjeturas o leer literatura técnica compleja.
En métricas públicas sin uso de herramientas, Google destaca resultados en bancos de pruebas que miden código competitivo, conocimientos y razonamiento, como LiveCodeBench V6 y Humanity’s Last Exam. La empresa los utiliza como referencia para situar el rendimiento de Gemini 2.5 Deep Think frente a otros sistemas en áreas de programación, ciencia y conocimiento general.
En las pruebas previas al lanzamiento, Google afirma haber medido mejoras en seguridad de contenido y en tono objetivo frente a Gemini 2.5 Pro, con la salvedad de una mayor tendencia a rechazar solicitudes que la compañía considera inocuas. El equipo responsable señala que evalúa riesgos asociados al incremento de las capacidades del modelo, con pruebas específicas para funciones avanzadas y mitigaciones planificadas para niveles críticos.