
Google está dando grandes pasos en el mercado móvil. inteligencias artificiales. Parecía que nadie podía competir con OpenAI con su modelo GPT, pero las grandes G cada vez muestran más avances en este ámbito.
No sólo tienen Mellizosuna de las mejores alternativas a ChatGPT en la actualidad. También han presentado muchos recientemente herramientas interesantes basadas en este modelo: Veo 3, Nano Banana, NotebookLM, Genie 3, AI Mode Finder, etc.
Y ahora aparecieron una inteligencia artificial que puede navegar por Internet por ti. Así es, Google acaba de lanzar Gemini 2.5 Computer Use, una plantilla avanzada que funciona como agente de control del navegador. A continuación te lo explicamos detalladamente y te revelamos cómo probarlo.
¿Cuál es el uso de la computadora Gemini 2.5?
Gemini 2.5 Computer Use es un modelo especializado basado en las capacidades de visión y razonamiento de Gemini 2.5 Pro. No genera texto como un chatbot tradicional, pero está diseñado para interactuar con interfaces de usuario de páginas web.
Esto significa que, siguiendo las instrucciones del usuario, Puede hacer clic, presionar botones, seleccionar opciones, escribir. y realizar otro tipo de entradas interpretando el entorno digital en el que se encuentra para alcanzar el objetivo requerido.
Para hacer todo esto, la IA captura una imagen del estado actual del navegador, razona sobre la tarea e indica la siguiente acción a realizar, repitiendo el proceso hasta completar el objetivo. Básicamente, Gemini 2.5 Computer Use es una inteligencia artificial que puede navegar por Internet como lo haría un ser humano para completar las tareas requeridas.
¿Para qué sirve la computadora Gemini 2.5?


El nuevo Gemini 2.5 Computer Use es el primer gran avance de este tipo de Google automatizar entornos digitales con inteligencia artificial. Si bien por ahora solo puede controlar los navegadores web, la idea es que estos evolucionen hasta convertirse en agentes de IA que interactúen directamente con las interfaces de programas, sistemas operativos, etc..
Las aplicaciones principales Los actuales incluyen los siguientes:
- Automatizar tareas web– Le permite completar y enviar formularios complejos, gestionar registros o realizar compras en línea sin intervención manual.
- buscar información– Puede realizar tareas de investigación de varios pasos, navegando por varias páginas web para recopilar, comparar y resumir datos.
- Probar aplicaciones o páginas web– Los desarrolladores pueden usarlo para automatizar pruebas de regresión y de extremo a extremo de aplicaciones web, buscando errores y verificando el flujo de usuarios.
- Acceder a sitios web– Capaz de operar en entornos que requieren autenticación, manipulando menús desplegables y evitando filtros de acceso.
Cómo usar Gemini 2.5 Usando tu computadora
Lo primero que debes saber es que Gemini 2.5 Computer Use es una API de Gemini y la forma oficial de probarla es a través de Google AI Studio y Vertex AI. Requiere conocimientos de código. ya que tienes que crear tu propio agente de control del navegador.
tu también puedes espectáculo una demostración fácil para el público en general. Este es el sitio web del navegador Gemini (le dejamos el enlace a continuación) donde se le proporciona una ventana de chat para solicitar la demostración del uso de la computadora Gemini 2.5 para una tarea de navegación.
Enlace | Demostración de computadora Gemini 2.5 (navegador Gemini)
si lo eres programador y quieres probar realmente de lo que es capaz Para usar la computadora Gemini 2.5, tendrás que trabajar en el código. Para hacer esto necesitarás crear una cuenta en Estudio de IA de GoogleLa plataforma de Google diseñada para proporcionar acceso a la API de Gemini (la «Clave API»).
Una vez que lo obtenga, deberá abrir Colab Notebook «Introducción al modelo y herramienta informática Gemini 2.5» Sí establecer el código del modelo «gemini-2.5-computer-use-preview-10-2025″ y el bucle del agente. Finalmente, ingresa tu clave API (la que obtienes al hacer clic «Obtener clave API») y ejecute el código.
Y tú… ¿Cuánto tiempo crees que pasará antes de que lancen una versión de Gemini que controle toda la computadora?