Las Skills de Gemini: el salto de asistente a agente autónomo dentro de Chrome

Publicada 4 min de lectura 153 lecturas

Google está preparando una nueva función que convierte a Gemini en algo más que un asistente pasivo dentro de Chrome: está probando lo que internamente se denomina “Skills”, un conjunto de capacidades que permitirían al modelo ejecutar tareas de forma automática dentro del navegador.

Hoy, en las versiones que ya circulan en Estados Unidos, Gemini actúa como un apoyo contextual: lo abres cuando estás en una página y le pides que aclare un párrafo, resuma un artículo o compare información entre varias pestañas. Esa capacidad de “leer” varias pestañas y condensar datos —por ejemplo, tomar los detalles relevantes de tres pestañas abiertas sobre vuelos, hoteles y actividades y convertirlos en un plan único— es precisamente la base sobre la que Google quiere construir funciones más autónomas.

Las Skills de Gemini: el salto de asistente a agente autónomo dentro de Chrome
Imagen generada con IA.

La pista concreta llegó cuando un investigador publicó una captura que muestra una nueva página interna, chrome://skills, donde se podría definir una “Skill” con un nombre e instrucciones. Ese hallazgo fue difundido en redes por Leo y puede verse en el propio enlace compartido públicamente: captura del descubrimiento. La existencia de esa página sugiere que Google está poniendo en marcha un sistema para que Gemini ejecute acciones concretas dentro del navegador, no solo responda preguntas.

Según lo que ha explicado la propia compañía en sus presentaciones sobre Gemini y lo que se ha ido viendo en pruebas, la idea es evolucionar desde un asistente que explica y resume hacia un agente que pueda realizar tareas: buscar páginas que visitaste antes con preguntas en lenguaje natural, interactuar de forma más estrecha con aplicaciones de Google como Calendar, YouTube o Maps, y presumiblemente automatizar pasos repetitivos sin que tengas que cambiar de pestaña constantemente. Para contexto oficial sobre Gemini y la estrategia de Google en IA conviene revisar las entradas de su blog sobre el proyecto: introducción oficial a Gemini.

Que Gemini adquiera “habilidades” ejecutables dentro del navegador abre posibilidades claras de productividad: imaginemos delegar la tarea de comparar precios, extraer horarios de eventos o rellenar formularios, y recibir una respuesta en forma de plan o incluso una acción concretada. Sin embargo, este paso también plantea cuestiones técnicas y éticas que no deben subestimarse. Un agente que puede actuar en páginas web tiene que lidiar con permisos, límites claros, transparencia sobre qué hace y por qué, y salvaguardas para evitar acciones no deseadas o abusos por parte de terceros.

En el ecosistema del navegador ya existen precedentes para funcionalidades experimentales accesibles mediante páginas internas o flags, y el proyecto Chromium ofrece el trasfondo técnico que permite a Google testar cambios en Chrome antes de lanzarlos de forma general: sitio del proyecto Chromium. Pero convertir esas pruebas internas en una función pública implicará diseñar controles de privacidad, auditorías de seguridad y, probablemente, opciones para que el usuario limite qué “Skills” pueden ejecutar y en qué contextos.

Los riesgos que suelen señalar expertos cuando una IA gana autonomía en la web incluyen acciones involuntarias (clicks, envíos de formularios), filtrado inadvertido de datos sensibles y la posibilidad de que extensiones o terceros configuren habilidades maliciosas si no hay controles estrictos. Por eso es razonable esperar que Google implemente confirmaciones explícitas, permisos granulares y un registro de actividad para cualquier operación automatizada, aunque todavía no hay detalles públicos sobre esas medidas.

Las Skills de Gemini: el salto de asistente a agente autónomo dentro de Chrome
Imagen generada con IA.

De momento la novedad está en pruebas internas y no tiene fecha de lanzamiento conocida. En paralelo, Google ha dejado claro su intención de integrar Gemini de forma más profunda con sus propios servicios y de potenciar su capacidad para “actuar” en entornos web, un movimiento coherente con la tendencia general de llevar modelos de lenguaje a tareas reales y repetitivas. Para seguir la evolución de estas pruebas и las discusiones sobre seguridad y privacidad conviene estar atento a los canales oficiales de Chrome y a los reportes técnicos que vayan surgiendo en medios especializados.

Si te interesa probar funciones tempranas de Chrome o seguir los experimentos, la página del blog de Chrome suele publicar novedades y anuncios cuando las pruebas pasan a fases más abiertas: blog oficial de Chrome. Y si lo que preocupa son las implicaciones de seguridad, la documentación y debate del proyecto Chromium ofrecen una visión técnica útil sobre cómo se diseñan y prueban estas capacidades.

En resumen, las “Skills” para Gemini apuntan a transformar al asistente en un agente capaz de ejecutar tareas en Chrome. Es un avance con impacto potencialmente enorme en productividad, pero también requiere controles robustos para proteger datos y evitar automatizaciones peligrosas. Entre el anuncio público y la implementación real habrá decisiones de diseño crítico que determinarán si esta función termina siendo una ayuda discreta y segura o una fuente más de problemas de privacidad en la navegación diaria.

Cobertura

Relacionadas

Mas noticias del mismo tema.