OpenAI Atlas le navigateur qui inclut des vidéos et exécute des tâches sur le web

Publié 5 min de lectura 157 lecture

OpenAI teste des fonctionnalités avancées dans son navigateur Chrome appelé ChatGPT Atlas, et les derniers signes montrent que l'expérience d'assistant intégrée peut maintenant interagir directement avec des vidéos et éventuellement exécuter des actions automatiques dans les pages. Cela va au-delà de l'utilisation de ChatGPT dans un onglet séparé : l'idée est que l'assistant est disponible dans le site que vous naviguez pour vous aider sans avoir à copier et coller du contenu ou modifier la fenêtre.

L'un des signes les plus visibles de cette évolution est l'émergence d'une fonction "Timstamps" chez certains utilisateurs, qui permet à l'assistant d'extraire des marques de temps de vidéos - en particulier de YouTube - et de les montrer sur la barre latérale. La piste a été publiquement partagée dans X par le chercheur Ugo Alves, où il montre comment l'interface peut générer et présenter ces points de référence du contenu audiovisuel dans le panel ChatGPT ( voir fil).

OpenAI Atlas le navigateur qui inclut des vidéos et exécute des tâches sur le web
Image générée avec IA.

La valeur évidente de la compréhension vidéo n'est pas seulement de lire des sous-titres : si l'assistant peut localiser des moments pertinents d'un clip, il facilite des tâches telles que résumer une conférence, localiser un fragment spécifique pour le citer ou générer des index qui accompagnent une reproduction. Cependant, il soulève aussi des questions pratiques sur la précision et les droits, car l'identification fiable du contexte exact dans une vidéo nécessite des modèles qui combinent vision, audio et compréhension sémantique.

Une autre fonctionnalité qui semble être dans les tests aurait un nom provisoire "Actions" et serait conçu pour le navigateur pour effectuer des tâches pour vous dans le web. Cela correspond au mode « agent » que OpenAI a déjà exploré : un agent peut ouvrir des onglets, suivre les flux de travail et cliquer sur des éléments pour effectuer des étapes de routine, toutes avec des limites de sécurité pour éviter automatiquement les opérations sensibles.

OpenAI documente les modifications et corrections apportées aux notes de version Atlas, et la dernière mise à jour publique met l'accent sur la stabilité et les petites améliorations quotidiennes. Les corrections incluent la solution à un problème de consommation excessive de mémoire et de meilleures suggestions contextuelles lorsque la barre latérale ChatGPT est fermée, en plus d'un ensemble de polissage dans l'interface pour rendre la navigation plus fluide ( consulter les notes officielles).

Il y a également eu des ajustements à la gestion des onglets : la recherche des onglets affiche maintenant vos cinq derniers quand il n'y a pas de résultats et il y a un accès rapide pour l'invoquer avec Cmd + K. Ce sont des détails qui montrent qu'OpenAI essaie de faire d'Atlas un navigateur utilisable et compétitif, pas seulement une démonstration technologique.

Un aspect qui devrait être mis en évidence est la mémoire du navigateur. Si vous activez l'option « mémoires de navigateur », Atlas pourra mémoriser les éléments des sessions précédentes - par exemple, les offres d'emploi que vous compariez - et réutiliser ces informations pour de futures consultations. Cela améliore la continuité de la recherche personnelle, mais active également les considérations de confidentialité car ces mémoires impliquent le stockage des métadonnées et des extraits des pages que vous visitez.

En ce qui concerne la confidentialité et la sécurité, OpenAI a expliqué que le mode agent intègre des garanties et des précautions supplémentaires dans les sites sensibles: il est prévu que le navigateur n'exécutera pas automatiquement des actions sur la banque, la santé ou les formulaires qui nécessitent des références, à moins que l'utilisateur donne une autorisation explicite. Cependant, il est prudent pour les utilisateurs de revoir les configurations et les permissions avant de permettre des automatisations complexes.

OpenAI Atlas le navigateur qui inclut des vidéos et exécute des tâches sur le web
Image générée avec IA.

Pour les créateurs de contenu et les professionnels de la vidéo, la capacité de générer des marques de temps peut être une arme à double tranchant. D'une part, il facilite l'accessibilité et la redistribution du message; d'autre part, il pourrait faciliter les extractions qui ne respectent pas toujours les politiques d'utilisation ou d'attribution. La coexistence entre utilité et respect des droits reste un défi qui dépend de la façon dont les limites et les contrôles sont définis dans la mise en œuvre finale.

OpenAI a également indiqué des plans pour amener Atlas vers plus de plateformes; parmi les promesses est une version pour Windows 11, qui élargirait l'accès aux utilisateurs de bureau cherchant à intégrer un IA plus présent dans leur workflow habituel. Si vous voulez explorer ChatGPT à partir de votre visage public, la principale entrée de produit est toujours disponible sur le site officiel ( chat.openai.com), bien que l'expérience Atlas soit une version de navigateur avec ses propres fonctions.

Bref, ce que nous voyons est une direction claire: intégrer l'IA non pas comme un assistant isolé mais comme une couche active du navigateur. La capacité d'interpréter la vidéo et d'exécuter des actions dans les pages transforme la façon dont nous interagissons avec l'information sur le web mais cela soulève des défis techniques, juridiques et de protection de la vie privée qui méritent une attention particulière. Alors qu'OpenAI crée l'expérience dans les tests et les corrections, il est recommandé de tester avec prudence, lire les notes officielles et configurer les options de mémoire et d'autorisation en fonction de votre niveau de confiance.

Couverture

Autres

Plus de nouvelles sur le même sujet.