OpenAI Atlas der Browser, der Videos enthält und Aufgaben im Web ausführt

Veröffentlicht 4 min de lectura 158 Lesen

OpenAI testet erweiterte Funktionen innerhalb seines Chromium-Browsers namens ChatGPT Atlas, und die neuesten Zeichen zeigen, dass das integrierte Assistent-Erlebnis jetzt direkt mit Videos interagieren und möglicherweise automatische Aktionen auf den Seiten ausführen kann. Dies geht über die Verwendung von ChatGPT in einer separaten Registerkarte hinaus: die Idee ist, dass der Assistent innerhalb der Seite, die Sie durchsuchen, verfügbar ist, um Ihnen zu helfen, ohne Inhalt zu kopieren und einzufügen oder Fenster zu ändern.

Eines der sichtbarsten Anzeichen dieser Evolution ist das Auftauchen einer "Timstamps"-Funktion in einigen Benutzern, die es dem Assistenten ermöglicht, Zeitmarken von Videos - vor allem von YouTube - zu extrahieren und auf der Seitenleiste zu zeigen. Der Track wurde in X von dem Forscher Ugo Alves öffentlich geteilt, wo er zeigt, wie die Schnittstelle diese Referenzpunkte des audiovisuellen Inhalts im ChatGPT-Panel erzeugen und präsentieren kann ( siehe Faden)

OpenAI Atlas der Browser, der Videos enthält und Aufgaben im Web ausführt
Bild generiert mit IA.

Der offensichtliche Wert des Verständnisses von Video ist nicht nur das Spielen von Untertiteln: Wenn der Assistent relevante Momente eines Clips lokalisieren kann, erleichtert er Aufgaben wie das Zusammenfassen einer Konferenz, das Auffinden eines bestimmten Fragments, um es zu zitieren oder Indexe zu erzeugen, die eine Wiedergabe begleiten. Sie hebt aber auch praktische Fragen zu Genauigkeit und Rechten auf, weil die zuverlässige Identifizierung des genauen Kontexts in einem Video Modelle erfordert, die Vision, Audio und semantisches Verständnis kombinieren.

Eine andere Funktion, die in Tests zu sein scheint, hätte einen vorläufigen Namen "Aktionen" und würde für den Browser entworfen werden, um Aufgaben für Sie im Web auszuführen. Dies passt zu dem "agent" Modus, den OpenAI bereits erforscht hat: ein Agent kann Registerkarten öffnen, Workflows folgen und auf Elemente klicken, um Routineschritte zu vollenden, alles mit Sicherheitsgrenzen, um empfindliche Operationen automatisch zu vermeiden.

OpenAI dokumentiert Änderungen und Korrekturen in den Atlas-Versionshinweisen und das neueste öffentliche Update unterstreicht Stabilität und kleine tägliche Verbesserungen. Die Korrekturen umfassen die Lösung zu einem übermäßigen Speicherverbrauch Problem und bessere kontextuelle Vorschläge, wenn die ChatGPT-Seitenleiste geschlossen ist, zusätzlich zu einem Satz Polieren in der Schnittstelle, um die Navigation mehr Flüssigkeit zu machen ( offizielle Anmerkungen)

Es gab auch Anpassungen an das Tab-Management: Die Suche nach Tabs zeigt jetzt Ihre letzten fünf, wenn es keine Ergebnisse gibt und es einen schnellen Zugriff darauf gibt, es mit Cmd + K zu invozieren. Dies sind Details, die zeigen, dass OpenAI versucht, Atlas zu einem nutzbaren und wettbewerbsfähigen Browser zu machen, nicht nur eine technologische Demonstration.

Ein Aspekt, der hervorgehoben werden sollte, ist der Speicher des Browsers. Wenn Sie die Option "Browser Erinnerungen" aktivieren, wird Atlas in der Lage sein, Elemente aus früheren Sitzungen - zum Beispiel, Stellenangebote, die Sie verglichen haben - zu erinnern und diese Informationen für zukünftige Konsultationen wiederzuverwenden. Dies verbessert die Kontinuität in der persönlichen Forschung, aktiviert aber auch Privatsphäre Erwägungen weil diese Erinnerungen die Speicherung von Metadaten und Auszügen aus den von Ihnen besuchten Seiten beinhalten.

In Bezug auf Privatsphäre und Sicherheit hat OpenAI erklärt, dass der Agent-Modus Sicherheitsvorkehrungen und zusätzliche Vorsichtsmaßnahmen in sensiblen Websites beinhaltet: Es wird erwartet, dass der Browser nicht automatisch Aktionen auf Bank, Gesundheit oder Formulare, die Anmeldeinformationen benötigen, ausführen wird, es sei denn, der Benutzer gibt ausdrückliche Erlaubnis. Allerdings ist es für Benutzer praktikabel, Konfigurationen und Berechtigungen zu überprüfen, bevor komplexe Automatisierungen erlaubt.

OpenAI Atlas der Browser, der Videos enthält und Aufgaben im Web ausführt
Bild generiert mit IA.

Für Content-Autor und Video-Profis kann die Fähigkeit, Zeitmarken zu erzeugen, eine doppelte Waffe sein. Auf der einen Seite erleichtert sie die Zugänglichkeit und Neuverteilung der Botschaft; auf der anderen Seite könnte sie Extraktionen erleichtern, die nicht immer die Nutzungs- oder Zuschreibungspolitiken respektieren. Die Koexistenz zwischen Nutzen und Achtung der Rechte bleibt eine Herausforderung das hängt davon ab, wie Grenzen und Kontrollen in der endgültigen Umsetzung festgelegt werden.

OpenAI hat auch Pläne, Atlas auf weitere Plattformen zu nehmen; unter den Versprechen ist eine Veröffentlichung für Windows 11, die den Zugriff auf Desktop-Benutzer erweitern würde, um eine IA mehr in ihren üblichen Workflow zu integrieren. Wenn Sie ChatGPT von Ihrem öffentlichen Gesicht aus erkunden möchten, ist der Hauptprodukteintrag noch auf der offiziellen Website verfügbar ( Chat.com), obwohl die Atlas-Erfahrung eine Browser-Version mit eigenen Funktionen ist.

Kurz gesagt, was wir sehen ist eine klare Richtung: die IA nicht als isolierter Assistent, sondern als aktive Schicht des Browsers zu integrieren. Die Fähigkeit, Video zu interpretieren und Aktionen innerhalb von Seiten auszuführen, verwandelt die Art, wie wir mit Informationen im Web interagieren aber es bringt technische, rechtliche und Privatsphäre Herausforderungen, die Aufmerksamkeit verdienen. Während OpenAI die Erfahrung in Tests und Korrekturen erstellt, wird empfohlen, mit Vorsicht zu testen, die offiziellen Notizen zu lesen und die Speicher- und Berechtigungsoptionen nach Ihrem Vertrauensniveau zu konfigurieren.

Deckung

Verwandte Artikel

Weitere Neuigkeiten zum selben Thema.