Aktuell sind KI-Browser in aller Munde, vor allem Perplexity Comet und ChatGPT Atlas (aktuell nur für macOS). Ich habe mit beiden etwas gearbeitet und bin leider noch nicht überzeugt.

Was ist ein KI-Browser?
Ein KI Browser ist ein Browser, bei dem eine KI (Künstliche Intelligenz in Form eines Sprachmodells/LLMs) mit dem Fenster eines Webbrowsers interagieren kann. Bei den beiden oben genannten Browsern, Comet und Atlas ist das sehr ähnlich umgesetzt. Beide sindVarianten von Chromium. Chromium ist das Google-geführte Open Source Projekt, auf dem der Google Browser Chrome aufsetzt. Im Wesentlichen wurde also ein ent-googelter Chrome-Browser um Elemente von Perplexity bzw. OpenAI ergänzt. Das hat einige Vorteile, wie z.B., dass man problemlos Erweiterungen nutzen kann, die man bei Chrome mag.
Bei beiden Browsern gibt es eine Seitenleiste, in der man mit der jeweiligen KI, also Perpexity bzw. ChatGPT chatten kann. Das Spannende daran ist, dass die KI auch mit den im Browser geöffneten Webseiten interagieren kann. In „normalen“ Browsern beschränkt sich so etwas auf die Zusammenfassung des Texts auf der geöffneten Webseite. So macht das z.B. bei Brave die Leo KI (Brave basiert auch auf Chromium und ist fokussiert auf Datenschutz, mehr hier).
Wie funktionieren die KI-Browser?
Beide Browser, Comet und Atlas, müssen dazu aufgefordert werden, um im Tab etwas zu tun. Wenn das passiert, wird die Webseite optisch anders dargestellt. Es erscheint ein grüner Rahmen (Comet) oder eine durchsichtige Animation (Altlas) sichtbar wird. Während dieser geänderten Darstellung interagiert die KI mit der Website. Dann kann sie Knöpfe drücken, Textfelder ausfüllen usw. – so, wie wir das als Mensch machen würden.
Aktuell ist das aber noch SEHR langsam – man könnte es definitiv schneller als die KI machen. Aber die Idee bei den KI-Browsern ist es ja nicht, ihnen beim Arbeiten zuzuschauen. Statt dessen sollen sie im Hintergrund langweilige Dinge tun, während wir in einem anderen Fenster etwas spannenderes (oder spaßigeres) tun.
Beispiele für den Einsatz
KI-Browser sind sehr geduldig und machen alles, was man ihnen sagt – solange sie dazu in der Lage sind. Dementsprechend eignen sie sich sehr gut für optionale Aufgaben, die man zwar tun könnte, in der Regel aber nicht tut. Da stehen oft Kosten und Nutzen nicht im richtigen Verhältnis. Bei der Nutzung einer KI reduziert sich der Aufwand (meistens) auf ein Prompt reduziert. Daher ändert sich das Kosten-Nutzen-Verhältnis mit einem KI-Browser sehr stark.
KI-Browser Use Case 1: Termine in den Kalender übertragen
Mein erster Versuch mit Comet war die Folge einer Einladung. Für eine zweitägige Konferenz hatte ich ein pdf mit der Agenda erhalten. Es gab mehrere Sessions an beiden Tagen. Manchmal habe ich sowas früher selbst in den Kalender übertragen. Dieses Mal sah ich DIE Gelegenheit, meinen frisch erhaltenen Zugang zu Comet zu testen:
- Ich öffnete meinen privaten Outlook-Kalender im Web.
- Ich aktivierte die Leiste mit dem KI-Assistenten.
- Ich kopierte die Agenda aus dem pdf in das Chatfenster.
- Ich sendete das folgende Prompt:
„Bitte trage die Termine in meinen Outlook Kalender im offenen Tab ein.“
Hier war es wichtig, Outlook zu nennen, damit es klappt. Perplexity geht sonst davon aus, dass es um einen mit Perplexity verbundenen Google-Kalender geht.
Erfolg! Es hat zwar recht lange gedauert, aber Perplexity hat es hinbekommen. Perplexity hat problemlos einen Termin nach dem anderen angelegt. Dazu hat es in Outlook jeweils über mehrere Fenster hinweg einen neuen Termin nach dem anderen angelegt. Das ist für mich ein Use Case, den ich seither nochmals benutzt habe und auch weiterhin nutzen werde.
Mehr Details und eine datenschutztechnisch maximal sichere Lösung habe ich hier beschrieben.
KI-Browser Use Case 2: Daten aus einer umständlichen Tabelle auslesen
Auch in diesem Beispiel handelt es sich um etwas, das mir alleine zu mühselig gewesen wäre: aus Interesse wollte ich Veranstaltungen einer Organisation analysieren. Dazu benötigte ich die Termine aus deren Online-Kalender, der nur auf der Website angezeigt wurde. Leider waren die Termine in dieser Ansicht nicht gut lesbar, so dass man auf jeden einzelnen Termin hätte klicken müssen, um ihn zu erfassen.
Geht so: Mit sehr wenig Anleitung war Comet in der Lage, mir eine Liste der Termine zu erstellen, die sich aber leider als nicht vollständig herausgestellt hat. Zudem kam noch ein anderes Problem zum Tragen: Comet kann nur eine begrenzte Menge Text im Browser ausgeben. Das lies sich dann schließlich lösen, indem ich Comet bat, einfach über mehrere Antworten hinweg den kompletten ausgelesenen Text wiederzugeben – elegant ist das aber nicht. Ich bin mir nicht mehr sicher, aber ich glaube, Comet kam auch nicht selbst auf die Idee, dieses Vorgehen vorzuschlagen. Auch Atlas habe ich an diese Aufgabe herangelassen, auch hier stimmte die Anzahl der Termine nicht, war aber näher an der Realität – zudem gab es keine Probleme bei der Ausgabe.
KI-Browser Use Case 3: Daten in einer Tabelle ergänzen
Wenn ich nicht arbeite, spiele ich gerne Computer- und Videospiele. Es gibt inzwischen viele Quellen, über die man kostenlose Spiele bekommt:
- auf Epic Games gibt es jede Woche 1-2 kostenlose Spiele, die in der Regel gut bis sehr gut sind.
- auf Amazon Luna gibt es für Amazon Prime Kunden jeden Monat ca. 10-15 kostenlose Spiele, bei denen zumindest einige sehr gut sind. Die Spiele werden dann über Epic Games, gog.com oder Amazon Games bereitgestellt.
Wenn man brav regelmässig diese Spiele „klickt“, dann kommt da mit der Zeit einiges zusammen. Für mich ist eines der sinnvollsten Kriterien, ein Spiel auszuwählen, der sogenannte metacritic Score. metacritic ist eine Website, auf der Bewertungen für Filme, Spiele usw. gesammelt werden. Aus den Bewertungen der verschiedenen, verlinkten Originalpublikationen wird dann ein Wert berechnet, der die gemittelte Bewertung beschreibt.
Nun zum Use Case: ich habe meine Spieleliste exportiert und wollte diese durch Comet um den metacritic Score ergänzen lassen. Das Ergebnis:
- mit Excel Online hat es gar nicht geklappt – Comet konnte zwar Änderungen an existierenden Zellenwerten vornehmen, aber keine komplett neuen eintragen. Im Video unten sieht man, wie das abläuft und wie gut bzw. schlecht Comet mit Problemen klar kommt.
- mit Google Sheets konnte Comet die Werte eintragen, aber auch das war… nicht optimal
Risiken beim Einsatz von KI-Browsern
Auf Basis der Use Cases ist also noch kein großer Nutzen erkennbar. Zudem muss man sich der Gefahren bewusst sein, die lauern:
- die KI-Browser-Anbieter haben Interesse am Userverhalten und den besurften Seiten.
- die KI-Browser sind (noch) nicht sicher vor Angriffen im Netz.
Die Anbieter und ihre Interessen
Schauen wir uns das erste Thema an, die Interessen der Anbieter: KI-Modelle sind auf vielen Webseiten nicht willkommen, weil sie eine Geschichte haben, ohne zu Fragen den Inhalt in die Modelle zu übernehmen. Wenn allerdings ein Nutzer auf eine solche Seite geht, ist das eine andere Sache. Es wäre also durchaus im Interesse der Anbieter, die besuchten Seiten zu archivieren – mit Zustimmung oder auch ohne. Mein Vertrauen in Firmen aus dem Silicon Valley ist da über die Jahre stark gesunken. Dementsprechend nutze ich diese Browser nur unabhängig von meinem normalen Browser (Brave) und logge mich dort auch nur bei den Seiten ein, die für die Use Cases absolut notwendig sind und wenig Risiko tragen (s.o., ich nutze den privaten Outlook-Account). Dennoch muss man sagen, dass hier eben etwas möglich ist, was z.B. mit dem Agent-Mode von ChatGPT nicht möglich ist: man kann sich bei Webseiten anmelden und den Browser dann mit der eingeloggten Webseite arbeiten lassen. Beim Agent Mode müsste man dafür die Zugangsdaten an ChatGPT übermitteln.
Anfälligkeit für Angriffe
Der Punkt von oben wird noch gestärkt dadurch, dass die Browser bisher noch anfällig sind. Mich persönlich hat sehr irritiert, dass Atlas es mit den Standardeinstellungen erlaubt, Verbindungen ohne Verschlüsselung zu öffnen (SSL für die, die das kennen). Das ist schon von vorneherein kein gutes Zeichen bzgl. der Vorsicht der Entwickler. Sicherheitsforscher bei Brave haben für Comet nachgewiesen, dass Comet dazu manipuliert werden kann, Account-Daten an eine dritte Partei zu übermitteln. Man muss zwar noch immer erst einmal an die entsprechende Stelle des Internets surfen, aber gut ist das nicht. Eine weitere Lücke wurde beim Erstellen von Screenshots erkannt, ebenfalls bei Comet. Da Atlas erst sehr kurz am Markt ist, gehe ich persönlich davon aus, dass schlicht noch keine entsprechenden Tests bekannt gemacht wurden, da Sicherheitsforscher den Anbietern von der Veröffentlichung in der Regel Zeit geben, die Lücken zu schließen.
Lust auf Austausch?
Ich tausche mich immer gerne zum Thema KI aus – mehr Infos zu meinem Ansatz bei Traning von Mitarbeitern und Beratung findest Du auf der Homepage!
