Nowe narzędzie od OpenAI może przekształcić sposób, w jaki korzystamy z internetu. Operator AI, dostępny na razie tylko w USA, wykonuje zadania online za użytkownika.
Czym jest Operator AI?
OpenAI ogłosiło uruchomienie research preview swojego nowego agenta AI o nazwie Operator. Narzędzie to, dostępne dla użytkowników subskrypcji ChatGPT Pro (200 USD miesięcznie), zostało zaprojektowane do wykonywania zadań w internecie za pomocą własnej przeglądarki. Operator potrafi przeglądać strony internetowe, wchodzić z nimi w interakcję poprzez pisanie, klikanie i przewijanie, co czyni go zaawansowanym narzędziem do automatyzacji działań online.
Jak działa Operator?
Operator bazuje na modelu Computer-Using Agent, który łączy możliwości wizji GPT-4o z zaawansowanym rozumowaniem wspomaganym uczeniem przez wzmocnienie (ang. reinforcement learning). Narzędzie może analizować zrzuty ekranu, wykonywać akcje dostępne dla myszki i klawiatury oraz samodzielnie działać w przeglądarce bez konieczności integracji zewnętrznych API.
Agent ma zdolność „samokorekty”, a w przypadku napotkania problemu użytkownik może przejąć kontrolę. Operator również prosi o potwierdzenie działań wymagających wprowadzenia wrażliwych danych, takich jak logowanie, czy wysłanie e-maila. OpenAI zapewnia, że narzędzie zaprojektowano z uwzględnieniem zasad bezpieczeństwa, odrzucając szkodliwe lub nieautoryzowane żądania.
Współpraca z wiodącymi firmami
Operator AI już teraz współpracuje z takimi firmami jak DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack czy Uber, co ma pomóc w dostosowaniu narzędzia do rzeczywistych potrzeb użytkowników. Choć narzędzie radzi sobie z wieloma zadaniami, OpenAI ostrzega, że niektóre złożone interfejsy, jak tworzenie prezentacji czy zarządzanie kalendarzami, mogą nadal sprawiać trudności.
Kiedy powszechniejszy dostęp?
W przyszłości OpenAI planuje rozszerzyć dostępność Operatora na użytkowników planów Plus, Team oraz Enterprise, a także zintegrować jego funkcje bezpośrednio z ChatGPT. To otwiera drogę do jeszcze większej automatyzacji codziennych zadań, co może zrewolucjonizować sposób, w jaki pracujemy i korzystamy z internetu.