Uh oh, Claude AI can now control your PC

Uh, och, Claude AI może teraz kontrolować komputer

Claude 3.5 Sonet. Od dziś, 23 października 2024 r., ten duży model języka (LLM) może przejąć wiele funkcji na Twoim komputerze. Tak, Claude AI może naśladować interakcje człowieka z Twoim komputerem, od przesuwania kursora po pisanie, klikanie i przeglądanie.

Ta najnowsza aktualizacja, nazwana funkcją „Computer Use”, umożliwia Claude'owi kontrolowanie systemu za pomocą prostych poleceń. Analizując to, co dzieje się na ekranie, Claude może automatyzować zadania, które wcześniej wymagały Twojego bezpośredniego wprowadzania danych. Na przykład może wyodrębnić informacje z jednej aplikacji (takiej jak arkusz kalkulacyjny) i wprowadzić je do innej, takiej jak formularz online lub edytor dokumentów. W demonstracji pokazanej przez Anthropic, sztuczna inteligencja była w stanie autonomicznie wypełniać złożone formularze, pobierając i przetwarzając dane w czasie rzeczywistym.

Jak to działa? Claude opiera się na zrzutach ekranu pulpitu i używa tych wizualizacji, aby zrozumieć, jakie działania należy podjąć. Sztuczna inteligencja oblicza, o ile przesunąć kursor lub które klawisze nacisnąć na podstawie tego, co „widzi” na ekranie. Obecnie nie jest idealna. Może mieć problemy z podstawowymi czynnościami, takimi jak przewijanie i powiększanie, ale to imponujący krok naprzód.

Dostęp do tej funkcji w wersji beta można uzyskać za pośrednictwem interfejsu API Anthropic na platformach takich jak Vertex AI firmy Google Cloud i Bedrock firmy Amazon. Deweloperzy już eksperymentują z jej możliwościami, aby tworzyć narzędzia, które automatyzują wszystko, od prostych zadań administracyjnych po procesy weryfikacji aplikacji.

Użytkownicy nadal będą musieli udzielać określonych uprawnień, zachowując pewien poziom kontroli nad tym, co może zrobić AI. Jednak w miarę rozwoju Claude’a pojawiają się pytania o to, jak dużą autonomię jesteśmy skłonni przekazać systemom AI i jakie zabezpieczenia są potrzebne, aby zapobiec niewłaściwemu użyciu. Krótko mówiąc, oznacza to ekscytujący, nieco niepokojący moment w rozwoju AI. Pytanie nie brzmi tylko „co Claude może teraz zrobić?”, ale „jak szybko będzie mógł robić jeszcze więcej?”. Obserwuj tę przestrzeń, ponieważ dzięki takim możliwościom Claude szybko przechodzi od asystenta do autonomicznego operatora.

Powrót do bloga