Ера простих чат-ботів стрімко відходить у минуле, поступаючись місцем «агентам дії». Компанія Manus офіційно представила функцію “My Computer Desktop”, яка дозволяє штучному інтелекту безпосередньо взаємодіяти з інтерфейсом комп’ютера, виконуючи складні завдання замість людини.
Що сталося
Стартап Manus, який позиціонує себе як розробник першого у світі по-справжньому універсального ШІ-агента, зробив вагомий крок уперед. Розробники презентували інструмент, що дозволяє моделі виходити за межі вікна браузера та працювати безпосередньо з операційною системою.
На відміну від попередніх ітерацій ШІ, які могли лише генерувати текст або код, Manus тепер може відкривати додатки, перетягувати файли, редагувати документи в офісних пакетах та виконувати багатоетапні дії, які раніше потребували виключно людської присутності. Це не просто оновлення софту, а зміна парадигми взаємодії людини з обчислювальними машинами.

Як це працює
Технологія базується на передовому комп’ютерному зорі та здатності ШІ інтерпретувати візуальні дані з екрана в режимі реального часу. Manus сприймає робочий стіл так само, як і звичайний користувач: він бачить іконки, вікна додатків, курсор та кнопки.
Основні принципи роботи включають:
- Сприйняття екрана (Screen Perception): Модель аналізує скриншоти або відеопотік робочого столу, ідентифікуючи елементи керування.
- Емуляція дій: ШІ генерує команди для переміщення курсора, натискання клавіш та кліків мишкою.
- Контекстне планування: Замість виконання поодиноких команд, Manus розбиває складне завдання користувача (наприклад, «підготуй звіт у Excel на основі цих листів у Outlook») на послідовність логічних кроків.
Важливою особливістю є те, що агент працює у захищеному хмарному середовищі, де розгорнуто віртуальний робочий стіл. Це забезпечує стабільність роботи та дозволяє системі виконувати завдання автономно, навіть якщо основний пристрій користувача вимкнено.

Чому це важливо
Поява Manus та подібних рішень (як-от Computer Use від Anthropic чи Operator від OpenAI) сигналізує про початок «агентної революції». Для індустрії та користувачів це має кілька ключових наслідків:
- Позбавлення від рутини: Будь-які повторювані дії — від заповнення CRM-систем до складного сортування пошти — тепер можна делегувати ШІ. Це звільняє години робочого часу для творчих та стратегічних завдань.
- Доступність складного ПЗ: Користувачам більше не обов’язково досконало знати інтерфейс професійних програм. Досить пояснити ШІ-агенту, який результат потрібно отримати, і він сам знайде потрібні інструменти в меню.
- Економічна ефективність для бізнесу: Масштабування операційних процесів стає значно дешевшим, оскільки один цифровий агент може виконувати роботу, на яку раніше витрачалися ресурси цілих відділів.
Для розробників це також виклик, оскільки тепер софт має бути зручним не лише для очей людини, а й для сприйняття нейромережами.

Висновок
Manus із функцією керування робочим столом — це яскравий приклад того, як штучний інтелект перетворюється з порадника на виконавця. Ми стоїмо на порозі часу, коли фраза «зроби це за мене» стане основною командою для взаємодії з комп’ютером. Хоча технологія ще потребує вдосконалення у швидкості та безпеці, вектор розвитку очевидний: комп’ютер стає автономним інструментом, здатним працювати на благо людини без її постійного втручання.
Джерело: За матеріалами офіційного блогу Manus (manus.im).





