Уже продолжительное время в информационном пространстве не утихают разговоры о приближении массовой безработицы из-за искусственного интеллекта. В частности, как предупреждают эксперты и представители технологических гигантов, ИИ уже может заменить представителей некоторых профессий. Исследователи решили проверить популярные ИИ-сервисы, заставив их выполнять реальные проекты. Стало известно о результатах эксперимента.
Об этом сообщает издание Washington Post.
Компания Scale AI вместе с представителями Центра безопасности ИИ решили выяснить, способен ли действительно современный искусственный интеллект справиться с реальными проектами. Исследователи проверили такие известные сервисы, как ChatGPT, Gemini и Claude. Для тестирования ИИ было отобрано сотни проектов с фриланс-платформ. В частности, речь идет о 3D-анимации продуктов, транскрибировании музыки, разработке веб-игр и форматировании научных трудов.
Как выяснилось, угроза безработицы из-за искусственного интеллекта значительно преувеличена. Выполнение почти каждого второго проекта оказалось низкокачественным, а 30% задач ИИ вообще не смог завершить. Нередко сгенерированные искусственным интеллектом файлы были поврежденными. Также ИИ часто игнорировал требования заказчиков.
В частности, ИИ провалил проект с дизайном интерьера. Сгенерированный искусственным интеллектом план этажа содержал существенные технические недостатки и не имел необходимой детализации.
Проблемы возникли и в проекте, связанном с аналитикой данных. Во время создания панели визуализации искусственный интеллект не только накладывал текст на графики и путал цвета, но и вообще "потерял" часть информации.
Не смог ИИ корректно выполнить и заказ по разработке игры. Искусственный интеллект справился с созданием игры, однако она совсем не соответствовала тематике, определенной заказчиком.

Как отмечает соавтор исследования Джейсон Хаузенлой, сейчас существуют два существенных ограничения, которые не позволяют ИИ заменить человеческий труд. Во-первых, современный искусственный интеллект не обладает долгосрочной памятью, а значит, не способен эффективно выполнять длительные проекты.
Во-вторых, новейшая технология не имеет полноценного визуального восприятия. Поэтому ИИ создает 3D-модели путем генерации программного кода. В результате один и тот же объект в каждом кадре видеоролика может выглядеть по-разному.
Тем временем исследователи отмечают, что ИИ-модели со временем постепенно совершенствуются. Например, модель Gemini 3 Pro смогла выполнить 1,3% задач, тогда как ее предыдущая версия — лишь 0,8% проектов. Однако о полной замене человеческого труда пока речь не идет.