Масштабирование робототехники с E-TTS: новый ИИ-подход

Эпоха роботов, слепо исполняющих зашитые алгоритмы, подходит к логическому финалу. Исследователи из Института автоматизации Китайской академии наук (CASIA) успешно перенесли концепцию Test-Time Scaling (TTS) — ту самую «паузу на раздумья», знакомую нам по текстовым LLM — в мир физических манипуляторов. Новый фреймворк E-TTS (Embodied Test-Time Scaling) превращает процесс управления в итеративный цикл: вместо того чтобы ломиться по единственной траектории, система тратит дополнительные вычислительные ресурсы на этапе вывода, чтобы «прокрутить в голове» и оценить несколько вариантов действий.

Главные инновации метода

Команда под руководством Вэнь Е и Пэйянь Ли нацелилась на две фундаментальные проблемы воплощенного AI: отсутствие исторического контекста и сложность верификации действий в непредсказуемой среде. E-TTS решает это через следующие механизмы:

Буфер истории, сохраняющий логику выполнения длительных и многоэтапных задач. Специализированные визуально-языковые верификаторы, работающие как внутренние цензоры. Итеративная оценка кандидатов на выполнение, позволяющая выбрать оптимальный путь.

В результате модель способна буквально додумывать решение при встрече с препятствием, не требуя при этом ни грамма новых экспертных данных или дорогостоящего переобучения.

Результаты и значение для бизнеса

Цифры подтверждают жизнеспособность такого «медленного мышления»: этот plug-and-play подход повышает точность работы на 33,14% в симуляциях и на 26,62% в реальных условиях. Тесты проводились на четырех базовых Vision-Language-Action (VLA) моделях, что доказывает универсальность решения.

Для бизнеса это сигнал о смене парадигмы:

Надежность автономных систем теперь можно масштабировать за счет мощностей железа, а не бесконечного сбора датасетов. Переход от разомкнутого управления к замкнутому циклу рассуждений позволяет обуздать «длинный хвост» физических ошибок. Снижается необходимость в постоянном вмешательстве оператора для исправления мелких сбоев.

Данная технология открывает путь к созданию по-настоящему автономных роботов, способных адаптироваться к динамической среде в режиме реального времени.

Источник: arXiv cs.AI →

Оцените материал

★ ★ ★ ★ ★

РоботизацияИскусственный интеллектКомпьютерное зрениеАвтоматизацияCASIA

Эффект «раздумий»: как фреймворк E-TTS учит роботов мыслить перед действием