GR00T N1.5: архитектура, данные и эволюция VLA-моделей

GR00T N1.5: архитектура, данные и эволюция VLA-моделей

Начинаем серию разборов современных Vision-Language-Action (VLA) моделей для манипуляции. Несмотря на то, что им всего около года (π₀ была представлена ровно год назад — 31 октября 2024), текущие системы уже можно считать вторым поколением VLA-подходов. Их ключевое отличие — появление…

31 октября 2025, пятница 12:22 Оставить комментарий Источник

Похожие материалы

Isaac GR00T N1: как Nvidia внедряет научные идеи Канемана в робототехнику

Пару дней назад на конференции GTC 2025 Nvidia представила первую open source модель для гуманоидных роботов — Isaac GR00T N1. Оммаж Marvel Studios считывается на ура и объясняется стратегическим партнерством Nvidia с Disney Research и Google DeepMind в области робототехники — на той же конференции гендиректор Nvidia…

24 марта 2025, понедельник 16:04 Источник
Несколько слов в защиту VLA

Исходный вариант этого опуса я написал еще в 2019 на другом ресурсе. Он планировался как вялый ответ на поток совершенно незаслуженной критики, направленной на такое свойство языка, как Variable Length Array (VLA). Поток обладал свойствами типичной эхо-камеры и пытаться противостоять ему…

8 августа 2022, понедельник 9:51 Источник
CognitiveDrone: система на VLA с когнитивными способностями для управления летающим роботом в трехмерном пространстве

VLA-модели объединяют визуальное восприятие, понимание естественного языка и выполнение физических действий. Обычно они применяются для манипуляций — например, чтобы робот взял предмет или повернул рычаг. Но управление роботом, особенно летающим, это не всегда изменение…

9 декабря 2025, вторник 7:00 Источник

GR00T N1.5: архитектура, данные и эволюция VLA-моделей

Комментарии

Похожие материалы

Isaac GR00T N1: как Nvidia внедряет научные идеи Канемана в робототехнику

Несколько слов в защиту VLA

CognitiveDrone: система на VLA с когнитивными способностями для управления летающим роботом в трехмерном пространстве