Генеративные модели, привычно выдающие городские пейзажи, которые существуют только в их виртуальных головах, получили неожиданный холодный душ. Южнокорейский технологический гигант Naver представил Seoul World Model (SWM) — видео-генеративную модель, которая вместо полёта фантазии опирается на 1,2 миллиона реальных снимков из сервиса Naver Map. Иными словами, это первая попытка создать AI, который строит мир по кирпичикам реальной геометрии, а не выдумывает его с нуля.

Суть проста: большинство современных видео-моделей, сколь бы убедительными ни казались их первые кадры, на деле домысливают всё остальное. Naver же заставляет SWM цепляться за реальность. Модель специально обучали отличать статичные объекты от динамических — например, здания от проезжающих машин или прохожих, анализируя снимки, сделанные в разное время. Для поддержания визуальной связности и заполнения неизбежных пробелов в данных используется симуляция. Получается, художнику дали не пустой холст, а реальную карту местности и сказали: «Рисуй, но чтобы было похоже».

Результаты, заявленные в исследовании, выглядят многообещающе. SWM, по уверениям разработчиков, превзошла шесть других видео-моделей по визуальному качеству и временной согласованности. Но самое интересное — модель продемонстрировала способность к обобщению, выходя за рамки родного Сеула, и без дополнительного дообучения смогла работать с совершенно незнакомыми городами, будь то Пусан или Анн-Арбор. Это ставит вопрос о перспективах российских разработок, способных соединить два мира — реальные геоданные и генеративные способности — для создания по-настоящему полезного и достоверного контента.

Почему это важно: разработка Naver — сигнал для российских компаний. Значительное снижение «галлюцинаций» AI за счет интеграции с фактическими геоданными открывает новые горизонты для точного контента в картографии, VR и автономных системах, где цена ошибки высока. Стоит рассмотреть партнерство с картографическими сервисами или разработку собственных решений для создания достоверного контента, который нельзя сгенерировать «из головы», чтобы не остаться в цифровой пыли, генерируя лишь выдуманные миры.

Искусственный интеллектГенеративный ИИНейросетиКомпьютерное зрениеSeoul World Model