Composer 2: секрет модели Cursor и прозрачность

Спустя восемь дней после запуска Composer 2, который Cursor обещал как новую веху в производительности и ценовой политике, разработчик по имени Финн наткнулся на API-идентификатор `kimi-k2p5-rl-0317-s515-fast`. В компании так старательно убеждали в собственной разработке, а оказалось, что за фасадом «Composer 2» скрывается, судя по всему, другая модель. Все эти презентации, графики эффективности по Парето и ценовая стратегия, рассчитанная на подкоп под всех конкурентов — оказывается разоблачены одной строкой, которую никто не подумал переименовать. Акт 1: подготовка За восемь дней до запуска Composer 2 Cursor опубликовал нечто, заслуживающее большего внимания, чем получило. 11 марта команда выпустила детальный пост, представляющий CursorBench — внутреннюю систему оценки кодинг-агентов. Что бы вы ни думали о том, что произошло позже, этот бенчмарк — действительно инновационный. Задачи берутся из реальных сессий Cursor через систему Cursor Blame, отслеживающую код до породившего его запроса. Намеренно неоднозначные промпты — как разработчики реально общаются с агентами. Масштаб задач примерно удвоился от первой до третьей версии. Эффективность по токенам — метрика первого класса. Четыре измерения оценки, а не только «прошёл/не прошёл тест». Затем — инженерия самой модели. Cursor разработал «компактификацию в цикле RL»: с

Источник: Хабр: ИИ →

Оцените материал

★ ★ ★ ★ ★

Composer 2CursorAIмоделиразработкаAPI

Composer 2: Разоблачение Cursor или просто ошибка?