Спустя восемь дней после запуска Composer 2, который Cursor обещал как новую веху в производительности и ценовой политике, разработчик по имени Финн наткнулся на API-идентификатор `kimi-k2p5-rl-0317-s515-fast`. В компании так старательно убеждали в собственной разработке, а оказалось, что за фасадом «Composer 2» скрывается, судя по всему, другая модель. Все эти презентации, графики эффективности по Парето и ценовая стратегия, рассчитанная на подкоп под всех конкурентов — оказывается разоблачены одной строкой, которую никто не подумал переименовать. Акт 1: подготовка За восемь дней до запуска Composer 2 Cursor опубликовал нечто, заслуживающее большего внимания, чем получило. 11 марта команда выпустила детальный пост, представляющий CursorBench — внутреннюю систему оценки кодинг-агентов. Что бы вы ни думали о том, что произошло позже, этот бенчмарк — действительно инновационный. Задачи берутся из реальных сессий Cursor через систему Cursor Blame, отслеживающую код до породившего его запроса. Намеренно неоднозначные промпты — как разработчики реально общаются с агентами. Масштаб задач примерно удвоился от первой до третьей версии. Эффективность по токенам — метрика первого класса. Четыре измерения оценки, а не только «прошёл/не прошёл тест». Затем — инженерия самой модели. Cursor разработал «компактификацию в цикле RL»: с
© The Value Engineering 2026
← Назад к аналитике
Composer 2: секрет модели Cursor и прозрачность
Разоблачение Composer 2: API ID указывает на другую модель, скрытую за фасадом "собственной разработки" Cursor. Анализ бенчмарка CursorBench и "компактификации в цикле RL".
★
★
★
★
★