Президент OpenAI Грег Брокман озвучил позицию, которая рискует стать определяющей для всей индустрии AI: ставка на развитие исключительно текстовых моделей как основного пути к общему искусственному интеллекту (AGI). Это не просто очередная громкая декларация. Если OpenAI действительно видит в LLM самодостаточный локомотив для достижения AGI, отодвигая в сторону мультимодальные системы, это означает перераспределение ресурсов и, как следствие, конкурентного ландшафта. Уменьшение акцента на обработке изображений, видео и звука может позволить сосредоточить огромные вычислительные мощности на совершенствовании языковых моделей. Суть проста: либо это прорыв, который позволит OpenAI вырваться вперёд, либо многомиллиардные инвестиции в это направление окажутся, мягко говоря, преждевременными.
Эта стратегия вызвала ожидаемую реакцию. Ян ЛеКун из Meta и Демис Хассабис из Google DeepMind, мягко говоря, не разделяют оптимизма OpenAI. ЛеКун резонно указывает на необходимость для AGI обладать не только языковыми навыками, но и способностью к планированию, долгосрочной памяти и пониманию причинно-следственных связей в реальном мире, а не только в тексте. Хассабис же, при своей дипломатичности, намекает, что целостное понимание мира требует комплексного подхода, а не только текстовой информации. Однако, в OpenAI, похоже, делают ставку на то, что именно архитектура GPT, развиваясь вглубь, сможет превзойти эти ограничения.
Почему это важно: пока крупные игроки, такие как Google, продолжают активно инвестировать в мультимодальные AI-системы, OpenAI сознательно ограничивает свой фокус. Если их ставка на 'текстоцентричный' AGI окажется верной, это может создать существенное конкурентное преимущество для тех, кто уже развивает или быстро освоит соответствующие технологии. В то время как одни компании будут осваивать тонкости взаимодействия с визуальными и звуковыми данными, другие получат возможность глубже погрузиться в решение задач, требующих сложного языкового анализа и генерации. Это касается всего: от автоматизации юридической поддержки и маркетинговых коммуникаций до персонализированного обучения и научного моделирования. Вам следует оценить, насколько такой 'текстовый' вектор развития AI соответствует долгосрочным целям вашего бизнеса, и не рискуете ли вы, фокусируясь на других направлениях, упустить следующий этап эволюции искусственного интеллекта, который, возможно, будет говорить только на языке слов.