← К карте трендов

Способности · Тренд

ИИ-агенты

Целеустремлённые системы, которые планируют, используют инструменты и действуют в ПО, — определяющий фронтир 2025–2026.

Сила тренда 10/10

Импульс +3/кв

Уверенность высокая

Статус усиливается

Горизонт прогноза

Агенты переходят от демо к делегированной работе в реальных процессах; узким местом становятся надёжность и надзор.

Связи

Связи · 8

Как этот узел связан с остальной картой и какие подтверждения стоят за связями.

ведёт к · требует 8/10

Рассуждающие модели

Агенты опираются на рассуждение, чтобы планировать многошаговые действия.

+3 прирост

ведёт к · применяется к 8/10

Автономное программирование

Разработка ПО — первая область, где агенты действуют сквозь весь цикл.

+3 прирост

ведёт к · требует 7/10

Длинный контекст и память

Действие на длинных горизонтах требует постоянной памяти.

+2 прирост

ведёт к · использует 7/10

Вычисления на инференсе

Агенты тратят вычисления на инференсе для поиска и самокоррекции.

+2 прирост

входит · делает возможным 7/10

Падение цены инференса

Дешёвый инференс делает длинные агентные прогоны доступными.

+3 прирост

ведёт к · отслеживается через 6/10

Оценка опасных способностей

Автономность повышает ставки предрелизной оценки.

+3 прирост

входит · отслеживается через 6/10

Оценка опасных способностей

Агентную автономность сложнее всего оценивать.

+3 прирост

входит · отслеживается через 6/10

Труд и автоматизация

Агентная автоматизация перестраивает труд на уровне задач.

+2 прирост

Источники сигнала

Источники сигнала

Датированные факты из первоисточников по этому направлению.

Горизонт задач удваивается Mar 2025

Длина программных задач, которые ИИ-агенты выполняют автономно с надёжностью 50%, удваивается примерно каждые 7 месяцев, а с 2024 года — ближе к ~3 месяцам.

Бенчмарки насыщаются Apr 2025

За год баллы выросли на 18.8, 48.9 и 67.3 пункта на MMMU, GPQA и SWE-bench; решаемость реальных программных задач подскочила с 4.4% до 71.7%.

Stanford HAI — AI Index 2025 →

Автономное программирование 2025–2026

На SWE-bench Verified (500 реальных issue с GitHub) автономные кодовые агенты достигли ~80–86% к концу 2025 года против менее 50% в начале 2025.