Способности · Тренд
ИИ-агенты
Целеустремлённые системы, которые планируют, используют инструменты и действуют в ПО, — определяющий фронтир 2025–2026.
Агенты переходят от демо к делегированной работе в реальных процессах; узким местом становятся надёжность и надзор.
Связи
Связи · 8
Как этот узел связан с остальной картой и какие подтверждения стоят за связями.
Агенты опираются на рассуждение, чтобы планировать многошаговые действия.
+3 приростРазработка ПО — первая область, где агенты действуют сквозь весь цикл.
+3 приростДействие на длинных горизонтах требует постоянной памяти.
+2 приростАгенты тратят вычисления на инференсе для поиска и самокоррекции.
+2 приростДешёвый инференс делает длинные агентные прогоны доступными.
+3 приростАвтономность повышает ставки предрелизной оценки.
+3 приростАгентную автономность сложнее всего оценивать.
+3 приростАгентная автоматизация перестраивает труд на уровне задач.
+2 приростИсточники сигнала
Источники сигнала
Датированные факты из первоисточников по этому направлению.
Длина программных задач, которые ИИ-агенты выполняют автономно с надёжностью 50%, удваивается примерно каждые 7 месяцев, а с 2024 года — ближе к ~3 месяцам.
METR →За год баллы выросли на 18.8, 48.9 и 67.3 пункта на MMMU, GPQA и SWE-bench; решаемость реальных программных задач подскочила с 4.4% до 71.7%.
Stanford HAI — AI Index 2025 →На SWE-bench Verified (500 реальных issue с GitHub) автономные кодовые агенты достигли ~80–86% к концу 2025 года против менее 50% в начале 2025.
Epoch AI →