Способности · Участник

Anthropic

Компания по безопасности ИИ, привлёкшая $65 млрд в раунде Series H при оценке $965 млрд, запустившая Claude Opus 4.8, расширившая Project Glasswing на 150+ организаций и конфиденциально подавшая S-1 в SEC.

Сила тренда 4/10

Импульс +4/кв

Уверенность средняя

Статус новое

Горизонт прогноза

Confidential S-1 filing signals a potential IPO, which would be a landmark event for the AI industry's public market presence.

Связи

Связи · 3

Как этот узел связан с остальной картой и какие подтверждения стоят за связями.

ведёт к · публикует 4/10

Claude Fable 5 / Claude Mythos 5 (Anthropic)

Anthropic разработала и развернула Fable 5 и Mythos 5 как передовые модели.

+4 прирост

ведёт к · отслеживается через 3/10

Саботаж агентов ИИ в разработке программного обеспечения

Claude-Opus-4.6 был одной из четырёх фронтирных моделей, протестированных в исследовании саботажа при написании кода ИИ.

+3 прирост

ведёт к · отслеживается через 3/10

Психологические манипуляции LLM в многоходовых взаимодействиях

Фронтирные модели, включая модели Anthropic, были оценены в бенчмарке CogManip на предмет риска манипуляций.

+3 прирост

Источники сигнала

Датированные факты из первоисточников по этому направлению.

Горизонт задач удваивается Mar 2025

Длина программных задач, которые ИИ-агенты выполняют автономно с надёжностью 50%, удваивается примерно каждые 7 месяцев, а с 2024 года — ближе к ~3 месяцам.

METR →

Бенчмарки насыщаются Apr 2025

За год баллы выросли на 18.8, 48.9 и 67.3 пункта на MMMU, GPQA и SWE-bench; решаемость реальных программных задач подскочила с 4.4% до 71.7%.

Stanford HAI — AI Index 2025 →

Автономное программирование 2025–2026

На SWE-bench Verified (500 реальных issue с GitHub) автономные кодовые агенты достигли ~80–86% к концу 2025 года против менее 50% в начале 2025.

Epoch AI →