← К карте трендов

Безопасность · Тренд

Оценка опасных способностей

Тесты до развёртывания на кибер-, био- и автономные риски становятся условием выпуска.

Сила тренда 7/10

Импульс +3/кв

Уверенность высокая

Статус усиливается

Горизонт прогноза

Оценки стандартизуются и проходят аудит; наука о том, «что доказывает тест», вынуждена догонять.

Связи

Связи · 6

Как этот узел связан с остальной картой и какие подтверждения стоят за связями.

входит · закрепляется через 7/10

Институты безопасности ИИ

Институты превращают оценку в постоянную общественную мощность.

+3 прирост

входит · отслеживается через 6/10

ИИ-агенты

Автономность повышает ставки предрелизной оценки.

+3 прирост

ведёт к · питает 6/10

Рамки безопасности фронтира

Результаты оценок задают пороги в рамках безопасности.

+2 прирост

ведёт к · отслеживается через 6/10

ИИ-агенты

Агентную автономность сложнее всего оценивать.

+3 прирост

входит · стандартизует 5/10

Сеть институтов безопасности

Сеть продвигает общие методы оценки.

+3 прирост

входит · публикует 5/10

Институт безопасности ИИ (Великобритания)

Британский институт публикует открытые оценки.

+2 прирост

Источники сигнала

Источники сигнала

Датированные факты из первоисточников по этому направлению.

Центр оценок США Jun 2025

В июне 2025 года Институт безопасности ИИ США переименован в Центр стандартов и инноваций ИИ (CAISI) с разворотом к безопасности, стандартам и оценке моделей противников.

Защита фронтира May 2025

Anthropic активировала стандарт развёртывания и безопасности ASL-3 вместе с Claude Opus 4 22 мая 2025 — первое реальное срабатывание ступени ответственного масштабирования, нацеленное на блокировку биорисков.

Трансграничное тестирование 2025

Международная сеть институтов безопасности ИИ (создана в ноябре 2024) провела третье совместное тестирование, сфокусированное на агентных ИИ-системах по кибер- и мошенническим направлениям.

European Commission — AI Office →