Безопасность · Тренд
Оценка опасных способностей
Тесты до развёртывания на кибер-, био- и автономные риски становятся условием выпуска.
Оценки стандартизуются и проходят аудит; наука о том, «что доказывает тест», вынуждена догонять.
Связи
Связи · 6
Как этот узел связан с остальной картой и какие подтверждения стоят за связями.
Институты превращают оценку в постоянную общественную мощность.
+3 приростАвтономность повышает ставки предрелизной оценки.
+3 приростРезультаты оценок задают пороги в рамках безопасности.
+2 приростАгентную автономность сложнее всего оценивать.
+3 приростСеть продвигает общие методы оценки.
+3 приростБританский институт публикует открытые оценки.
+2 приростИсточники сигнала
Источники сигнала
Датированные факты из первоисточников по этому направлению.
В июне 2025 года Институт безопасности ИИ США переименован в Центр стандартов и инноваций ИИ (CAISI) с разворотом к безопасности, стандартам и оценке моделей противников.
NIST →Anthropic активировала стандарт развёртывания и безопасности ASL-3 вместе с Claude Opus 4 22 мая 2025 — первое реальное срабатывание ступени ответственного масштабирования, нацеленное на блокировку биорисков.
Anthropic →Международная сеть институтов безопасности ИИ (создана в ноябре 2024) провела третье совместное тестирование, сфокусированное на агентных ИИ-системах по кибер- и мошенническим направлениям.
European Commission — AI Office →