Безопасность · Понятие
Наука оценки ИИ
Институт Ады Лавлейс призывает укрепить научную основу оценки ИИ для внесения ясности в риски и преимущества ИИ, решая текущие проблемы оценки.
Связи
Связи · 4
Как этот узел связан с остальной картой и какие подтверждения стоят за связями.
Доклад AISI о тенденциях в области фронтирного ИИ является примером доказательной науки оценки ИИ, применяемой к оценке фронтирных моделей.
+4 приростПонимание того, что рассуждения LLM — это сопоставление с образцом, а не абстрактное моделирование мира, информирует дизайн науки оценки ИИ.
+4 приростИнститут Ады Лавлейс опубликовал комментарий об укреплении науки оценки ИИ для внесения ясности в риски и преимущества ИИ.
+3 приростМетоды системной безопасности, применяемые к агентному ИИ, укрепляют науку оценки ИИ, выявляя риски, упускаемые тестированием на уровне модели.
+3 приростИсточники сигнала
Источники сигнала
Датированные факты из первоисточников по этому направлению.
В июне 2025 года Институт безопасности ИИ США переименован в Центр стандартов и инноваций ИИ (CAISI) с разворотом к безопасности, стандартам и оценке моделей противников.
NIST →Anthropic активировала стандарт развёртывания и безопасности ASL-3 вместе с Claude Opus 4 22 мая 2025 — первое реальное срабатывание ступени ответственного масштабирования, нацеленное на блокировку биорисков.
Anthropic →Международная сеть институтов безопасности ИИ (создана в ноябре 2024) провела третье совместное тестирование, сфокусированное на агентных ИИ-системах по кибер- и мошенническим направлениям.
European Commission — AI Office →