← К карте трендов

Способности · Тренд

Ограничения вероятностного рассуждения LLM

Бенчмаркинговое исследование показывает, что LLM достигают 96% точности на стандартных задачах вероятности, но лишь 59% на контринтуитивных, при этом производительность падает на 20–34% при токен-предвзятости и вводящих в заблуждение подсказках.

Сила тренда 3/10
Импульс +3/кв
Уверенность низкая
Статус новое
Горизонт прогноза

Связи

Связи · 2

Как этот узел связан с остальной картой и какие подтверждения стоят за связями.

Источники сигнала

Источники сигнала

Датированные факты из первоисточников по этому направлению.