Надёжный ИИ знает, когда сказать: «Это не имеет смысла»
BullshitBench показывает, почему надёжный ИИ должен выявлять ошибочные посылки, а не просто генерировать беглые ответы. Обзор надёжности ИИ, возражений и обнаружения ложных посылок.
День назад
91