Сладкая ложь от ИИ вместо горькой правды?

опубликовано  25 окт 2023
Фото - Сладкая ложь от ИИ вместо горькой правды?
Недавнее исследование Anthropic AI показывает, что искусственный интеллект часто предоставляет ответы, которые люди хотят услышать, а не полноценную правду.
Недавнее исследование Anthropic AI показывает, что искусственный интеллект часто предоставляет ответы, которые люди хотят услышать, а не полноценную правду.

Согласно анализу, пять самых современных языковых моделей демонстрируют эту тенденцию, которую исследователи назвали подхалимством.

Anthropic предполагает, что такое поведение может быть результатом способа обучения этих моделей, в частности через обучение с подкреплением на основе обратной связи от человека (RLHF).

Поэтому компания считает, что нужно разрабатывать новые методы обучения, которые выходят за рамки использования неэкспертных человеческих оценок.

Больше актуальных новостей