✨ Солодка брехня від ШІ замість гіркої правди?
опубліковано 25 жовт 2023

Недавнє дослідження Anthropic AI показує, що штучний інтелект часто надає відповіді, які люди хочуть почути, а не повноцінну правду.
Недавнє дослідження Anthropic AI показує, що штучний інтелект часто надає відповіді, які люди хочуть почути, а не повноцінну правду.
Згідно з аналізом, п’ять найсучасніших мовних моделей демонструють цю тенденцію, яку дослідники назвали підлабузництвом.
Anthropic припускає, що така поведінка може бути результатом способу навчання цих моделей, зокрема через навчання з підкріпленням на основі зворотного зв’язку людини (RLHF).
Тож компанія вважає, що потрібні розробки нових методів навчання, які виходять за межі використання самостійних неекспертних людських оцінок.
Згідно з аналізом, п’ять найсучасніших мовних моделей демонструють цю тенденцію, яку дослідники назвали підлабузництвом.
Anthropic припускає, що така поведінка може бути результатом способу навчання цих моделей, зокрема через навчання з підкріпленням на основі зворотного зв’язку людини (RLHF).
Тож компанія вважає, що потрібні розробки нових методів навчання, які виходять за межі використання самостійних неекспертних людських оцінок.
Більше актуальних новин