OpenAI заявила о снижении политической предвзятости на 30%

Исследователи OpenAI опубликовала исследование, показывающее, что её новые модели GPT-5 Instant и GPT-5 Thinking демонстрируют на 30% меньшую политическую предвзятость, чем предыдущие версии, включая GPT-4o и o3. Компания разработала систему оценки нейтральности моделей.
Работу провело подразделение Model Behavior, возглавляемое Джоан Джанг, которое разрабатывает методы измерения и снижения политической предвзятости в больших языковых моделях. Команда протестировала модели на 500 политически окрашенных запросах — от нейтральных до эмоциональных — чтобы определить, как ChatGPT реагирует на разные формулировки.
По результатам тестов, модели GPT-5 чаще формулируют сбалансированные ответы, избегают эмоциональных суждений и демонстрируют меньше склонности к определённой идеологии. Исследовательница Натали Штаудахер назвала это «самым масштабным шагом OpenAI в сторону измеряемой нейтральности».
В отчёте говорится, что даже при стресс-тестах, когда модель сталкивалась с провокационными вопросами, уровень политического уклона оставался «низким и редким». Штаудахер отметила: «Миллионы людей используют ChatGPT, чтобы понять мир. Определяя, что такое предвзятость, мы создаём прозрачные стандарты и подотчётность».
Исследование вышло вскоре после ежегодной конференции OpenAI DevDay, где компания представила инструменты для создания приложений на базе ChatGPT. Если DevDay продемонстрировал функциональные возможности модели, то новое исследование сфокусировано на её поведенческой нейтральности.
Эксперты отмечают, что OpenAI стремится укрепить доверие к своим системам после критики за идеологическую предвзятость и влияние на общественное мнение. Новая методика измерения уклона может стать отраслевым стандартом для компаний, разрабатывающих генеративный искусственный интеллект.
В начале этой недели a16z Podcast опубликовал интервью с Сэмом Альтманом, в котором он рассказал о планах OpenAI по созданию будущих интерфейсов, моделях монетизации и долгосрочном пути к искусственному общему интеллекту (AGI).
