Сем Альтман в a16z Podcast: про майбутнє AGI, Sora та рекламу

Фото - Сем Альтман в a16z Podcast: про майбутнє AGI, Sora та рекламу
a16z Podcast опублікував інтерв'ю з Семом Альтманом, де той розповів про майбутні інтерфейси, плани щодо монетизації та рух до AGI. Питання ставили засновник a16z Бен Горовіц та його партнер Ерік Торенберг.
Розмова стосувалася ключових стратегій OpenAI: як компанія рухається до загального штучного інтелекту (AGI), про значення Sora та відеомоделей як «обкатки» нових інтерфейсів, які схеми монетизації планує використовувати та як розподіляє GPU між продуктом і дослідженнями. Але все це так чи інакше оберталося навколо питання про необхідність персональної підписки та проблем із довірою користувачів.

Протягом бесіди Альтман багаторазово повертався до теми загального інтелекту як основного вектора розвитку, та до необхідності зберегти лояльність аудиторії. Саме на цьому тримається весь амбітний план.
Ми хочемо бути персональною ШІ-підпискою для людей. Думаю, у більшості вона буде. У когось навіть кілька. Її використовуватимуть і в наших споживчих продуктах, і при вході в сторонні сервіси, і на окремих пристроях. У якийсь момент у вас з'явиться ШІ, який вас чудово знає і справді вам допомагає. Саме це ми хочемо втілити. А щоб це працювало, нам доводиться будувати гігантську інфраструктуру. Але мета, місія: побудувати AGI і зробити його дійсно корисним для людей.
Від цієї відправної точки Альтман переходить до Sora — продукту, який критики схильні записувати до «розважальних дослідів», тоді як Сем описує його як допоміжні сходинки на шляху до світових моделей. Відео стає будівельним матеріалом для нових інтерфейсів: воно впливає сильніше за текст, наближає взаємодію до реальності, хоча й несе в собі величезні ризики від дипфейків до надлишку візуального контенту.

Логіка Альтмана така: Sora створена, щоб демонструвати майбутні можливості до того, як вони будуть масово впроваджуватися, щоб у суспільства з'явився час на вироблення норм і правил їх використання. Водночас OpenAI не виділяє і не планує виділяти на Sora багато обчислювальних ресурсів. У пріоритеті були і залишаються ШІ-дослідження.
По-перше, круто робити чудові продукти, і людям подобається нова Sora. По-друге, важливо дати суспільству відчути, що нас очікує далі — у спільному процесі еволюції. Дуже скоро світові доведеться мати справу з неймовірними відеомоделями, здатними відтворити будь-кого або показати будь-що. Це велике досягнення, але суспільству потрібен час адаптуватися. Як із ChatGPT: тоді світ мав усвідомити, на якому етапі ми перебуваємо. Тепер важливо, щоб усі швидко зрозуміли, в якому напрямі розвивається відео, тому що воно має набагато сильніший емоційний вплив, ніж текст.
Головний горизонт компанії — створення самостійного ШІ-науковця. Альтман каже, що поки не готовий робити гучні заяви, проте у GPT‑5 вже видно «маленькі-маленькі приклади» зародження наукової самостійності. Перекладаючи на практичну мову: найбільш змістовні перегони зміщуються з таблиць бенчмарків до здатності моделей генерувати знання, починаючи від коректних доказів складних теорем до відкриттів, які принципово змінюють хід наукових досліджень. На його думку, саме такий результат може бути чесною метрикою прогресу, а не черговий пункт у статичному наборі завдань.
Мене найбільше надихає ідея ШІ-науковця. Ще зовсім недавно це звучало божевільно, а популярне розуміння тесту Тюрінга вже промчало повз нас. Довгий час він здавався недосяжним, а потім ми раптом просто його минули. Світ трохи здивувався, кілька тижнів це обговорював — і пішов далі. І вперше з GPT‑5 ми бачимо маленькі-маленькі приклади того, як це починає ставати реальністю. Думаю, через два роки моделі виконуватимуть більш складні наукові завдання та робитимуть важливі відкриття.
Коли розмова перейшла до економіки, Альтман став набагато прагматичнішим. Він заявив, що генерація відео є ресурсомістким процесом, отже, скоро з'являться моделі оплати «за одиницю» та рекламні формати.

Ключовий ризик Альтман формулює недвозначно: підірвана довіра відновлюється погано, тому рекомендації, продиктовані оплатою, а не якістю, виключені. Він наводить Instagram як приклад реклами, яка сприймається як сервіс, а не як нав'язування споживчих уподобань.
До реклами я відкритий, але обережний. Багатьом вона неприємна, мені теж, але в цілому це не табу. Просто потрібно дуже уважно обходити очевидні пастки. У людей до ChatGPT дуже високий рівень довіри: навіть якщо він помиляється, вони відчувають, що він намагається допомогти і робить правильні речі. Якщо ми цю довіру зрадимо... Скажімо, ви питаєте: “Яку кавоварку купити?”, а ми рекомендуємо не найкращу, а ту, за яку нам заплатили, ця довіра зникне відразу й назавжди.
Додатково Альтман описує практику та ризики монетизації. За його словами, поведінка користувачів у Sora виявилася ширшою, ніж очікувалося: крім професійної постановки роликів помітний «соціальний» сценарій — короткі смішні відео для друзів та чатів. Це передбачає принципово іншу економіку використання.
Sora‑відео дорого робити. Тому для сценаріїв, де люди генерують по сотні роликів на день, знадобиться інший підхід до оплати... швидше за все, потрібно брати плату за кожну генерацію, коли це такий затратний процес.
Він допускає рекламні формати для «довгого хвоста», але підкреслює: він не допустить жодних рекомендацій, продиктованих оплатою, інакше під ударом базовий актив компанії — довіра. Альтман визнає, що сайти та продавці роблять спроби маніпулювати моделлю: запускають генерацію масових позитивних відгуків та створюють «заточені» добірки, покликані змусити ШІ частіше рекомендувати їхній контент. Альтман уже зіткнувся з цією проблемою і поставив перед розробниками завдання пошуку надійних захистів від «SEO‑спаму нового покоління».
Люди вже роблять це... Не обов'язково підроблені відгуки, але масиви оплаченого контенту, написаного так, щоб сподобатися моделі... Не знаю поки що, як саме ми з цим боротимемося, але рішення точно скоро з'являться.
На боці творців контенту він очікує зворотний рух: спрощення виробництва (зокрема за допомогою Sora) стимулюватиме пропозицію, а згодом з'явиться модель поділу виручки у споживчих сценаріях.
Люди хочуть створювати набагато більше, ніж раніше... у якийсь момент за окремі формати може бути рев-шера (revenue share); зараз це звичайні “лайки”, але мотивація до створення нових сценаріїв вже сильно зросла.
Альтман називає дохід непрямою метрикою якості (поряд із науковою продуктивністю), на відміну від статичних бенчмарків, які легко «накачуються» та гірше відображають реальну корисність.

Підсумок по стратегії OpenAI на найближчий час:

  • вертикальна інтеграція стека (продукти/дослідження/інфраструктура) для прискорення розвитку та контролю якості;
  • при дефіциті GPU в пріоритеті будуть дослідження, а не розважальні масові співрозмовники;
  • акцент на ретельних перевірках фронтирних моделей з погляду їхньої безпеки;
  • обов'язкова монетизація: оплата за генерацію відео та обмежені рекламні формати без конфлікту інтересів;
  • Sora як полігон для відпрацювання інтерфейсів та правил перед масовим впровадженням.