OpenAI випустила o1 — свою першу модель зі здатністю міркувати — Лайфхакер

24.09.2024012

OpenAI випустила свою нову генеративну модель під назвою o1. Це перша ластівка в запланованій серії нейромереж, що «розважають», навчених відповідати на складні питання швидше людей. Її представили разом з o1-mini — меншою та дешевшою версією. Зважаючи на все, це і є розрекламований проект Strawberry, який, як повідомлялося, був засекречений навіть усередині компанії.

Зображення: OpenAI

Це черговий крок творців ChatGPT до своєї ключової мети — створення штучного інтелекту, який можна порівняти з людським розумом. Якщо говорити про практичні нововведення, то новинка краще справляється з написанням коду та вирішенням багатокрокових завдань у порівнянні з попередниками. Але вона також дорожча і повільніша. Тому для повсякденних справ краще використати старі інструменти.

Модель також здатна самостійно виправляти помилки, використовуючи техніку навчання з підкріпленням (Reinforcement Learning, RL) – систему заохочень та штрафів. Ще вона вміє запускати «ланцюжок думок» для обробки запитів, подібно до того, як люди справляються з труднощами — крок за кроком. Іншими словами, вона сама може перевіряти себе і робити певні висновки на майбутнє, зберігаючи їх у своїй пам'яті. При цьому повністю позбутися галюцинацій ще не вдалося, зізналися розробники. Проблема залишається, але вже набагато меншою мірою.

Натомість у математиці вона вже майже як риба у воді. Для порівняння: GPT-4o правильно вирішила лише 13% завдань із програми Міжнародної математичної олімпіади, а o1 набрала 83%.

Вона безперечно краще справляється з тестом з математики AP, ніж я, а я вивчав математику в коледжі.

Головний науковий співробітник OpenAI

Навчання, що лежить в основі o1, принципово відрізняється від попередніх методів, розповів керівник досліджень компанії Джеррі Творек. З нею використовували інші алгоритми та новий набір даних. Компанія називає реліз «попереднім переглядом», щоб наголосити, що вона ще молода.

Користувачі ChatGPT Plus та Team отримують o1 та o1-mini вже сьогодні. Клієнти Enterprise та Edu зможуть почати випробовувати їх на початку наступного тижня. Пізніше OpenAI обіцяє зробити «міні» загальнодоступною.