OpenAI випускає нову модель, здатну міркувати та зі знаннями рівня PhD: що відомо про o1-preview та o1-mini

2 місяця назад

OpenAI випускає нову модель під назвою o1, першу в запланованій серії моделей штучного інтелекту здатних, до міркування» та ланцюжкового мислення. Ця серія відзначається покращеними здібностями до міркування та вирішення складних завдань у галузях природничих наук, програмування і математики та розв’язує проблеми на рівні здібного випускника аспірантури. Розповідаємо, кому знадобиться o1, у чому відмінність від попередніх версій, які має недоліки та переваги. 

Нові моделі o1-preview та o1-mini від OpenAI: що це та як їх використовувати

OpenAI навчав попередні моделі GPT імітувати шаблони зі своїх навчальних даних. Натомість o1 навчали самостійно розв’язувати проблеми за допомогою техніки, відомої як навчання з підкріпленням, яка навчає систему за допомогою винагород і покарань. Вона використовує «ланцюг думок» для оброблення запитів, подібно до того, як люди обробляють проблеми, розглядаючи їх крок за кроком.

Версії o1-preview та o1-mini працюють подібно до докторів наук у складних контрольних завданнях з фізики, хімії та біології. Система також чудово вирішує завдання з математики та програмування.

«Модель, безумовно, розв’язує тест з математики краще, ніж я, а я вивчав математику в коледжі», — каже головний науковий співробітник OpenAI Боб МакГрю. 

До прикладу, на відбірковому іспиті до Міжнародної олімпіади з математики GPT-4o (попередня версія) правильно розв’язав лише 13% задач, тоді як модель міркування набрала 83%. Здібності до кодування оцінювали на змаганнях і досягли 89% процентиля на змаганнях Codeforces (саме версія o1-mini призначена для програмування). 

Чим відрізняється o1-preview та o1-mini від версій GPT

Наразі версії o1, зокрема o1-preview та o1-mini, доступні у пробній версії. У компанії зазначають, що o1 поки що не має певних переваг GPT-4o. Ці моделі штучного інтелекту не генерують відповідь одразу, а розбивають задачу на фрагменти та перевіряють самі себе, а тому відповідь доведеться очікувати дещо довше. Також вони ще не мають багатьох функцій, які роблять ChatGPT корисним, як-от пошук інформації в інтернеті та завантаження файлів і зображень.

Користувачі Reddit, які вже перевірили деякі можливості нових версій, також зауважують, що ця модель не надто добра для перекладу з однієї мови на іншу. Переклад гірший за GPT-4o і не надто креативний. Він простий і мало піклується про контекст.

«Але для складних завдань міркування це значний прогрес і пропонує новий рівень можливостей ШІ. Враховуючи це, ми повертаємо лічильник до 1 і називаємо цю серію OpenAI o1», — кажуть у релізі компанії.

Оскільки це попередній перегляд, то варто також очікувати оновлень та покращень, які розробляються вже зараз. 

Для кого корисним буде o1 від OpenAI та скільки він коштує

Ці розширені можливості міркування можуть бути особливо корисними, якщо ви розв’язуєте складні завдання у науці, кодуванні, математиці тощо. Тобто це корисний інструмент для дипломних робіт, дисертацій, досліджень, маркетингових стратегій, розрахунків тощо. Він не надто практичний для швидких повсякденних завдань. Не лише через тривалий час відповіді, а й через вартість та ліміти. 

Користувачі ChatGPT Plus (платна версія за $20/міс.) і Team (корпоративне рішення для команди) мають тижневе обмеження на 30 повідомлень для o1-preview та 50 для o1-mini. 

Користувачі ChatGPT Enterprise та Edu отримають доступ до обох моделей з наступного тижня. 

Щодо розробників, які використовують API, то вони наразі мають обмеження до 20 запитів на хвилину. O1-preview має високу ціну в API — $15 за 1 млн вхідних токенів (токен приблизно дорівнює слову) і $60 за 1 млн токенів, що значно дорожче, ніж GPT-4o. Для порівняння, GPT-4o коштує $5 за 1 млн вхідних токенів і $15 за 1 млн вихідних.

Також у компанії заявили, що планують надати доступ o1-mini для всіх користувачів безкоштовної версії ChatGPT.

Є також деякі офіційні рекомендації, як краще використовувати цей інструмент. Серед них: 

  • Робіть запити простими та прямолінійними: модель o1 чудово розуміє та відповідає на короткі, чіткі інструкції без потреби у великих поясненнях.
  • Уникайте промптів з ланцюжком міркувань (йдеться про Chain Of thoughts і «думай крок за кроком»): оскільки модель виконує логічні висновки в собі, не потрібно спонукати її «думати крок за кроком» або «пояснювати свою думку вголос».
  • Використовуйте розділювачі для ясності: використовуйте роздільники, як-от потрійні лапки “`, XML-теги або заголовки розділів, щоб чітко позначити різні частини введення, допомагаючи моделі правильно інтерпретувати різні секції.

Чому моделі штучного інтелекту, які міркують, — це великий прорив

Великі мовні моделі не такі розумні, як багато хто вважає. По суті, вони просто передбачають послідовності слів, щоб отримати відповідь на основі шаблонів, отриманих із величезної кількості даних. Наприклад, ChatGPT на основі мовних моделей часто помиляється, коли його просять визначити, скільки разів трапляється літера “r” у слові strawberry. Все тому, що попри «мовність» у назві для попередніх моделей, це слово існує як токен — послідовність певних цифр.  

Для дослідників штучного інтелекту міркувань є важливим наступним кроком до інтелекту на рівні людини. Вважається, що якщо модель здатна не тільки розпізнавати образи, вона може відкрити прорив у таких сферах, як медицина та інженерія. Наразі здатність міркування від o1 досі є дискусійною (щоправда, навіть людям важко визначити, що вони вкладають у це поняття), відносно повільною та дорогою. 

Водночас OpenAI прагне залучити більше фінансування, а воно напряму залежить від нових наукових проривів. Компанія надає можливості міркування для LLM, оскільки бачить майбутнє за автономними системами або агентами, які здатні ухвалювати рішення та виконувати дії від вашого імені.

116
0
Дивіться також
Netpeak Group та Мінцифри запустили курс навчання з користування штучним інтелектом. Там викладатимуть технології написання текстів, створення картинок та вирішення завдань за ...
OpenAI анонсував випуск свого наступного великого продукту: модель генеративного штучного інтелекту під кодовою назвою Strawberry, офіційна назва OpenAI ...
Я – Стася Серб, зараз працюю проєктною менеджеркою в ІТ-компанії SoftServe, а загальний досвід у сфері менеджменту маю ...