Головне з Google I/O 2024

6 місяців назад

На щорічній конференції Google I/O запропонував кілька нових інструментів на базі штучного інтелекту, зокрема генерацію відео, особистого помічника, платформу для синтезу музики та просунутий пошук у мережі. Водночас виступ техногіганта виглядав не так переконливо, як нещодавня презентація від OpenAI. 

Що нового у ШІ-сервісах від Google

  • Головним помічником в Android може стати Gemini, яка тепер підтримує повноцінний діалог із співрозмовником. Також її можна перебивати або ж нагадувати про попередні фрагменти розмови. Про долю Google Assistant нічого не повідомляється, але його цілком можуть закрити як проєкт.
  • Google додає в пошук штучний інтелект. Gemini вже показує повністю згенеровані штучним інтелектом відповіді на більшість пошукових запитів у верхній частині сторінки для користувачів із США.
  • Google Photo аналізуватиме контекст фотографій. Можна буде не тільки шукати зображення за описом знятого, але й робити тематичні добірки за запитом.
  • Тепер Gmail надаватиме витяги з електронних листів, а також можна буде об’єднати кілька листів і створити з них зведення.
  • Запуститься Music AI Sandbox – інструмент для генерації музичного зразка на основі текстового опису або вхідної звукової доріжки.

Нові можливості Gemini 1.5 Pro

  • Оновлений застосунок Gemini 1.5 Flash. Цей продукт працює з текстом, зображенням, кодом, та іншими видами контенту. Наявний Gemini 1.5 Pro зараз використовують понад 1.5 млн розробників. Застосунок також працює із пошуком Google.
  • ШІ для освіти: система каталогізує та пояснює навчальний матеріал, у тому числі на побутових прикладах.
  • Контекстне вікно для Gemini Pro, яке стосується того, скільки інформації модель може розглянути в даному запиті, подвоюється до 2 мільйонів токенів, і Google каже, що модель краще виконує інструкції, ніж будь-коли.
  • Аналіз PDF-файлів до 1500 сторінок або відео тривалістю до 1 години.
  • Можливість генерації відео за запитом. Наразі тривалість до 1 хв, а система поки не доступна для використання.
  • Штучний інтелект підтримуватиме 35 мов і матиме найбільше контекстне вікно серед усіх конкурентів.
  • Захист від шахрайських дзвінків. ШІ аналізуватиме ваші розмови в режимі реального часу, і якщо співрозмовник поведеться підозріло, наприклад, попросить ваші банківські реквізити, подасть сигнал тривоги та попередить про можливе шахрайство.

Як та коли запрацюють Google Veo, Imagen 3 та Audio Overviews

Окрім апдейтів Gemini техкомпанія анонсувала «Veo», модель для створення відео за запитом та Imagen 3, покращену нейромережу перетворення тексту в зображення, яка обіцяє реалістичні зображення та «менше відволікаючих візуальних артефактів, ніж наші попередні моделі».

Однак схоже Google ще не впевнений у надійності продуктів. оскільки повноцінного доступу користувачі наразі не отримають. За словами представників компанії, інструменти будуть доступні для окремих творців у понеділок і з’являться на Vertex AI, платформі машинного навчання Google. Також щодо Imagen 3 то доступ лише по заявках та наявний не для всіх країн.  

Компанія також продемонструвала «Audio Overviews», здатність генерувати аудіообговорення на основі введення тексту. Наприклад, якщо користувач завантажує план уроку, чат-бот може озвучити його короткий зміст. 

Нові функції пошуку

Технологічний гігант запускає «AI Overviews» в Пошуку Google у понеділок у США. Огляди штучного інтелекту показують короткий підсумок відповідей на найскладніші запитання пошуку, за словами Ліз Рейд, керівника Пошуку Google. Також пошук зможе фільтрувати результати, які відповідають одразу кільком вимогам. Наприклад, вам потрібен ресторан схвалений місцевими, який можна відвідувати з тваринами та який має літню терасу, то AI Overviews врахує усі запити та надасть відповідь, яка відповідатиме усім вимогам. 

В одному прикладі Google показав, як хтось знімає зламаний програвач, запитуючи, чому він не працює. Пошук Google знайшов модель програвача та припустив, що він міг бути несправним через неправильне балансування.

Що таке проєкт Astra від Google та коли він запрацює

Проєкт Astra — це останній прогрес Google у розробці свого помічника зі штучним інтелектом, який створює підрозділ Google DeepMind AI. Наразі це лише прототип.

У демонстраційному відео, представленому на Google I/O, помічник — за допомогою відео та аудіо, а не через інтерфейс чат-бота — зміг допомогти користувачеві згадати, де він залишив окуляри, переглянути код і відповісти на запитання про те, що відбувається у кадрі.

Демонстрація сталася після демонстрації OpenAI подібної аудіорозмови з ChatGPT, за допомогою нової нейромережі GPT-4o. Сундар Пічаї (гендиректор Alphabet) сказав, що очікує запуску проєкту Astra в Gemini пізніше цього року. 

У Google заявили, що справді корисний чатбот повинен дозволяти користувачам «розмовляти з ним природно та без затримок». Розмова у демонстраційному відео відбувалася в реальному часі, без лагів. Хоча генеральний директор DeepMind Деміс Хассабіс сказав, що «скоротити час відповіді на реальну мову — складне інженерне завдання». У ЗМІ він також зазначав, що упродовж шести місяців пришвидшення системи було одним із найважливіших завдань команди.

 

 

107
0
Дивіться також
Netpeak Group та Мінцифри запустили курс навчання з користування штучним інтелектом. Там викладатимуть технології написання текстів, створення картинок та вирішення завдань за ...
OpenAI випускає нову модель під назвою o1, першу в запланованій серії моделей штучного інтелекту здатних, до міркування» та ланцюжкового ...
OpenAI анонсував випуск свого наступного великого продукту: модель генеративного штучного інтелекту під кодовою назвою Strawberry, офіційна назва OpenAI ...