xAI представила Grok 4.3: доступна модель ШІ для складних агентських завдань

xAI пропонує Grok 4.3: доступніша ШІ-модель з акцентом на агентні завдання та практичну ефективність

Компанія xAI, заснована Ілоном Маском, презентувала свою новітню розробку – штучний інтелект Grok 4.3. Ця версія вирізняється суттєвим зниженням вартості обробки токенів: вхідні токени стали на 40% дешевшими, а вихідні – на 60% доступнішими порівняно з попередньою моделлю Grok 4.20. За оцінкою Intelligence Index від Artificial Analysis, Grok 4.3 здобула 53 бали, продемонструвавши покращення, але все ще поступаючись провідним моделям від OpenAI та Anthropic.

Джерело зображення: Rubaitul Azad / unsplash.com

Джерело зображення: Rubaitul Azad / unsplash.com

Grok 4.3 орієнтована на розробників та комерційне використання. Цей штучний інтелект здатний самостійно знаходити інформацію в мережі Інтернет та соціальній платформі X, виконувати код на Python, здійснювати пошук у файлах (RAG) та генерувати документи у форматах Excel, PDF і PowerPoint. Ерік Цзян, розробник xAI, наголосив, що під час створення Grok 4.3 пріоритетами були швидкість функціонування, низька вартість та ефективність у вирішенні складних завдань. Модель обробляє інформацію зі швидкістю 100 токенів за секунду та підтримує величезне контекстне вікно обсягом до 1 мільйона токенів.

Вартість одного мільйона вхідних токенів становить $1.25 (приблизно 50 ₴ за поточним курсом), а мільйон вихідних токенів – $2.50 (приблизно 100 ₴). Останні дані, на яких навчалася модель, датовані груднем 2025 року. Функція міркування (reasoning) в Grok 4.3 активована за замовчуванням, що дозволяє моделі аналізувати інформацію перед кожною відповіддю. Токени, використані для міркування, мають таку ж вартість, як і звичайні вихідні токени. Grok 4.3 доступна через платформу OpenRouter, програмний інтерфейс (API) xAI та агент Hermes. За інтелектуальним індексом, новинка незначно випереджає Muse Spark та Claude Sonnet 4.6, а також на чотири пункти перевершує попередню Grok 4.20. Проте, вона все ще поступається лідерським моделям від OpenAI та Anthropic.

На графіках Artificial Analysis видно, що Grok 4.3 не доганяє лідера GPT-5.5 за інтелектуальним індексом — 53 проти 60 балів, — але пропонує значно вигідніше співвідношення продуктивності та вартості: повний прогін бенчмарку коштує $395 проти майже $4 000 у GPT-5.5. Джерело зображення: Artificial Analysis

На графіках Artificial Analysis видно, що Grok 4.3 не доганяє лідера GPT-5.5 за інтелектуальним індексом — 53 проти 60 балів, — але пропонує значно вигідніше співвідношення продуктивності та вартості: повний прогін бенчмарку коштує $395 (приблизно 15 800 ₴) проти майже $3 959 (приблизно 158 360 ₴) у GPT-5.5. Джерело зображення: Artificial Analysis

Повний тест Grok 4.3 за всіма критеріями Artificial Analysis обійшовся в $395 (приблизно 15 800 ₴), що значно менше, ніж $3959 (приблизно 158 360 ₴) для GPT-5.5 та $4811 (приблизно 192 440 ₴) для Claude Opus 4.7. Сервіс оцінює Grok 4.3 як модель, що досягла парето-фронту – оптимального балансу між продуктивністю та ціною.

Grok 4.3 потрапляє до найпривабливішого сегмента графіка: 53 бали при вартості $395, тоді як GPT-5.5 та Claude Opus 4.7 потужніші, але значно дорожчі. Джерело зображення: Artificial Analysis

Grok 4.3 потрапляє до найпривабливішого сегмента графіка: 53 бали при вартості $395 (приблизно 15 800 ₴), тоді як GPT-5.5 та Claude Opus 4.7 потужніші, але значно дорожчі. Джерело зображення: Artificial Analysis

У тесті GDPval-AA, який оцінює здібності ШІ в завданнях, наближених до реальної інтелектуальної роботи, рейтинг Ело Grok 4.3 зріс на 321 пункт, досягнувши позначки 1500. Це дозволило їй обійти Gemini 3.1 від Google, хоча GPT-5.5 від OpenAI залишається лідером з відривом у 276 пунктів Ело.

Інші тести виявили певні недоліки новинки. Компанія Andon Labs, що спеціалізується на тестуванні моделей в автономних агентських завданнях, зафіксувала проблеми з ініціативністю Grok 4.3: модель іноді залишається пасивною замість виконання дій. Представники Andon Labs жартівливо зазначили, що “модель страждає на нарколепсію: вона радше дрімає кілька днів поспіль, ніж діє”. Водночас, незалежний сервіс Vals AI відзначив Grok 4.3 як лідера у тестуванні аналізу судової практики (CaseLaw) та корпоративних фінансів (CorpFin). Проте, у загальних тестах з написання коду та розв’язання складних математичних завдань модель посіла лише 13-те місце.

Окрім Grok 4.3, xAI також запустила бета-версію агентського режиму Agent Mode для Grok Imagine через веб-інтерфейс. Цей режим призначений для тривалих творчих проєктів, а не для окремих запитів. ШІ-агент самостійно планує, генерує, редагує та вдосконалює матеріали. За словами розробників, цей інструмент чудово підійде для створення коротких фільмів або маркетингових історій. Щоб активувати агентський режим, потрібно скористатися відповідним полем у лівому нижньому куті веб-інтерфейсу. Доступ до цієї функції потребує платної підписки.

Порада від Soft Portal:

Grok 4.3 є цікавим оновленням, особливо для розробників та бізнесу, які шукають більш доступні, але потужні інструменти для роботи зі штучним інтелектом. Значне зниження вартості обробки токенів та розширені можливості автоматизації роблять цю модель привабливою для проєктів, де бюджет та швидкість відіграють ключову роль. Хоча вона ще не досягла рівня провідних моделей у всіх категоріях, її ефективність у певних завданнях та доступність можуть стати вирішальними для багатьох користувачів.

No votes yet.
Please wait...

Leave a Reply

Your email address will not be published. Required fields are marked *