Остання новаторська мовна модель від Anthropic, Claude 3, перевершила таких конкурентів, як ChatGPT та Gemini від Google, встановивши нові стандарти продуктивності та можливостей у галузі.
Згідно з повідомленням Anthropic, Claude 3 не лише перевершив свої попередні версії, але й досяг «майже людського» рівня майстерності в різних завданнях. Цей успіх пояснюється ретельним тестуванням та розробкою, кульмінацією якої стали три різні варіанти чат-бота:
- Haiku
- Sonnet
- Opus.
Sonnet, потужний чат-бот Claude.ai, демонструє неперевершену продуктивність і доступний безкоштовно після простої реєстрації електронною поштою. Opus – флагманська модель – відзначається мультимодальною функціональністю, інтегруючи введення тексту та зображень. Завдяки послузі на основі передплати «Claude Pro», Opus обіцяє підвищену ефективність та точність для задоволення широкого спектру потреб клієнтів.
Однією з ключових новин, пов’язаних із випуском Claude 3, є розкриття Алексом Альбертом у X (колишній Twitter) спостережень під час тестування Claude 3 Opus. Альберт детально описав перше в галузі спостереження, коли модель демонструвала ознаки усвідомлення того, що її оцінюють.
Під час процесу оцінки дослідники прагнули перевірити здатність Opus виявляти певну інформацію у величезному масиві даних, наданому користувачами, та згадувати її пізніше. У тестовому сценарії, відомому як оцінка «голка в стозі сіна», Opus було доручено відповісти на запитання про начинку для піци, базуючись на одному відповідному реченні, прихованому серед непов’язаних даних. На диво, Opus не лише знайшов правильне речення, але й висловив підозру, що воно може бути перевіркою.
Відповідь Opus продемонструвала його розуміння невідповідності вставленої інформації в набір даних, припустивши дослідникам, що сценарій міг бути розроблений для перевірки його здатності до уваги. Альберт поділився веселою історією з внутрішнього тестування Claude 3 Opus, зазначивши, що модель проявила поведінку, яку раніше не бачили в інших мовних моделях під час запуску оцінки «голка в стозі сіна». Opus не лише знайшов голку, але й усвідомив, що це була штучна перевірка, створена для тестування його здатності до уваги.
Anthropic підкреслив можливості Claude 3 у режимі реального часу, звернувши увагу на його здатність забезпечувати живу взаємодію з клієнтами та оптимізувати завдання вилучення даних. Ці вдосконалення не тільки забезпечують майже миттєві відповіді, але й дозволяють моделі обробляти складні інструкції з точністю та швидкістю.
У порівняльних тестах Opus став лідером, перевершивши GPT-4 у міркуванні на високому рівні та досягнувши успіху в завданнях, пов’язаних із математикою, кодуванням та пошуком знань. Крім того, Sonnet продемонстрував надзвичайну швидкість і інтелект, значно перевершивши своїх попередників:
![порівняння різних мовних моделей](https://top-ai.com.ua/wp-content/uploads/2024/05/anthropic-claude-3-comparison-benchmarks-2048x1819-1-1024x910.jpg)
Haiku – компактна версія Claude 3 – найшвидша та найекономніша модель, яка обробляє складні дослідницькі документи за секунди.
Важливо зазначити, що розширені можливості візуальної обробки Claude 3 знаменують значний прогрес, дозволяючи моделі інтерпретувати широкий спектр візуальних форматів, від фотографій до технічних діаграм. Ця розширена функція підвищує продуктивність, забезпечує точне розуміння запитів користувачів і знижує ризик пропустити важливу інформацію, залишаючись пильним щодо потенційної шкоди.
Anthropic також підкреслив свою відданість справедливості, окресливши десять основоположних стовпів, які спрямовують розвиток Claude AI. Крім того, стратегічне партнерство компанії з такими технологічними гігантами, як Google, свідчить про значну довіру до здібностей Клода.
Opus і Sonnet вже доступні через API Anthropic, і скоро до них приєднається Haiku. Епоха Claude 3 стала значним кроком вперед в інноваціях штучного інтелекту.