Великі мовні моделі (LLMs) є основним типом штучного інтелекту для обробки текстів, і вони зараз з’являються скрізь. ChatGPT, безсумнівно, є найвідомішим інструментом, що використовує LLM – він працює на особливо налаштованій версії моделей GPT від OpenAI. Але є багато інших чатботів та генераторів тексту – включаючи все від Google Gemini та Claude від Anthropic до Writesonic та Jasper – які побудовані на основі LLM.
LLM розроблялися в наукових лабораторіях з кінця 2010-х, але після випуску ChatGPT (який продемонстрував потенціал GPT) вони вийшли з лабораторій у реальний світ. Отже, тут я розгляну деякі з найважливіших LLM на сьогоднішній день.
Найкращі LLM у 2024 році
Є десятки основних LLM та сотні, які можна вважати значущими з тієї чи іншої причини. Перелічити їх усі було б майже неможливо, і в будь-якому випадку, список застарів би за кілька днів через те, наскільки швидко розвиваються LLM.
Слово “найкращі” беріть з певною обережністю: я намагалась звузити список, вибираючи найважливіші, найцікавіші та найпопулярніші LLM (та LMM), але не обов’язково ті, які краще за інших показують себе в тестах (хоча більшість із них справді ефективні). Я також зосередилась переважно на LLM, які ви можете використовувати, а не на тих, які є предметом дуже цікавих наукових статей.
Одне останнє зауваження перед тим, як ми почнемо: багато додатків з штучним інтелектом не вказують, які LLM вони використовують. Деякі можна вгадати або це зрозуміло з їхніх маркетингових матеріалів, але для багатьох інших ми просто не знаємо. Тому в таблиці нижче ви побачите “Нерозкрито” дещо часто – це просто означає, що ми не знаємо про великі додатки, які використовують LLM, хоча це можливо.
LLM | Розробник | Популярні додатки, які використовують | Доступ |
---|---|---|---|
GPT | OpenAI | Microsoft, Duolingo, Stripe, Zapier, Dropbox, ChatGPT | API |
Gemini | Gemini chatbot, деякі функції в інших додатках Google, таких як Docs і Gmail | API | |
Gemma | Нерозкрито | Відкритий | |
Llama 3 | Meta | Функції AI у додатках Meta, Meta AI chatbot | Відкритий |
Vicuna | LMSYS Org | Chatbot Arena | Відкритий |
Claude 3 | Anthropic | Slack, Notion, Zoom | API |
Stable Beluga | Stability AI | Нерозкрито | Відкритий |
StableLM 2 | Stability AI | Нерозкрито | Відкритий |
Coral | Cohere | HyperWrite, Jasper, Notion, LongShot | API |
Falcon | Technology Innovation Institute | Нерозкрито | Відкритий |
DBRX | Databricks та Mosaic | Нерозкрито | Відкритий |
Mixtral 8x7B та 8x22B | Mistral AI | Нерозкрито | Відкритий |
XGen-7B | Salesforce | Нерозкрито | Відкритий |
Grok | xAI | Grok Chatbot | Чатбот і відкритий |
Що таке LLM?
LLM, або велика мовна модель, – це універсальний генератор тексту на основі штучного інтелекту. Це те, що працює за налаштуванням всіх чатботів на основі ШІ та генераторів тексту на основі ШІ.
LLMs – це покращені функції автозаповнення. Якщо зняти красиві інтерфейси та інші обхідні рішення, вони беруть підказку і генерують відповідь, використовуючи ряд ймовірних продовжень тексту. Чатботи, побудовані на основі LLMs, не шукають ключові слова, щоб відповісти заготовленою відповіддю, натомість вони намагаються зрозуміти, що саме запитують, і відповідати відповідно.
Але LLMs можуть працювати тільки з текстом, саме тому починають з’являтися LMMs (великі мультимодальні моделі): вони можуть включати зображення, рукописні нотатки, аудіо, відео тощо. Хоча вони ще не так широко доступні, як LLMs, вони мають потенціал запропонувати набагато більше функцій у реальному світі.
Огля Топ 6 LLM у 2024 році
LLMs потужні в основному через те, що вони можуть бути узагальнені для багатьох різних ситуацій та використань. Одна і та ж базова LLM (іноді з невеликим доопрацюванням) може використовуватися для виконання десятків різних завдань.
Давайте перейдемо до самих LLM!
GPT
Генеративні попередньо навчені трансформери (GPT) від OpenAI запустили останній цикл хайпу навколо ШІ. Наразі доступні чотири основні моделі: GPT-3.5-turbo, GPT-4 та GPT-4 Turbo. Також є нова мультимодальна версія під назвою GPT-4o. Усі різні версії GPT є універсальними моделями ШІ з доступом через API, і їх використовують різні компанії, включаючи Microsoft, Duolingo, Stripe, Descript, Dropbox та Zapier, для створення численних інструментів. Однак, ChatGPT, ймовірно, є найпопулярнішою демонстрацією його можливостей.
Ви також можете підключити Zapier до GPT або ChatGPT, щоб використовувати GPT безпосередньо з інших додатків у вашому технічному стеку. Ось кілька прикладів, як автоматизувати ChatGPT або ви можете почати з одного з цих готових робочих процесів.
На сайті топ аі вже є стаття-гайд про використання ЧатГПТ – https://top-ai.com.ua/produkty-ta-tehnologiyi/yak-vykorystovuvaty-chatgpt-posibnyk-pochatkivczya/
Gemini
Google Gemini – це сімейство моделей ШІ від Google. Три моделі – Gemini Nano, Gemini Pro і Gemini Ultra – розроблені для роботи на різних пристроях, від смартфонів до серверів. Хоча вони можуть генерувати текст, як LLM, моделі Gemini також здатні обробляти зображення, аудіо, відео, код та інші види інформації.
Gemini Pro також підтримує функції ШІ у додатках Google, таких як Docs і Gmail, а також у чатботі Google, який раніше називався Bard. Gemini Pro 1.5 доступний розробникам через Google AI Studio або Vertex AI, а Gemini Nano і Ultra будуть доступні пізніше у 2024 році.
За допомогою інтеграцій Google Vertex AI і Google AI Studio від Zapier ви можете отримати доступ до Gemini з усіх додатків, які використовуєте на роботі.

Google Gemma
Google Gemma – це сімейство відкритих моделей ШІ від Google, створених на основі тих самих досліджень і технологій, які використовували для розробки Gemini. Доступні у двох розмірах: 2 мільярди параметрів і 7 мільярдів параметрів.

Llama 3
Llama 3 – це сімейство відкритих LLM від Meta, материнської компанії Facebook і Instagram. Окрім того, що вони підтримують більшість функцій ШІ у додатках Meta, це одна з найпопулярніших і найпотужніших відкритих LLM, і ви можете завантажити вихідний код із GitHub. Оскільки він безкоштовний для дослідницького та комерційного використання, багато інших LLM використовують Llama 3 як базу.
Доступні версії з 8 мільярдами та 70 мільярдами параметрів, а версія з 400 мільярдами параметрів все ще перебуває у процесі навчання. Попереднє сімейство моделей Meta, Llama 2, також доступне у версіях з 7 мільярдами, 13 мільярдами та 70 мільярдами параметрів.

Vicuna
Vicuna – це відкритий чатбот, побудований на основі LLM Llama від Meta. Він широко використовується у дослідженнях ШІ і є частиною Chatbot Arena, платформи для оцінки продуктивності чатботів, що управляється LMSYS.
Claude 3
Claude 3 – один із найважливіших конкурентів GPT. Його три моделі – Haiku, Sonnet та Opus – розроблені для того, щоб бути корисними, чесними, безпечними для використання підприємствами. Як результат, такі компанії, як Slack, Notion та Zoom, співпрацюють з Anthropic. Останні новини про Клауд можна прочитати на нашому сайті!
Як і всі інші закриті LLM, Claude 3 доступний лише через API, хоча його можна додатково навчати на ваших даних і налаштовувати для відповідей відповідно до ваших потреб. Ви також можете підключити Claude до Zapier, щоб автоматизувати роботу Claude з усіма іншими додатками. Ось кілька готових робочих процесів, з яких можна почати.

Чому існує так багато LLM?
До одного-двох років тому LLM були обмежені науковими лабораторіями та технічними демонстраціями на конференціях з ШІ. Тепер вони підтримують безліч додатків і чатботів, і доступні сотні різних моделей, які ви можете використовувати самостійно (якщо у вас є комп’ютерні навички). Як ми дійшли до цього?
Ну, тут є кілька факторів. Деякі з основних:
- Завдяки GPT-3 і ChatGPT, OpenAI продемонструвала, що дослідження ШІ досягли рівня, коли їх можна використовувати для створення практичних інструментів – тому багато інших компаній почали робити те саме.
- LLM вимагають багато обчислювальної потужності для навчання, але це можна зробити за кілька тижнів або місяців.
- Існує багато відкритих моделей, які можна перевчити або адаптувати до нових моделей без необхідності розробляти нову модель з нуля.
- Інвестування в компанії, що займаються штучним інтелектом, є великим, тому є великі стимули для тих, хто має навички та знання, розробляти будь-які види LLM.
Ці фактори разом створюють сприятливі умови для розвитку та поширення LLM, що ми й спостерігаємо сьогодні.