Світ генеративної музики зробив черговий великий крок уперед. Google DeepMind офіційно представив Lyria 2 — нову модель штучного інтелекту, яка здатна створювати повноцінні пісні з текстом, вокалом та якісним аранжуванням. У порівнянні з попередніми рішеннями, Lyria 2 пропонує не тільки високу якість звучання, але й більше контролю для користувачів: можна задавати жанр, темп, тональність і навіть розмітку треку.
Нова версія здатна генерувати треки студійного рівня тривалістю кілька хвилин, створювати спів із осмисленими словами і працювати в режимі реального часу. А ще DeepMind інтегрувала в модель спеціальний водяний знак, щоб чітко позначати AI-контент і захищати авторські права.

Що таке Lyria 2 та чим вона відрізняється від попередньої версії
Lyria 2 — це новітня модель генерації музики від Google DeepMind, представлена у квітні 2025 року. Вона стала продовженням розвитку першої версії Lyria, яка вийшла наприкінці 2023 року та одразу заявила про себе як про справжній прорив у сфері AI-музики. Уже тоді Lyria вразила вмінням створювати оригінальні пісні з нуля — з повноцінним інструментальним супроводом, осмисленим вокалом та текстами. Інші моделі того часу часто втрачали логіку композиції на довгих фрагментах або генерували вокал без змісту, тоді як Lyria змогла подолати ці обмеження.
Lyria 2 піднімає планку ще вище за кількома напрямами:
- Якість звуку. Нова модель генерує професійне стерео-аудіо з частотою дискретизації 48 кГц, що забезпечує надзвичайно деталізоване, насичене і чисте звучання. Для порівняння, попередні дослідницькі моделі, включно з прототипом MusicLM від Google, працювали на нижчих показниках якості — близько 24–32 кГц.
- Контроль над композицією. Lyria 2 створювалася у тісній співпраці з музикантами та продюсерами. Завдяки цьому користувач отримує більше можливостей для управління музикою: можна задавати тональність, темп (BPM), характер інструментального супроводу та інші параметри. Це дає змогу точніше втілювати творчі задуми.
- Режим реального часу. В Lyria 2 з’явилася абсолютно нова функція — Lyria RealTime. Вона дозволяє інтерактивно створювати музику «на льоту»: змішувати жанри, змінювати ритм або мелодію в реальному часі. Модель генерує безперервний музичний потік та майже миттєво реагує на дії користувача, що відкриває нові можливості — від живих виступів до DJ-сетів зі штучним інтелектом.
- Поліпшення стабільності та структури. Оновлені алгоритми Lyria 2 дозволяють моделі підтримувати музичну логіку на всій довжині треку. Якщо ранні генеративні моделі часто «губилися» після 30 секунд звучання, Lyria 2 зберігає цілісність композиції від вступу до фіналу.
Ключові особливості Lyria 2: якість, тривалість, вокал та контроль
Щоб краще зрозуміти, чому Lyria 2 вважають новим етапом у розвитку генеративної музики, варто детальніше розглянути її основні характеристики. Модель не просто генерує мелодії за описом — вона робить це на професійному рівні, пропонуючи якісний звук, підтримку повноцінного вокалу, гнучке управління композицією та створення треків довшої тривалості. Далі розбираємо, що саме робить Lyria 2 настільки унікальною.
Lyria 2 генерує музику студійної якості — і це справді чути. Модель працює на частоті 48 кГц зі стереозвуком, тому треки виходять живими, насиченими деталями і об’ємними. Всі інструменти — від фортепіано до електрогітари — звучать так, ніби записані у справжній студії: з тонкими нюансами динаміки, атаки нот і переходів. Завдяки цьому згенеровану музику можна без проблем використовувати у своїх проєктах — нічого не потрібно допрацьовувати або чистити.
На відміну від старіших моделей, які могли створити тільки короткі уривки, Lyria 2 вміє генерувати цілісні композиції тривалістю кілька хвилин. Модель не втрачає структуру треку: куплети, приспіви, інструментальні вставки органічно поєднуються в одну логічну історію. Якщо дати їй лише початок пісні, Lyria 2 запропонує, як цей трек розвинути далі — додасть нові такти, побудує плавний перехід або запропонує варіацію куплету. Це дуже допомагає, коли ідея є, але складно придумати, куди її розвивати.
Те, як Lyria 2 працює з вокалом, реально вражає. Модель може додати до пісні як просте фонематичне “мугикання”, так і повноцінний спів з осмисленими словами. Більше того, можна підвантажити свій текст — і ШІ накладе його на музику, дотримуючись логіки куплетів і приспівів. Вокал звучить природно: модель передає емоції, обирає стиль виконання і навіть варіанти голосу (чоловічий або жіночий, м’який або енергійний). Якщо не задавати текст, Lyria 2 сама придумає лірику на задану тему. Щоправда, поки що найкраще модель співає англійською, але розробники вже працюють над розширенням мовної підтримки.
Lyria 2 впевнено працює у будь-якому стилі — від класики і джазу до електроніки, хіп-хопу та латино. Хочете ліричну баладу на фортепіано чи шалений драм-н-бейс трек — модель підтримає будь-який запит. Мене вразило те, як вона працює з гармоніями: Lyria не просто ставить стандартні акорди, а часто пропонує цікаві, несподівані гармонічні ходи. Це додає музиці оригінальності і дає круті ідеї навіть тим, хто сам працює у студії.
І найголовніше — Lyria 2 дає можливість керувати процесом. Можна не просто задати тему треку у текстовому описі, а й вказати темп, тональність, бажані інструменти або структуру пісні (куплети, приспіви, бриджі). Якщо треба, можна навіть вручну розставити мітки у спеціальному інтерфейсі Music AI Sandbox. А ще є можливість редагувати окремі частини треку без перегенерації всього — наприклад, замінити ударні або змінити настрій приспіву. Це дуже нагадує роботу зі справжнім саунд-продюсером: можна коригувати, направляти і втілювати власний задум, а не покладатися тільки на випадковість.
Як на мене, Lyria 2 справді виглядає як інструмент нового покоління: вона не просто генерує музику, а стає повноцінним партнером у творчості. Далі розповім, як її використовують на практиці та які можливості відкриває новий рівень інтеграції AI у музичній індустрії.
Приклади використання Lyria 2 у реальних кейсах
Lyria 2 уже активно тестується в реальних умовах. Наразі Google DeepMind надає доступ до моделі обмеженій групі користувачів через платформу Music AI Sandbox — це своєрідний “пісочний майданчик” для музичних експериментів, створений у співпраці з професійними музикантами та продюсерами. Саме тут Lyria 2 показала свої можливості у повноцінному творчому процесі.
Розповідаю про найцікавіші приклади застосування.
Співтворчість з музикантами в студії
У Music AI Sandbox доступні три основні режими роботи з моделлю — Create, Extend та Edit.
Уявіть, що ви композитор, який працює над новим треком. Ви відкриваєте Sandbox і в режимі Create описуєте словами те, що хочете почути: «меланхолійна інді-рок пісня з жіночим вокалом про розставання, у стилі ХХХ» (де ХХХ – назва відомого гурту для референсу). Lyria 2 читає опис, враховує ваші налаштування (темп, тональність, інструменти) і генерує кілька варіантів коротких фрагментів – начерків пісні. Ви прослуховуєте два 10-секундні варіанти і обираєте той, що більше «чіпляє». Потім ви натискаєте Extend, щоб продовжити обраний фрагмент – і модель дописує наступні кілька тактів, розвиваючи ідею. Так, крок за кроком, ви нарощуєте трек до повної пісні, скажімо, 3-х хвилин.
У процесі ви можете зупинитися і внести зміни: наприклад, якщо куплет звучить чудово, а приспів хочеться більш емоційний – ви можете підказати моделі, щоб наступний сегмент був «потужніший, з більшою динамікою». У режимі Edit ви здатні трансформувати будь-який шматок: скажімо, зробити останній приспів повільнішим і більш оркестровим, або перетворити гітарний риф у куплеті на піаніно – фактично реміксувати створене ШІ на свій лад
За відгуками учасників YouTube Music AI Incubator, такий підхід дозволяє легко долати творчі застої і швидше знаходити нові ідеї. Модель фактично виступає як помічник у студії — бере на себе технічну рутину, залишаючи митцю керівну роль у створенні композиції.
Проєкт YouTube Dream Track — AI-саундтреки за участі зірок
Ще один яскравий приклад використання технологій Lyria — експериментальний проєкт Dream Track на платформі YouTube. У ньому взяли участь популярні артисти, серед яких Charlie Puth, John Legend, T-Pain, Сіа, Demi Lovato та інші.
Суть проєкту: креатори коротких відео (Shorts) отримали можливість створювати унікальні 30-секундні треки, згенеровані ШІ у стилі та з вокалом конкретних зірок. Наприклад, можна було вибрати Джона Ледженда, ввести тему треку (“літня вечірка”) — і отримати пісню, де голос і стиль максимально наближені до справжнього виконання артиста.
Ранні демонстрації вразили: Lyria відтворювала манеру співу, емоційність і навіть характерні риси вокалу, такі як тремоло Charlie Puth або автотюновий стиль T-Pain.
Це був перший досвід, коли ШІ офіційно використовували для створення музики зі згодою самих артистів. Проєкт дотримувався чітких принципів відповідального використання AI: кожен трек проходив через Content ID для захисту авторських прав і монетизації.
Інші практичні кейси застосування
Google DeepMind також продемонструвала можливості Lyria 2 у межах інших проектів:
- Конференція Google Cloud Next ’25. Музичну заставку заходу створили за допомогою Lyria. Команда запропонувала моделі кілька інструментальних тем, а вона розвинула їх у повноцінний саундтрек із оркестровими та електронними елементами.
- Програма YouTube Music AI Incubator. Відібрані музиканти й продюсери, зокрема від Universal Music Group, тестували інструменти на базі Lyria, створюючи нові біти, фонограми й навіть експериментальні версії своїх пісень у різних жанрах. Один із продюсерів поділився враженням: “ШІ став для мене невтомним помічником у студії — може за кілька секунд видати 5 варіантів приспіву, і серед них часто трапляються справді несподівані рішення.”
Демо-приклади у відкритому доступі
Ознайомитися з можливостями Lyria можна і самостійно. На YouTube-каналі Google DeepMind та на сторінці Music AI Sandbox викладені офіційні демо-записи: джазові імпровізації, електронні треки, оркестрові композиції. Прослухавши їх, легко переконатися — якість звуку і стильова гнучкість моделі справді на високому рівні, а без підказки складно здогадатися, що музику створив штучний інтелект.
Взаємодія Lyria 2 з MusicLM та SynthID
Модель Lyria 2 не з’явилася на порожньому місці — її створення стало можливим завдяки кількарічним дослідженням Google у сфері генеративної музики. Ще до Lyria команда DeepMind працювала над проєктами AudioLM (модель продовження аудіо) та MusicLM (текст-ту-музик модель, представлена на початку 2023 року).
Саме MusicLM привернула увагу спільноти тим, що вміла генерувати музичні фрагменти за текстовими описами. Проте через ризики копіювання фрагментів із тренувальних даних її вирішили не випускати у відкритий доступ. Попри це, технології, розроблені для MusicLM, стали основою для створення Lyria 2.
Нову модель можна вважати еволюцією ідей MusicLM, але на абсолютно іншому рівні якості. Якщо MusicLM генерувала переважно інструментальні фрагменти тривалістю до 30 секунд із середньою якістю 24 кГц, то Lyria 2 видає хвилинні композиції у форматі 48 кГц, ще й з осмисленим вокалом. Це справжній стрибок уперед.
Lyria 2 використовує напрацювання MusicLM — архітектуру, методи кодування аудіо, принципи роботи з текстовими описами — але доповнює їх новими можливостями, більшим контролем для користувача та вищим рівнем безпеки.
Ще одна важлива інтеграція — це SynthID.
SynthID — технологія, розроблена Google DeepMind для водяного знакування контенту, створеного штучним інтелектом. Спершу її застосували до зображень, позначаючи нейромережеві картинки невидимим маркером. Тепер цю концепцію адаптували для аудіо.
Усі треки, які генерує Lyria 2 (включно з режимом Lyria RealTime), містять прихований цифровий водяний знак SynthID. Він вбудовується безпосередньо в звукову хвилю, не впливаючи на якість звучання для слухача. Водночас спеціальні алгоритми здатні зчитувати цей маркер і підтверджувати, що аудіо створено ШІ.
Це рішення має величезне значення для етики та безпеки:
- По-перше, водяний знак дозволяє легко ідентифікувати AI-генеровану музику й запобігати її видаванню за творчість людини.
- По-друге, у майбутньому це спростить монетизацію і контроль за авторськими правами: наприклад, YouTube зможе автоматично розпізнавати треки, створені Lyria, і застосовувати до них спеціальні правила.
Google підкреслює, що впровадження SynthID — частина стратегії відповідального розвитку генеративних технологій. Лейбли та самі музиканти підтримують цю ініціативу, адже вона забезпечує прозорість і захист прав усіх сторін.
Таким чином, Lyria 2 — це не окремий продукт, а частина великої екосистеми Google для музичного AI. Вона базується на попередніх розробках (AudioLM, MusicLM) та інтегрує інструменти для захисту прав (SynthID, Content ID). Поруч з Lyria 2 розвиваються й інші напрямки DeepMind, такі як MusicFX (AI-диджей для вечірок) та Veo (генерація аудіо для відео). Наприклад, для створення саундтреків до відеороликів можуть одночасно застосовуватися можливості Lyria і Veo.
Але в контексті генеративної музики Lyria 2 залишається центральною ланкою цієї екосистеми — моделлю, яка вміє створювати повноцінні треки студійного рівня за текстовими описами, у поєднанні з відповідальним підходом до використання штучного інтелекту.
Порівняння Lyria 2 з іншими моделями генерації музики
Нині Lyria 2 – не єдиний гравець на полі AI-музики. Активно розвиваються й інші моделі та сервіси, які генерують пісні за текстом: зокрема Suno (продукт від стартапу Suno, Inc.), Udio (новий додаток від команди колишніх інженерів DeepMind) та MusicGen (відкрита модель від Meta/Facebook).
Suno позиціонує себе як інструмент «музики за секунди», орієнтований на швидкість і простоту використання. Сервіс дозволяє за кілька кліків створити пісню на основі текстового опису або згенерованої AI-лірики, пропонуючи швидке складання треків сегментами.
Udio — конкурент Suno, заснований екс-інженерами DeepMind, орієнтований на вищу якість студійного звучання та чистіший вокал. Сервіс дозволяє редагувати треки через функцію Remix і генерує пісні тривалістю 3–4 хвилини. На відміну від Suno, Udio пропонує краще мікшування та інтонаційно точніший вокал, хоча мелодії іноді звучать менш виразно. MusicGen від Meta, у свою чергу, є відкритою моделлю для генерації коротких музичних фрагментів (до 30 секунд) без акценту на вокал. Він підходить для створення інструментальних семплів і лупів, але поступається Lyria 2 за якістю, гнучкістю і тривалістю композицій.
Але кожен з цих підходів має свої сильні сторони і обмеження.
Параметр | Lyria 2 (DeepMind) | Suno (Suno AI) | Udio (Uncharted Labs) | MusicGen (Meta) |
---|---|---|---|---|
Якість звуку | Дуже висока: 48 кГц стерео, чистий мікс | Висока, але змінна: іноді “плоский” звук | Дуже висока для масового сервісу, студійний мікс | Середня: ~32 кГц, відчутна компресія |
Підтримка вокалу | Так, чіткий спів із власним текстом | Так, кілька голосів і мов, іноді неточності | Так, природний вокал із точним слідуванням тексту | Обмежено, переважно “наспівування” без сенсу |
Доступність | Обмежена (лише тестери) | Широка (онлайн, мобільний додаток) | Помірна (реєстрація і можлива черга) | Повна для розробників (потрібні технічні навички) |
Контроль стилю та структури | Дуже гнучкий: темп, тональність, розмітка пісні | Помірний: базовий вибір жанру й тексту | Гнучкий: стартові налаштування + Remix | Мінімальний: тільки через зміну тексту або склеювання |
Максимальна довжина треку | Кілька хвилин (повноцінні пісні) | До 4 хвилин (поступова генерація) | До 3–4 хвилин (збірка з сегментів) | До 30 секунд (склеювання потрібно вручну) |
Інтерфейс користувача | Професійний веб-інструмент (тільки для тестерів) | Простий сайт і мобільний додаток | Інтуїтивний веб/мобільний застосунок із Remix-функціями | Тільки код і прості демо (HuggingFace) |
Якщо вам цікаво побачити більше прикладів, які ШІ-сервіси сьогодні створюють музику, перегляньте також нашу добірку 10 найкращих ШІ для створення музики у 2024 році.
Підсумки: сильні сторони, обмеження та перспективи розвитку Lyria 2
Lyria 2 — це одна з найпотужніших моделей генерації музики, яка піднімає планку якості аудіо й вокалу у сфері AI. Її сильні сторони — студійний звук, гнучке керування композицією та інтеграція з водяним знаком SynthID. Головним обмеженням наразі залишається обмежений доступ до моделі через Music AI Sandbox. У перспективі розвиток Lyria 2 передбачає розширення мовної підтримки, інтеграцію з ширшим колом творчих інструментів та поступове відкриття для професійних музикантів і студій по всьому світу.
Плюси | Мінуси |
---|---|
Висока якість звуку (48 кГц стерео) | Обмежений доступ (тільки для обраних користувачів) |
Генерація повноцінного вокалу з текстом | Поки що краща підтримка лише англійської мови |
Гнучке керування параметрами треку (жанр, темп, структура) | Відсутність масового релізу для широкої аудиторії |
Інтеграція водяного знаку SynthID для захисту авторських прав | Робота лише через спеціальну платформу Music AI Sandbox |
Підтримка довготривалих композицій без втрати структури | Немає можливості локального використання або кастомного розгортання |