Date: 2025-06-12 06:12 am (UTC)
From: [identity profile] tamgdenasnet.livejournal.com

А кто поет?

Date: 2025-06-12 06:50 am (UTC)
From: [identity profile] burrru.livejournal.com
ИИ. И музыка тоже его.

Date: 2025-06-12 08:03 am (UTC)

Date: 2025-06-12 07:46 am (UTC)
From: [identity profile] juliko-r.livejournal.com

Это ИИ? Невероятно! Я думала, дочь Елены Камбуровой) Просто страшно делается.

Date: 2025-06-12 08:06 am (UTC)
From: [identity profile] burrru.livejournal.com

Для такого качества нужно поиграться со стилями, запустить 40-50 раз, выбрать лучший вариант, иногда подправить в редакторе. Но результат того стоит.

Date: 2025-06-12 08:16 am (UTC)
From: [identity profile] juliko-r.livejournal.com

А, так здесь много Вашей работы! Потому что такой уровень эмпатии, интонирование — это что-то запредельное для машины. Спасибо!

Date: 2025-06-12 08:24 am (UTC)
From: [identity profile] burrru.livejournal.com

Вот как раз уровень эмпатии, интонирование — это делает машина, у меня нет над этим контроля. Я просто не ленюсь запустить много раз и выбираю лучший вариант.


Иногда получается неплохо.



Date: 2025-06-12 08:36 am (UTC)
From: [identity profile] juliko-r.livejournal.com

И это потрясающе красиво! Хотя русский романс действует сильнее из-за связки слов и музыки.


Как машина сочиняет музыку — я еще могу понять, музыка — это математика, но как она выбирает интонации — по аналогии с уже существующими романсами? Надо уточнить у chatGPT))

Date: 2025-06-12 09:10 am (UTC)
From: [identity profile] burrru.livejournal.com

Я бы предположил, что разбивают слова на фонемы. У каждой фонемы есть сотня вариантов произношения. У каждого из вариантов есть эмоциональный контекст. Фонемы, конечно же, можно комбинировать с разными весами, как вектора.


Голос человека это набор фонем. Таким образом, если взять десять человеческих голосов (сиречь, наборов фонем) с разными весами, то из них можно построить новый, абсолютно уникальный голос.


Машина анализирует текст, выбирает веса эмоционального контекста. Потом строит новый голос, и всё.


0.5 * грустный + 0.4 * задумчивый + 0.1 * надрывный

Date: 2025-06-12 09:21 am (UTC)
From: [identity profile] juliko-r.livejournal.com

"И всё". Это потрясающе! И обескураживает. Спасибо за объяснение!

Date: 2025-06-12 09:58 am (UTC)
From: [identity profile] ludodim.livejournal.com

Ты можешь подробнее объяснить какой именно доболнительный инпут помимо текста?

Date: 2025-06-12 10:15 am (UTC)
From: [identity profile] burrru.livejournal.com

Набор стилей, и уровень от 0 до 100 двух параметров: Weirdness и Style Influence.


К стилям надо попривыкнуть. К примеру, здесь: spoken word, harpsichord, dream pop.


spoken word связан с эмоциями, harpsichord похож на гитару, но лучше, dream pop повлияет на задумчивость и медленный ритм

Date: 2025-06-12 02:08 pm (UTC)
From: [identity profile] tata-akivis.livejournal.com
Действительно хорошо получилось.
Голос похож на Лизу Штрамбанд. Я даже подумала вначале, что это она за кадром поёт.
Но зная тебя, быстро поняла, в чём дело. )
Удивительно на самом деле.

голос хорошо получился

Date: 2025-06-13 11:48 pm (UTC)
From: [identity profile] burrru.livejournal.com


https://www.youtube.com/watch?v=LOIze6wdjq8

Date: 2025-06-15 07:14 pm (UTC)
From: [identity profile] ncuxuamp-pro.livejournal.com
Прекрасно!
Page generated Apr. 8th, 2026 06:26 am
Powered by Dreamwidth Studios