
09:27, 29 грудня 2017 р.
Інженери Google створили синтезатор мовлення, що схожий на голос людини
Google розробила просунутий синтезатор мовлення - Tacotron 2, який заснований на нейромережі.
Система перетворення тексту на природні звуки мовлення справляється з цим завданням ефективніше за своїх попередників Tacotron і WaveNet, пише "Новое время", посилаючись на TechCrunch.

Попередні системи генерації мовлення мали низку суттєвих недоліків. WaveNet, наприклад, видавала дуже різкі звуки. Tacotron краще справлявся з інтонаціями, але не міг видавати повноцінний "мовленнєвий продукт".
Алгоритм Tacotron 2, який представлений командою розробників Google за участю Джонатана Шена, працює на основі двох нейронних мереж. Друкована версія конвертується в спеціальну Tacotron-спектрограму, в якій розподіляються ритм і наголоси, а слова генеруються в аналозі WaveNet. Крім того, додана система збору даних для навчання нейромережі.
Аудіозапис дійсно схожий на вимову живої людини. Темп мовлення звучить вельми переконливо, а основні запинки відбуваються на словах з незвичайною вимовою. Щоправда, частина слухачів в коментарях стверджує, що деякі слова система вимовляє "ламано".
Зразки роботи Tacorton 2 можна прослухати на офіційному сайті Google. Ця технологія, швидше за все, відразу почне використовуватися в продуктах компанії.
Однією з основних проблем нового алгоритму є відсутність регулювання тону мовлення. Не можна передбачити, яка фраза буде виголошена піднесено, а яка - грубо.
Якщо ви помітили помилку, виділіть необхідний текст і натисніть Ctrl + Enter, щоб повідомити про це редакцію
Останні новини
21:29
5 грудня
13:00
5 грудня
12:25
5 грудня
Що очікує Україну до вступу в ЄС і як набуття членства вплине на кожного українця
Партнерський матеріал
11:00
5 грудня
08:22
5 грудня
Тепло починається з тих, хто не проходить повз – допоможіть тисячам хвостиків пережити зиму
Новини компаній
15:00
4 грудня
14:50
3 грудня
ТОП новини