Новини

Google створив систему синтезу мови, яка майже не відрізняється від людини

Система перетворення тексту на природну для вуха мову Tacotron 2 виконує це завдання ефективніше за своїх попередників Tacotron і WaveNet, пише TechCrunch.

Попередні системи генерації мови мали ряд істотних недоліків. WaveNet, приміром, видавала дуже різкі звуки. Tacotron краще порався з інтонаціями, але не міг видавати повноцінний “мовний продукт”.

Алгоритм Tacotron 2, який представлений командою розробників Google за участю Джонатана Шена, працює на основі двох нейронних мереж. Друкована версія конвертується в спеціальну Tacotron-спектрограмму, в якій розподіляються ритм і наголоси, а слова генеруються в аналогу WaveNet. Крім того, додана система збору даних для навчання нейромережі, пише “Новое время”.

Аудіозапис справді схожий на мову живої людини. Темп мовлення звучить досить переконливо, а основні затримки відбуваються на словах з незвичайною вимовою. Щоправда, частина слухачів у коментарях стверджує, що деякі слова система вимовляє “ламано”.

Зразки роботи Tacorton 2 можна прослухати на офіційному сайті Google. Ця технологія, швидше за все, одразу почне використовуватися в продуктах компанії.

Однією з основних проблем нового алгоритму є відсутність регулювання тону мови. Не можна передбачити, яка фраза буде виголошена піднесено, а яка — грубо.

Коментарі

Олег Довганик

Share
Published by
Олег Довганик

Recent Posts

У Львові видалили грижу українському паралімпійцю Григорію Вовчанському

За 4 місяці після операції – став Чемпіоном світу

20 хв. тому

У Львові судитимуть колаборанта пожежного-рятувальника

Під час активних бойових дій на території Волноваської територіальної громади, обвинувачений умисно не вибув на…

1 годину тому

У Львові на вулиці виїдуть червоні трамваї

З 5 березня електротранспорт повноцінно працюватиме на маршруті № 2

2 години тому

На Стрийщині прокурори викрили старосту однієї з сільрад

Шахрайство з нерухомістю та підробка документів

2 години тому