Мова нейромережі від Google не відрізнити від людської
В даний час синтезатори людської мови перестали бути чимось фантастичним. Багато компаній реалізують проекти «перекладу» — ретрансляції спеціальними програмами звуків голосу хомо сапієнс. Однак при спілкуванні з такими перетворювачами ми нальоту відрізняємо штучно синтезируемую мова від емоційної людської. Але корпорації Google вдалося зробити черговий успішний крок до вирішення цієї проблеми — нейромережі компанії «навчилися» передавати емоції.
По суті, нова система генерації мови Tacotron 2 об’єднує дві нейромережі глибокого навчання. Ця розробка є продовженням роботи над попередніми програмами Tacotron і WaveNet. Ретрансляція йде в два етапи: на першому текст перетворюється у візуальні образи — спектрограмму, а далі через мережу WaveNet генерується мова людини.
Компанія Google опублікувала порівняльні тести роботи Tacotron 2, різницю виявити дуже складно. Розробники не вказали, яка саме запис є результатом роботи нової системи, а де каже чоловік.
Під час ретрансляції Tacotron 2 розпізнає знаки пунктуації, виділяє слова з великої букви і відмінно справляється з особливостями вимови імен. Деякі труднощі пов’язані з трансляцією складних слів, їх Tacotron 2, за словами розробників, зачитує буквально по складах. Крім того, система не може поки працювати в реальному часі.
Tacotron 2 «говорить» жіночим голосом і стане суттєвим доповненням до Google Assistant, в даний момент працює на WaveNet.
Джерело: Google
- Гороскоп на январь 2018 года: начните с чистого листа
- “Лиотон” (гель): инструкция, применение, эффективность препарата
- Стоит посмотреть: рождественские приключения Олега Винника и Кати Осадчей в Берлине (ВИДЕО)
- Льются песни, льются вина: как пить и не пьянеть, а утром не встретить похмелье
- Как мыслят успешные люди
- Первые электрогрузовики Audi с фантастическим дизайном (21 фото)