Google представив нову технологію перетворення усного мовлення в таку ж мова тільки іншою мовою. Translatotron – так назвали гугл перекладач – вміє переводити голос і потім відтворювати аудіо іноземною мовою із збереженням початкової інтонації і тембра оригіналу. На відміну від аналогів системі не потрібна проміжна щабель, коли мова перед перетворенням зазвичай трансформується в текст. Сервіс безпосередньо відтворює переклад в аудіоформаті.

Сучасні технології, які займаються мовним переказом, в більшості застосовують каскадний метод. При такому способі система автоматично розпізнає голос, потім переводить його, отримуючи на виході текст, який після перетворюється в аудіо вже на іншій мові. В результаті нова мова багато в чому відрізняється від оригінального носія.

Каскадний метод на практиці показав свою працездатність, та його застосування в багатьох системах, в тому числі і в самому сервісі Google, цілком закономірно. У той же час команда Google вважає, що можна створити технологію ще краще, в якій кількість проміжних етапів буде менше, що у підсумку сприяє меншій кількості помилок. З цієї причини новий Google перекладач використовує наскрізну систему перекладу, яка, на думку розробників, є найкращою версією каскадного методу, оскільки мине проміжну ступінь перетворення мови в текст.

У своїй роботі новий голосовий перекладач Google застосовує можливості нейромережі, яка спочатку виголошену промову перетворює у візуальну картинку відображення частот – спектрограмму. Потім Translatotron створює нову спектрограмму, вже на іншій мові. Між цими двома ступенями технологія не робить зайвих дій, включаючи створення текстового файлу.

Таким чином, представлений гугл перекладач містить в собі однокроковий процес, а не послідовність виконання декількох завдань. З-за цього швидкість перекладу зростає, при цьому ймовірність втрати частини даних і збільшення помилок знижується. Одночасно технологія відтворює в остаточному перекладі ті ж інтонації, паузи та специфіку, які спочатку були присутні в мові. Підсумковий результат не позбавлений певного «роботизованого» звучання, проте схожість з оригіналом зберігається набагато більше.

Професійні перекладачі часто звертають увагу не тільки на вимову, але і на те, як вимовляються слова. Сенс вихідної мови іноді суттєво змінює сенс сказаних фраз. Інженери проекту Translatotron погоджуються, що у точності перекладу нова система її не перевершила каскадний метод, однак, як і всі технології машинного навчання, новий перекладач буде поступово вдосконалюватись.

Джерело: http://softkb.com.ua/