Перекладач Microsoft також здатний переводити мова. Ця технологія піддається в функції перекладача жити ( http://Translate.IT ), Перекладач додатків, Skype перекладач і також спочатку доступні тільки через Skype перекладач функції і в Microsoft Translator Apps на iOS і Android, ця функціональність тепер доступна для розробників з останньою версією Open API на основі REST, доступний на порталі Azure.
Хоча це може здатися, як прямо вперед процес на перший погляд, щоб побудувати технологію перекладу мови з існуючих цегли технології, вона вимагає набагато більше роботи, ніж просто підключити існуючий "традиційний" людина-машина розпізнавання мови движок до існуючого тексту перекладу один.
Щоб правильно перевести "джерело" мови з однієї мови на іншу "цільової" мову, система проходить через чотири етапи процесу.
- Розпізнавання мови для перетворення звуку в текст
- Труетекст: технологія Microsoft, яка нормалізує текст, щоб зробити його більш відповідним для перекладу
- Переклад за допомогою движка перекладу тексту, описаного вище, але на моделях перекладу, спеціально розроблених для реального життя розмовні розмови
- Текст в мову, при необхідності, для отримання переказу аудіо.
Автоматичне розпізнавання мови (ASR)
Автоматичне розпізнавання мови (ASR) виконується за допомогою системи нейронної мережі (NN), навченої аналізу тисяч годин входить звукової мови. Ця модель навчаються на взаємодію людини з людиною, а не від людини до машини команди, створення розпізнавання мови, яка оптимізована для нормальних розмов. Для досягнення цієї мети потрібно набагато більше даних, а також більший DNN, ніж традиційний ASRs від людини до машини.
Детальніше про Голосові служби Майкрософт в текстових службах .
Труетекст
Як люди розмовляючи з іншими людьми, ми не говоримо, як прекрасно, ясно або акуратно, як ми часто думаємо, що ми робимо. За допомогою технології труетекст, буквальний текст перетворюється, щоб більш точно відобразити намір користувача шляхом видалення мови disfluencies (наповнювачі слів), таких як "UM" s, "а" s "і" s ", як" s, заїкання і повторень. Текст також стає більш читабельним і перекладним шляхом додавання розривів пропозицій, правильних знаків пунктуації та прописних літер. Для досягнення цих результатів, ми використовували десятиліття роботи за мовними технологіями, ми розробили від перекладача для створення труетекст. На таку схему показано, що на прикладі реального життя різніперетворення труетекст працює для нормалізації цього літерального тексту.
Переклад
Потім текст перекладається на будь-який з 60 + мов підтримується перекладачем Microsoft.
Переклади з використанням API перекладу мови (як розробника) або в додатку або службі мовного перекладу, подається з новітніми нейронними мережами на основі переказів для всіх підтримуваних мов мовного введення (див. тут для повного списку). Ці моделі були також побудовані шляхом розширення поточних, в основному письмового тексту навчені моделі перекладу, з більш усного тексту корпусів для створення кращої моделі для розмовних типів перекладів. Ці моделі також доступні через Стандартна категорія "мова" традиційного API перекладу текстів.
Для будь-яких мов, які не підтримуються нейронних перекладом, виконується традиційний SMT-переклад.
Текст в мову
Якщо мову перекладу є одним з 18 підтримуваних тексту в мову мови , А для варіанту використання потрібно звуковий вихід, потім текст перетворюється в мовної висновок за допомогою синтезу мови. Цей етап опущений в сценаріях перетворення мови в текст.
Детальніше про Текстові служби Microsoft в промові .