Translation agency

Get Adobe Flash player

Бюро переводовСделать заказ Бюро переводовTranslation Memory Бюро переводовПроцесс работы Бюро переводовСтатьи Бюро переводовНовости Бюро переводовБлог Бюро переводов

Преодолеваем языковой барьер... автоматически

На сегодняшний день в Евросоюзе 23 официальных языка. Ежегодно более миллиарда евро тратится на устный и письменный перевод для одного только делового общения внутри ЕС, в то время как европейские компании, работающие с другими странами, вынуждены выкладывать еще по несколько миллионов в год с одной только целью - понять своих заграничных партнеров.

Учитывая сложившуюся ситуацию, можно с полной уверенностью заявить, что Европа - благоприятный рынок для внедрения технологий автоматического перевода, способных облегчить процесс взаимопонимания между представителями европейских стран.

"На данный момент существует очевидная потребность в быстром и качественном автоматическом переводе в Европе, как и в других странах... Такие технологии экономят время - и деньги," - отмечает Марчелло Федерико, итальянский исследователь в области автоматических переводческих технологий.

Однако до сих пор не было создано ни одной автоматической переводческой системы, которая могла бы хоть как-то соперничать с человеком. В одном только Интернете примеров автоматических переводов более чем достаточно: такие тексты не всегда способны даже отдаленно передать изначальный смысл.

Другие технологии способны переводить только определенный набор слов и фраз, это так называемая "ограниченная речь"; такие автоматические переводчики в лучшем случае подойдут туристам, желающим забронировать отель или авиабилет, но вряд ли смогут помочь понять, о чем идет речь в объявлении или газете.

Команда Федерико поставила перед собой весьма амбициозную цель: проект TC-STAR - это, пожалуй, самый смелый проект в области автоматизации перевода, задача которого - воспринять устную речь человека и устно её перевести на другой язык.

"Для человека перевод - достаточно сложная задача. Нужно отлично знать переводимый язык и язык перевода. В случае с автоматизацией этого процесса, это еще сложнее," - говорит Федерико. - "Насколько я знаю, TC-STAR - это первый проект в мире, чья задача - создать систему автоматического устного перевода, которая не была бы ограничена определенным набором слов и выражений".

Для создания системы, способной адекватно переводить любую речь, независимо от темы и контекста, используются три технологии, каждая из которых, однако, еще пока далека от совершенства. Это:

  • Автоматический Распознаватель Речи (ASR), который используется для распознавания устной речи и превращения её в текст.
  • Переводчик Устной Речи (SLT), который переводит текст на иностранный язык.
  • Система Текст - Речь (TTS), которая превращает текстовый перевод в устную речь.

Разработчики TC-STAR подготовили компоненты для выполнения каждого из перечисленных выше задач, создав таким образом современнейшую платформу, способную еще на один шаг приблизить автоматический перевод к "живому". Одной из новейших разработок стала возможность скомбинировать несколько систем ASR и SLT для того, что позволило сделать распознавание и перевод гораздо более точными по сравнению с другими подобными системами.

Основываясь на методике BLEU, алгоритме сравнения машинного и "человеческого" перевода, за время работы над проектом, качество машинного перевода выросло от 40% до 60%, а количество правильно переведенных слов приблизилось к 70%, хотя большинство из них занимало неправильные места в предложении.

Разработчики одинадцати компаний-партнеров проекта, среди которых Nokia, Siemens, IBM и Sony, работали, основываясь на записях речей Европейского парламента, которые в процессе работы переводились с английского на испанский язык. Кроме того, работа велась на переводом радио новостей с китайского языка на английский.

Несмотря на то, что система до сих пор не способна сравниться с "человеческим" переводом, Федерико уверен, что с помощью дальнейших разработок в скором времени появится рентабельный автоматический устный переводчик, способный заменить собой человека, по крайней мере в случаях, когда используются несложные языковые пары.

Тем временем, отдельные компоненты проекта TC-STAR открыты для свободного использования, а сам проект все больше привлекает новых инвесторов и даже вдохновляет на создание подобных проектов (например, проект JUMAS).

Одна из новых акционерных компаний под названием PerVoice предлагает услуги по удаленному автоматическому декодированию устной речи. "Очень удобно, когда протокол встречи или собрания ведется автоматически. Это окономит время и деньги," - замечает Фредерико.

По материалам ScienceDaily