Компьютерный переводчик читает по губам

ПереводчикСистемы машинного перевода все понимают, но не говорят. В американском университете Карнеги Меллон разработано устройство, названное «Вавилонская башня». Этот прибор, существующий пока в виде двух прототипов, может переводить устную речь. Причем при его использовании не нужно громко произносить слова на своем языке, что, по мнению разработчиков, может затруднять общение. Достаточно лишь прошептать фразу, требующую перевода, и прибор с помощью электродов, прикрепленных к шее и рту говорящего, распознает сказанное и немедленно произнесет перевод на нужном языке. Таким образом, как говорят разработчики, при разговоре будет достигаться такой же эффект, как и при просмотре дублированного фильма.

Сегодня уже достаточно распространены программы, способные сделать более или менее понятным смысл текста на иностранном языке. Тем не менее эти программы пока не могут создать связный перевод и уж тем более не могут передать в переводе разнообразие тонких оттенков смысла, благодаря чему машинный перевод уже вошел в массовую культуру как постоянный источник курьезов и смешных нелепостей.

«Вавилонская башня» тоже пока часто ошибается, но разработчики обещают, что скоро значительно улучшат его и мечтают о том, когда люди, не знающие языка друг друга, смогут вести с его помощью беседу, ничем не отличающуюся от обычной.

Идея использования автоматов для перевода текстов с одного языка на другой впервые возникла в 30-х годах 20-го века, еще до появления компьютеров. Когда же были разработаны первые электронно-вычислительные машины, появилась надежда, что на их основе можно будет создать программы машинного перевода. Задача эта считалась если не тривиальной, то, по крайней мере, решаемой, и работа в этом направлении закипела уже в 50-е годы, причем первые результаты были довольно обнадеживающими. Впрочем, энтузиазм вскоре пропал: выяснилось, что компьютер не в силах сделать за переводчика его работу, и, за вычетом перевода отдельных слов и простых фраз, компьютерные переводы не удовлетворяли разработчиков. Естественная речь оказалась слишком богатой, сложной и недосягаемой для возможностей даже наиболее мощных вычислительных машин. Распространенным стало мнение, что полноценный машинный перевод будет возможен только после открытия искусственного интеллекта, то есть, когда машина сможет действительно понимать смысл естественной речи, а не просто подставлять слова из словаря.

К задаче машинного перевода вернулись в 80-е годы, когда компьютеры стали намного мощнее и появились новые алгоритмы, позволившие лучше описать, понять и передать естественную речь человека. С тех пор системы машинного перевода и алгоритмы, используемые ними, постоянно совершенствуются. Наиболее перспективными сейчас считаются программы, основанные на статистическом анализе большого массива текстов на двух языках — когда компьютер сравнивает тексты с уже имеющимися их переводами, самостоятельно находит закономерности и соответствия и вырабатывает правила, используемые потом для перевода новых текстов. Компьютер, таким образом, становится самообучаемым.

Существующие сейчас программы машинного перевода показывают лучшие результаты тогда, когда они настроены на работу с достаточно простыми и похожими однотипными текстами. Так, специально для нужд Европейского Союза была разработана программа, переводящая начерно внутренние рабочие документы. Эта программа постоянно совершенствуется, анализируя уже имеющийся корпус текстов и переводов на всех языках ЕС.

Мечтой, однако, как фантастов, так и инженеров, работающих над проблемой машинного перевода, остается создание такого устройства, которое бы позволяло людям, совсем не понимающим друг друга, комфортно общаться между собой в реальном времени. Для этого нужно создать программу, объединяющую оптимально возможный переводческий алгоритм с программами распознавания голоса и синтезаторами речи. В последнее время на пути к осуществлению такой мечты было сделано несколько шагов.

В Японии — лидера в области машинного перевода — такая технология была впервые испытана на основе персонального робота Паперо (PaPeRo), разработанного корпорацией NEC. Задача этого симпатичного робота — помочь пассажирам ориентироваться в токийском аэропорту. Этот робот знает несколько десятков тысяч наиболее распространенных слов на английском и японском языках и умеет распознавать и синтезировать речь. Он может ответить на вопрос и рассказать дорогу, а также быть персональным переводчиком с японского на английский язык и наоборот. Сейчас эта технология используется в карманных компьютерах: теперь достаточно сказать что-либо по-английски в микрофон, чтобы тут же услышать перевод фразы на японский язык.

Похожий принцип действия имеет и разработанная ІBM система Mastor. Эта программа, работающая на обычном компьютере, также состоит из модулей перевода, распознавания и синтеза речи и может использоваться как персональный переводчик. Ее особенность в том, что она не просто пытается распознать каждое сказанное слово, но и, исходя из контекста, проверяет смысл сказанного, благодаря чему, как считают специалисты, удастся избежать ошибок при переводе. Впрочем, цель разработки этой программы несколько иная, чем японская. Программа, создание которой финансировал Департамент обороны США, и пока кроме английского «знает» китайский и арабский, а в данный момент «учит» самый распространенный в Афганистане язык пушту, нужна прежде всего американским военным. Первые ноутбуки с этой программой уже направлены в Ирак, где американцам катастрофически не хватает переводчиков, и будут использоваться для общения с местным населением, в том числе и для допросов. Разговор с первым же «языком» покажет, действительно ли защищена программа от ошибок, как об этом заявляют разработчики.