11 Часть I. Компоненты 14 Глава Компьютерная


Некоторые современные системы машинного перевода



бет129/197
Дата19.03.2022
өлшемі4,29 Mb.
#136225
түріЛитература
1   ...   125   126   127   128   129   130   131   132   ...   197
Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute

Некоторые современные системы машинного перевода


В этом разделе мы рассмотрим основные системы машинного пере- вода. Почти все они предоставляют бесплатные онлайн-версии, с помо- щью которых читатель сможет сравнить их работу.


Systran (США, затем Франция, затем Корея)

Это самая старая из успешных и самая успешная из старых перево- дческих систем. Американская компания Systran начала разрабатывать ее в 1968 году для Военно-воздушных сил США. Первым делом был создан переводчик с русского на английский — шла холодная война. В 1973 году к нему добавился переводчик с английского на русский, его разрабатывали специально для совместного космического проекта СССР и США «Союз

  • Аполлон». В 1986 году компанию Systran купила французская семья Гашо (Gachot), с тех пор Systran считался французской системой. Но в

2014 году ее контрольный пакет акций приобрела корейская фирма CSLi, которая, в частности, создавала переводчик для последних моделей Samsung Galaxy. Компания CSLi изменила свое название на Systran International и планирует стать абсолютным лидером машинного перевода. Переводчик Systran используется во многих других компаниях, на- пример, на его основе действует перевод Babel Fish в системе Yahoo! До 2007 года на основе Systran работал переводчик Google. Клиентом Systran


до сих пор является Министерство обороны США.
Systran предоставляет бесплатный онлайн-перевод на своем сайте http://www.systransoft.com/, там же продаются его системы различных конфигураций. Перевод разработан для 52 языков, бесплатная онлайн- версия доступна только для десяти из них.


Logos и OpenLogos (США и Германия)

Переводчик Logos начал разрабатываться компанией Logos Corporation в 1970 году специально для войны во Вьетнаме, поэтому пер- вая пара языков Logos была англо-вьетнамской. Рабочая версия для этой пары была представлена в 1972 году, за три года до окончания вьетнам- ской войны, которая длилась более 19 лет. Коммерческая версия програм- мы сейчас разрабатывается компанией Group Business Software AG для операционной системы Microsoft Windows.
C 2005 года Немецкий исследовательский центр по искусственному интеллекту (DFKI) создает бесплатную версию этого переводчика с назва- нием OpenLogos. Эта система переводит с немецкого и английского язы- ков на французский, итальянский, испанский и португальский. Она рабо- тает на основе правил и легко позволяет подключать новые словари.


PROMT (Россия)

Это лучший российский переводчик. Он разрабатывается компанией PROMT, главный офис которой находится в Санкт-Петербурге. Компании принадлежит первый онлайн-переводчик русскоязычного интернета.
PROMT был создан в 1991 году сотрудниками лаборатории инженер- ной лингвистики Ленинградского педагогического института им. А. И. Герцена. Уже в 1992 году компания выиграла тендер NASA на поставку систем машинного перевода с английского языка на русский. C 1992 по 1998 год эта программа называлась STYLUS. Сейчас разработаны перево- дчики PROMT для 64 языковых пар, в том числе для 34 пар без использо- вания русского языка.
Вначале PROMT действовал только на основе правил, но с 2010 года система стала использовать также статистические и гибридные техноло- гии. Гибридные технологии PROMT используются в работе международ- ного туристического онлайн-сервиса TripAdvisor.

В 2013 и 2014 годах компания становилась победителем в конкурсе разработчиков систем машинного перевода в рамках Семинара по стати- стическому машинному переводу, который проводится под эгидой Ассо- циации компьютерной лингвистики (ACL).




Linguatec (Германия)

Эта система разрабатывается с 1996 года немецкой компанией Linguatec, которая специализируется также на синтезе речи и преобразо- вании устной речи в текст. Иными словами, Linguatec занимается не толь- ко переводом, но также учит машину читать вслух тексты и записывать то, что ей диктует человек. Переводчик Linguatec основан на правилах, в 2006 году компания запатентовала технологию нейронного трансфера, работающего по принципам нейронной сети, с 2010 года в систему стали интегрироваться гибридные технологии.


IdiomaX (Швейцария, но больше похоже на Италию)

Этот переводчик с 1996 года разрабатывается швейцарской компани- ей IdiomaX. С 1998 года в течение нескольких лет итальянская компания Garzanti распространяла этот переводчик в книжных магазинах Италии, поэтому особой популярностью он пользуется у итальянцев. Действует на основе правил.


Babylon (Израиль)

Разрабатывается израильской компанией Babylon с 1997 года. Первые версии были бесплатными, но позже эта система стала платной. В 2011 году программа стала лидером по числу бесплатных скачиваний и была занесена в Книгу рекордов Гиннеса. Число пользователей програм- мы превысило 100 миллионов, сайт компании попал в список 100 наибо- лее посещаемых сайтов мира. Но в 2012 компоненты системы были при- знаны вредоносными, поскольку переводческая панель Babylon устанав- ливала в браузере свою собственную главную страницу и страницу поис- ка, не позволяя их переустанавливать.


Apertium (Испания)

Эту систему по заказу испанского правительства начали создавать че- тыре университета и три лингвистических компании. Первая версия Apertium была представлена миру в 2005 году. Это открытая система, ос- нованная на правилах. На сайте SourceForge можно бесплатно скачать весь код Apertium и ее лингвистические данные. Система создавалась вначале для близкородственных языков, но сейчас она работает для самых разных пар. Чтобы подключить новую языковую пару, нужно добавить словарь и лингвистическую информацию о структуре необходимых языков.
Google Переводчик, Google Translate (США)

Бесплатный переводческий сервис Google. Предлагает перевод для любой языковой пары из 73 языков — например, перевод с телугу на хмонг.
Этот переводчик разработан американской компанией Google. Внача- ле она предлагала перевод на основе системы Systran. Но в 2004 году ру- ководство компании решило отказаться от Systran и создать свой собст- венный переводчик на основе статистических методов. В апреле 2006 фирменный переводчик Google был запущен. Он действовал для пар араб- ский-английский и английский-арабский, но скоро к нему прибавились пары с русским и китайским языком. В 2007 году Google перевел все имевшиеся у него языковые пары на статистические методы перевода, отказавшись от использования переводчика Systran. После этого в систему добавлялись новые языки и опции.


Переводчик Bing (США)

Разрабатывается компанией Microsoft c 2009 года для ее поискового сервиса Bing. Обрабатывает более 40 языков на основе статистических методов.


Яндекс. Переводчик (Россия)

В марте 2011 года российская поисковая система Яндекс запустила сервис «Яндекс. Переводчик», действующий на основе статистических методов. Он позволял переводить тексты и веб-страницы с русского на английский или украинский язык и обратно. Сейчас этот сервис предос- тавляет перевод для 67 языков.


Переводчик на основе ABBYY Compreno (Россия)

В 2011 году ведущая российская компания ABBYY получила от Скол- ково грант для создания новой технологии синтаксического и семантиче- ского анализа текста под названием ABBYY Compreno. Ядром этой техно- логии стала универсальная иерархия понятий и сеть отношений между ними. В идеале эта иерархия будет содержать все смыслы, о которых го- ворят и думают люди, с указанием связей между этими смыслами. В ре- зультате из каждого предложения можно будет выделить закодированный в нем смысл.
Разработчики планируют использовать ABBYY Compreno для реше- ния различных задач прикладной лингвистики. На ее основе уже реализо- ван интеллектуальный поиск, то есть поиск по смыслу, а не по ключевым словам. Сейчас ABBYY активно работает над созданием нового перево- дчика, который пока не получил официального названия.
Автор благодарит сотрудников компании PROMT Н. В. Железняк, А. П. Молчанова, А. В. Бутакова и Т. Н. Пилатову за помощь в написании этой статьи.




Достарыңызбен бөлісу:
1   ...   125   126   127   128   129   130   131   132   ...   197




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет