Глава 7
Машинный перевод
Автор: Ольга Владимировна Митренина, выпускница 1993 года, доцент кафедры математической лингвистики СПбГУ
Три подхода к машинному переводу
Машинный перевод был первой задачей компьютерной лингвистики. Точнее, второй. Первой была дешифровка, а идея машинного перевода возникла из дешифровки естественным образом.
Первый компьютер появился в 1938 году — его собрал молодой не- мецкий инженер Конрад Цузе, сдвинув столы в гостиной родительского дома. В 1939 году началась Вторая мировая война, и вскоре компьютеры начали использоваться для расшифровки перехваченных сообщений про- тивника. Они позволили сократить время дешифровки с нескольких не- дель до нескольких часов.
После войны американский математик Уоррен Уивер предложил рас- смотреть задачу автоматического перевода именно как дешифровку. «Ко- гда я вижу текст на русском языке, я говорю себе, что на самом деле он написан по-английски и зашифрован при помощи странных знаков. И мне надо его просто расшифровать», — так описал Уивер задачу машинного перевода в своем письме математику и философу Норберту Винеру. Дату этого письма — 4 марта 1947 года — можно считать днем рождения ма- шинного перевода как научного направления.
Но идея перевода как дешифровки была понятна далеко не всем. Ведь люди переводят совсем не так, как работает дешифровщик. Человек дол- жен знать грамматику обоих языков и уметь пользоваться словарем. Тогда можно понять, что в предложении Маша ела кашу деятелем является Ма- ша, а ее действием — поедание какого-то продукта, которым оказывается
каша. Осознав смысл предложения и роли входящих в него слов, человек строит новое предложение на другом языке.
Дешифровщик действует иначе. Зашифрованный текст — это не слу- чайная цепочка знаков, в нем должны быть какие-то закономерности. Де- шифровщик отмечает частоту отдельных элементов текста и частоту вза- имной встречаемости элементов. Он может запомнить, в каком окружении появляются те или иные куски непонятного текста. Эти и другие «откло- нения от случайности» позволяют ему найти ключ к преобразованию за- кодированного сообщения из непонятной цепочки символов в текст на понятном языке. Так видел задачу машинного перевода Уоррен Уивер, который и сам во время войны работал шифровальщиком.
Но история распорядилась иначе, и методы дешифровки понадоби- лись разработчикам на 50 лет позже, чем предполагал Уивер. А до этого машину учили переводить тем же способом, которым действуют перево- дчики-люди — с помощью словарей и грамматик.
Сегодня существуют три разных подхода к машинному переводу:
Достарыңызбен бөлісу: |