11 Часть I. Компоненты 14 Глава Компьютерная



бет108/197
Дата19.03.2022
өлшемі4,29 Mb.
#136225
түріЛитература
1   ...   104   105   106   107   108   109   110   111   ...   197
Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute

Направления


Глава 7


Машинный перевод
Автор: Ольга Владимировна Митренина, выпускница 1993 года, доцент кафедры математической лингвистики СПбГУ


  1. Три подхода к машинному переводу


Машинный перевод был первой задачей компьютерной лингвистики. Точнее, второй. Первой была дешифровка, а идея машинного перевода возникла из дешифровки естественным образом.
Первый компьютер появился в 1938 году — его собрал молодой не- мецкий инженер Конрад Цузе, сдвинув столы в гостиной родительского дома. В 1939 году началась Вторая мировая война, и вскоре компьютеры начали использоваться для расшифровки перехваченных сообщений про- тивника. Они позволили сократить время дешифровки с нескольких не- дель до нескольких часов.
После войны американский математик Уоррен Уивер предложил рас- смотреть задачу автоматического перевода именно как дешифровку. «Ко- гда я вижу текст на русском языке, я говорю себе, что на самом деле он написан по-английски и зашифрован при помощи странных знаков. И мне надо его просто расшифровать», — так описал Уивер задачу машинного перевода в своем письме математику и философу Норберту Винеру. Дату этого письма — 4 марта 1947 года — можно считать днем рождения ма- шинного перевода как научного направления.
Но идея перевода как дешифровки была понятна далеко не всем. Ведь люди переводят совсем не так, как работает дешифровщик. Человек дол- жен знать грамматику обоих языков и уметь пользоваться словарем. Тогда можно понять, что в предложении Маша ела кашу деятелем является Ма- ша, а ее действием — поедание какого-то продукта, которым оказывается

каша. Осознав смысл предложения и роли входящих в него слов, человек строит новое предложение на другом языке.


Дешифровщик действует иначе. Зашифрованный текст — это не слу- чайная цепочка знаков, в нем должны быть какие-то закономерности. Де- шифровщик отмечает частоту отдельных элементов текста и частоту вза- имной встречаемости элементов. Он может запомнить, в каком окружении появляются те или иные куски непонятного текста. Эти и другие «откло- нения от случайности» позволяют ему найти ключ к преобразованию за- кодированного сообщения из непонятной цепочки символов в текст на понятном языке. Так видел задачу машинного перевода Уоррен Уивер, который и сам во время войны работал шифровальщиком.
Но история распорядилась иначе, и методы дешифровки понадоби- лись разработчикам на 50 лет позже, чем предполагал Уивер. А до этого машину учили переводить тем же способом, которым действуют перево- дчики-люди — с помощью словарей и грамматик.

Сегодня существуют три разных подхода к машинному переводу:





  1. Достарыңызбен бөлісу:
1   ...   104   105   106   107   108   109   110   111   ...   197




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет