11 Часть I. Компоненты 14 Глава Компьютерная

жүктеу/скачать 4,29 Mb.

бет	108/197
Дата	19.03.2022
өлшемі	4,29 Mb.
	#136225
түрі	Литература

1 ... 104 105 106 107 108 109 110 111 ... 197

Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute

Три подхода к машинному переводу

Направления

Глава 7

Машинный перевод
Автор: Ольга Владимировна Митренина, выпускница 1993 года, доцент кафедры математической лингвистики СПбГУ

Три подхода к машинному переводу

Машинный перевод был первой задачей компьютерной лингвистики. Точнее, второй. Первой была дешифровка, а идея машинного перевода возникла из дешифровки естественным образом.
Первый компьютер появился в 1938 году — его собрал молодой не- мецкий инженер Конрад Цузе, сдвинув столы в гостиной родительского дома. В 1939 году началась Вторая мировая война, и вскоре компьютеры начали использоваться для расшифровки перехваченных сообщений про- тивника. Они позволили сократить время дешифровки с нескольких не- дель до нескольких часов.
После войны американский математик Уоррен Уивер предложил рас- смотреть задачу автоматического перевода именно как дешифровку. «Ко- гда я вижу текст на русском языке, я говорю себе, что на самом деле он написан по-английски и зашифрован при помощи странных знаков. И мне надо его просто расшифровать», — так описал Уивер задачу машинного перевода в своем письме математику и философу Норберту Винеру. Дату этого письма — 4 марта 1947 года — можно считать днем рождения ма- шинного перевода как научного направления.
Но идея перевода как дешифровки была понятна далеко не всем. Ведь люди переводят совсем не так, как работает дешифровщик. Человек дол- жен знать грамматику обоих языков и уметь пользоваться словарем. Тогда можно понять, что в предложении Маша ела кашу деятелем является Ма- ша, а ее действием — поедание какого-то продукта, которым оказывается

каша. Осознав смысл предложения и роли входящих в него слов, человек строит новое предложение на другом языке.

Дешифровщик действует иначе. Зашифрованный текст — это не слу- чайная цепочка знаков, в нем должны быть какие-то закономерности. Де- шифровщик отмечает частоту отдельных элементов текста и частоту вза- имной встречаемости элементов. Он может запомнить, в каком окружении появляются те или иные куски непонятного текста. Эти и другие «откло- нения от случайности» позволяют ему найти ключ к преобразованию за- кодированного сообщения из непонятной цепочки символов в текст на понятном языке. Так видел задачу машинного перевода Уоррен Уивер, который и сам во время войны работал шифровальщиком.
Но история распорядилась иначе, и методы дешифровки понадоби- лись разработчикам на 50 лет позже, чем предполагал Уивер. А до этого машину учили переводить тем же способом, которым действуют перево- дчики-люди — с помощью словарей и грамматик.

Сегодня существуют три разных подхода к машинному переводу:

жүктеу/скачать 4,29 Mb.

Достарыңызбен бөлісу:

1 ... 104 105 106 107 108 109 110 111 ... 197

11 Часть I. Компоненты 14 Глава Компьютерная

Направления

Три подхода к машинному переводу