Перевод на основе правил (rule-based machine translation, RBMT) действует по той же схеме, что и человек-переводчик. Для нее необ- ходим как можно более подробный словарь и очень подробная грам- матика обоих языков. Все ранние системы переводов были основаны на правилах.
Статистический машинный перевод (statistical machine translation, SMT) обходится без словаря и грамматики, он работает только на ос- нове методов машинного обучения. Компьютеру потребуется очень много пар «предложение + его перевод». Он запомнит, как переводи- лись двойки или тройки слов, в каком окружении они встречались, где в предложении находились. После этого, получив для обработки новое предложение, он сможет выбрать его наиболее вероятный пере- вод. При этом он будет учитывать только окружение, в котором встре- чалось то или иное слово, и частоту различных цепочек слов.
Гибридный перевод (hybrid machine translation, HMT) — это комби- нация правил и статистики. Совмещать два этих подхода можно раз- ными способами, поэтому гибридные переводчики могут быть раз- ных типов. Сейчас это самый современный подход, почти все разра- ботчики стремятся использовать гибридные технологии.
При машинном переводе текст обрабатывается компьютером без уча- стия человека. А если текст переводится человеком с использованием раз- личных компьютерных технологий, то говорят об автоматизированном переводе (САТ, computer-aided translation или computer-assisted translation), но это не машинный перевод, и мы его рассматривать не бу- дем.
Достарыңызбен бөлісу: |