11 Часть I. Компоненты 14 Глава Компьютерная



бет31/197
Дата19.03.2022
өлшемі4,29 Mb.
#136225
түріЛитература
1   ...   27   28   29   30   31   32   33   34   ...   197
Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute

П → (1) → ИГ + ГГ → (2) → С + ГГ → (3) → Мама + ГГ → (5) →
Мама + (ГГ + ИГ) → (6) → Мама + (Г + ИГ) → (7) → Мама + (мыла +
ИГ) → (2) → Мама + (мыла + С); → (4) → Мама + (мыла + раму).
В результате последовательного применения правил грамматики вы- страивается последовательность словоформ, соответствующая базовому порядку слов в предложении Мама мыла раму.
Важный недостаток НС-грамматик связан с тем, что они предполага- ют соответствие между линейным порядком слов и фразовой структурой. То есть, они не учитывают, что в языках со свободным порядком слов со- ставляющая может разрываться. Именно это происходит с составляющей нерукотворный памятник в строчке Пушкина Я памятник себе воздвиг нерукотворный. Разрывы происходят и в языках со строгим порядком слов, например, в вопросительных предложениях, ср. Whom are you waiting for? (Кого вы ждёте? / Кого ты ждёшь?)

Чтобы объяснить различные порядки слов, к правилам переписыва- ния в процедуре деривации пришлось добавить перемещения. Например, для объяснения порядка слов в вопросительном предложении в деривацию добавляется правило вида «С Г Вопр → Вопр С Г», где «Вопр» — вопро- сительное слово, перемещаемое в начало предложения. Перемещения сра- батывают уже после порождения цепочки конечных обозначений с базо- вым порядком слов, поэтому формулируются именно в терминах конеч- ных обозначений (С, Г, но не ИГ или ГГ). Синтаксическая структура, воз- никающая до перемещений, называется глубинной (ГСС, deep structure); перемещения трансформируют ГСС в поверхностную структуру (ПСС, surface structure).




    1. Комбинированные теории анализа предложения

Подход, грамматики зависимостей и грамматики непосредственных составляющих, предполагает установление отношений зависимости не только между словами, но и между группами слов. На материале русского языка наиболее подробно была разработана в теории синтаксических групп (ТСГ) А. В. Гладкого. Она допускает включение в структуру пред- ложения тех групп, которые участвуют в отношении зависимости «цели- ком», а не посредством одной словоформы (ср. приведенное выше пред- ложение По графику мы работаем в среду). Такой подход позволял легко обрабатывать разрывные составляющие.
В некоторых прикладных задачах комбинированный подход реализу- ется с помощью расширенных сетей переходов (Augmented Transition Networks, ATN) и основанных на них ATN-грамматиках, которые удачно адаптируются к русскому языку. В частности, именно на этой грамматике основан синтаксический анализ предложений в системе ПРОМТ. ATN- грамматики — это комбинация НС-грамматик и Марковских цепей (сетей переходов), в которых переходы производятся не только от слова к слову (что приводит к проблемам при анализе сложных фраз), но и между сло- вами и НС или непосредственно между НС. Однако при этом для каждого класса НС строится своя независимая сеть, позволяющая анализировать эту НС по-отдельности. Кроме того, в ATN-грамматиках используются специальные «регистры» для обеспечения грамматического согласования и управления. Расширенные сети переходов являются самостоятельными алгоритмическими моделями, по мощности эквивалентными машинам Тьюринга.




  1. Достарыңызбен бөлісу:
1   ...   27   28   29   30   31   32   33   34   ...   197




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет