Листинг 1. RASP/Gate: костюм — место встречи
("T"
("S" ("NP" "President")
("VP" "meet+ed" ("N1" ("AP" "prime") "minister")
("PP" "in" ("NP" "his" "suite"))))
".")
("T"
("S" ("NP" "President")
("VP" "meet+ed" ("N1" ("AP" "prime") "minister")
("PP" "in" ("NP" "his" "lobby"))))
".")
К числу одноцелевых парсеров, не различающих эти две синтаксиче- ские структуры, относится и парсер системы OpenNLP.
Link Grammar Parser
Синтаксический анализатор Link Grammar Parser для русского языка строит четыре версии разбора как для предложения Николай встретил гостей в прихожей, так и для предложения Николай встретил гостей в халате, но третья и четвёртая версии полностью повторяют первые две, а вторая отличается от первой лишь тем, что в первой версии слово Нико- лай почему-то разобрано как имя нарицательное. Во всех версиях разбора
второго предложения в халате оказывается обстоятельством места, т. е. халат — это место встречи.
Рис. 12. Link Grammar Parser: неоднозначность обнаружена, но халат — место встречи
Вместе с тем, для предложения Он увидел их семью своими глазами Link Grammar Parser строит целых 14 версий разбора, среди которых есть и те, что были указаны выше, и даже совсем не очевидные версии (напри- мер, версия, которой можно сопоставить только такую трактовку: ‘Он сам увидел, что они могут стать семью’).
Приведём лишь первую и последнюю версии (в первой версии речь идёт о семье, в последней — о семи глазах):
Рис. 13. Link Grammar Parser: обнаружены все версии разбора
Для предложения Эти типы стали есть в цехе строится 12 версий разбора. В версиях с подозрительными типами, которые выдаются в пер- вую очередь, различаются возможные способы отнесения обстоятельства в цехе: в одной группе версий оно относится к глагольной форме стали, в другой — к есть, в третьей — к типам. Версии с типами стали (сплава) почти не различаются; лишь в одной из них форма есть верно распознана как инфинитивная. Приведём здесь лишь первую и последнюю версии.
Рис. 14. Link Grammar Parser: обнаружены все версии разбора
Link Grammar Parser отличается от рассмотренных выше систем тем, что он в действительности является многоцелевым. К сожалению, эта сис- тема не позволяет встраивать в процедуру разбора семантические ограни- чения и тем самым хотя бы частично снимать неоднозначность, и у этой системы отсутствуют способы настройки правил грамматики, которыми пользуется система.
NLTK
Лингвистический пакет NLTK, как и Link Grammar Parser, строит не- сколько версий разбора; в отличие от всех вышеперечисленных систем, он позволяет пользователю самостоятельно записывать грамматику в виде правил переписывания (используется НС-грамматика). Ниже приводится пример короткой программы на языке Python, использующей NLTK для разбора предложения Николай встретил гостей в коридоре и выдача этой программы.
Достарыңызбен бөлісу: |