11 Часть I. Компоненты 14 Глава Компьютерная



бет36/197
Дата19.03.2022
өлшемі4,29 Mb.
#136225
түріЛитература
1   ...   32   33   34   35   36   37   38   39   ...   197
Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute
Латын тілі 4,5 - дәріс 2, 169-182 фил, Вопросы на русском языке, 6 үж
Листинг 1. RASP/Gate: костюм — место встречи


("T"
("S" ("NP" "President")
("VP" "meet+ed" ("N1" ("AP" "prime") "minister")
("PP" "in" ("NP" "his" "suite"))))
".")
("T"
("S" ("NP" "President")
("VP" "meet+ed" ("N1" ("AP" "prime") "minister")
("PP" "in" ("NP" "his" "lobby"))))
".")

К числу одноцелевых парсеров, не различающих эти две синтаксиче- ские структуры, относится и парсер системы OpenNLP.




    1. Link Grammar Parser

Синтаксический анализатор Link Grammar Parser для русского языка строит четыре версии разбора как для предложения Николай встретил гостей в прихожей, так и для предложения Николай встретил гостей в халате, но третья и четвёртая версии полностью повторяют первые две, а вторая отличается от первой лишь тем, что в первой версии слово Нико- лай почему-то разобрано как имя нарицательное. Во всех версиях разбора

второго предложения в халате оказывается обстоятельством места, т. е. халат — это место встречи.




Рис. 12. Link Grammar Parser: неоднозначность обнаружена, но халат — место встречи
Вместе с тем, для предложения Он увидел их семью своими глазами Link Grammar Parser строит целых 14 версий разбора, среди которых есть и те, что были указаны выше, и даже совсем не очевидные версии (напри- мер, версия, которой можно сопоставить только такую трактовку: ‘Он сам увидел, что они могут стать семью’).
Приведём лишь первую и последнюю версии (в первой версии речь идёт о семье, в последней — о семи глазах):





Рис. 13. Link Grammar Parser: обнаружены все версии разбора
Для предложения Эти типы стали есть в цехе строится 12 версий разбора. В версиях с подозрительными типами, которые выдаются в пер- вую очередь, различаются возможные способы отнесения обстоятельства в цехе: в одной группе версий оно относится к глагольной форме стали, в другой — к есть, в третьей — к типам. Версии с типами стали (сплава) почти не различаются; лишь в одной из них форма есть верно распознана как инфинитивная. Приведём здесь лишь первую и последнюю версии.


Рис. 14. Link Grammar Parser: обнаружены все версии разбора
Link Grammar Parser отличается от рассмотренных выше систем тем, что он в действительности является многоцелевым. К сожалению, эта сис- тема не позволяет встраивать в процедуру разбора семантические ограни- чения и тем самым хотя бы частично снимать неоднозначность, и у этой системы отсутствуют способы настройки правил грамматики, которыми пользуется система.


    1. NLTK

Лингвистический пакет NLTK, как и Link Grammar Parser, строит не- сколько версий разбора; в отличие от всех вышеперечисленных систем, он позволяет пользователю самостоятельно записывать грамматику в виде правил переписывания (используется НС-грамматика). Ниже приводится пример короткой программы на языке Python, использующей NLTK для разбора предложения Николай встретил гостей в коридоре и выдача этой программы.




Достарыңызбен бөлісу:
1   ...   32   33   34   35   36   37   38   39   ...   197




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет