11 Часть I. Компоненты 14 Глава Компьютерная



бет149/197
Дата19.03.2022
өлшемі4,29 Mb.
#136225
түріЛитература
1   ...   145   146   147   148   149   150   151   152   ...   197
Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute

Извлечение событий


В этом разделе мы уберем ограничение на число задействованных именованных сущностей и обратимся к автоматическому извлечению со- бытий. Событие мы определим как минимальное описание ситуации или изменения в положении вещей, отвечающее на основные вопросы о том, что произошло, кто это сделал, когда, где и почему. Большая часть литера- туры на эту тему использует стандартный размеченный корпус текстов политически-военной тематики и касается распознавания ограниченного числа событий: восьми основных категорий и 33 подтипов. Как и при из- влечении отношений, многие системы разбивают задачу на два этапа. Сперва принимается решение, выражает ли рассматриваемое слово суть события (event triggering word). Затем, в случае утвердительного ответа, находятся участники события и устанавливаются их роли. Как и с другими рассмотренными нами задачами, сложность состоит в поиске надежных сигналов и эффективного алгоритма.
Очевидно, набор из 33 событий является далеко не полным, а состав- ление исчерпывающего списка вручную представляет собой трудоемкую задачу. Поэтому вместо того, чтобы обсуждать достоинства и недостатки систем, распознающих события из этого короткого списка, данный раздел мы посвятим методам, позволяющим автоматически создавать модели событий гораздо большего размера. Под моделью событий мы будем по- нимать совокупность шаблонов, сгруппированных в соответствии с выра-

жаемыми ими событиями. Так, в табл. 3 приведены примеры шаблонов, выражающих бракосочетание и приобретение одной компанией другой.






Достарыңызбен бөлісу:
1   ...   145   146   147   148   149   150   151   152   ...   197




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет