В этом разделе мы уберем ограничение на число задействованных именованных сущностей и обратимся к автоматическому извлечению со- бытий. Событие мы определим как минимальное описание ситуации или изменения в положении вещей, отвечающее на основные вопросы о том, что произошло, кто это сделал, когда, где и почему. Большая часть литера- туры на эту тему использует стандартный размеченный корпус текстов политически-военной тематики и касается распознавания ограниченного числа событий: восьми основных категорий и 33 подтипов. Как и при из- влечении отношений, многие системы разбивают задачу на два этапа. Сперва принимается решение, выражает ли рассматриваемое слово суть события (event triggering word). Затем, в случае утвердительного ответа, находятся участники события и устанавливаются их роли. Как и с другими рассмотренными нами задачами, сложность состоит в поиске надежных сигналов и эффективного алгоритма.
Очевидно, набор из 33 событий является далеко не полным, а состав- ление исчерпывающего списка вручную представляет собой трудоемкую задачу. Поэтому вместо того, чтобы обсуждать достоинства и недостатки систем, распознающих события из этого короткого списка, данный раздел мы посвятим методам, позволяющим автоматически создавать модели событий гораздо большего размера. Под моделью событий мы будем по- нимать совокупность шаблонов, сгруппированных в соответствии с выра-
жаемыми ими событиями. Так, в табл. 3 приведены примеры шаблонов, выражающих бракосочетание и приобретение одной компанией другой.
Достарыңызбен бөлісу: |