Таблица 1. Фрейм «Регистрация в гостинице»
Имя фрейма
|
Регистрация в гостинице
|
Слоты
|
Значения слотов
|
участники
|
клиент администратор
|
действия участников
|
предъявить записать заполнить выделить выбрать взять
|
объекты действия
|
паспорт
удостоверение личности регистрационная книга регистрационная форма бланк
номер комната этаж ключ
|
место действия
|
вестибюль
|
Если фреймовая модель создается для описания сложного события или динамически развивающейся ситуации, принято говорить о сценари- ях (scripts), которые сами по себе могут представлять систему связанных между собой фреймов. Так, сложная экстралингвистическая ситуация Гостиница хорошо описывается с помощью сценария, в сокращенном виде представленного в табл. 2. и содержащего в качестве элемента фрейм Регистрация в гостинице.
Таблица 2. Сценарий «Гостиница»
|
|
Слоты
|
Значения
|
Фрейм 1
|
Приезд
|
Регистрация в гостинице Перемещение к номеру Размещение в номере
|
…
|
↓
|
|
|
|
Фрейм 2
|
Пребывание
|
Услуги горничной Услуги портье Питание
|
…
|
|
|
Получение информации
|
|
↓
|
|
|
|
Фрейм 3
|
Отъезд
|
Оплата номера Отъезд от гостиницы
|
…
|
Особой разновидностью фреймов также являются падежные фреймы, предложенные Чарльзом Филлмором для описания семантико- синтаксических отдельных слов и целых предложений [Филлмор 1988]. Простейший падежный фрейм включает в себя данные о сочетаемости целевого слова с точки зрения семантических ролей тех контекстных эле- ментов, которые связаны с ним синтаксическими отношениями (в преде- лах рамки валентностей или модели управления). Такой фрейм состоит из метки имени, слотов с метками семантических падежей и значений слова, то есть лексических единиц контекста. Тем самым, падежные фреймы яв- ляются удобным способом формализации моделей управления или рамок валентностей, а также основным формальным средством, используемым в Грамматике конструкций.
Фреймы используются как способ хранения данных в базе конструк- ций FrameNet, в ресурсах PropBank и NomBank, а также для аннотации аргументно-предикатных структур в корпусах текстов [Palmer, Gildea, Kingsbury 2005]. Например, так в PropBank выглядит падежный фрейм для глагола buy (покупать, приобретать):
Arg0-PAG: buyer (agent) — покупатель (агенс)
Arg1-PPT: thing bought (theme) — покупаемый объект (тема)
Arg2-DIR: seller (source) — продавец (источник)
Arg3-VSP: price paid (asset) — выплачиваемая сумма (средства)
Arg4-GOL: benefactive (beneficiary) — бенефактив (лицо, получающее экономическую выгоду)
Аналогичным образом производится аннотация контекстов в PropBank, которая представима в том числе и в виде фреймовых структур:
The company bought sugar on the world market to meet export commitments. (Компания приобрела сахар на мировом рынке, чтобы вы- полнить обязательства по экспорту).
Arg0: The company (Компания)
Rel: bought (приобрела)
Arg1: sugar (сахар)
Argm-loc: on the world market (на мировом рынке)
Argm-pnc: to meet export commitments (чтобы выполнить обязатель- ства по экспорту)
Фреймовые модели успешно используются в качестве основы для он- тологий, в разработке семантических модулей для систем автоматической обработки и генерации текстов, например, в вопросно-ответных системах. Так, при моделировании информационно-справочных диалогов классифи- кационные фреймы и фреймы-сценарии позволяют адекватным образом представлять параметры экстралингвистических ситуаций, явно выражае- мые в репликах. В частности, приведенные выше в табл. 1 и 2 примеры фреймовых описаний для ситуации Гостиница были составлены для лин- гвистического процессора с опорой на типовые диалоги из словарей- разговорников [Азарова, Герд, Митрофанова 2002].
Современные разновидности семантических представлений
Сегодня появляются новые виды представления знаний, среди кото- рых на передовую вышли так называемые графы знаний (knowledge graphs) — иерархически организованные базы знаний, создаваемые для оптимизации информационного поиска [Singhal 2012]. В графе знаний хранится разнообразная информация о той или иной теме, дополняемая ссылками на информативные сайты. Источниками данных для графа зна- ний являются Wikipedia, Freebase, Wikidata, Factbook и ряд других. Графы знаний начали широко применяться в различных прикладных системах, например в компании Google, где он используется для быстрого ответа на информационные запросы прямо на странице результатов поиска. Графы знаний также помогают справляться с лексической неоднозначностью: например, при запросе об одинаково именуемых объектах факты о них приводятся отдельно, ср. Taj Mahal (Тадж-Махал) — название памятника архитектуры и имя музыканта. Граф знаний показывает связи между фак- тами об одном и том же объекте, которые могут быть неизвестны или не- очевидны для пользователя: при запросе о Марии Кюри можно получить факты о её жизни, научной биографии, семье, достижениях родственников и т. д. В 2012 году объем графа знаний компании Google составлял 570 млн объектов и 18 млрд фактов об объектах и их отношениях. Граф знаний поддерживается на нескольких языках: помимо английского в нем пред- ставлены испанский, французский, немецкий, португальский, японский, русский, итальянский. Объем хранимых объектов и отношений между ними постоянно увеличивается.
Граф знаний передает эстафету появившемуся несколько позже ре- сурсу аналогичного типа, а именно Knowledge Vault, созданному автома- тически на основе применения алгоритмов машинного обучения к интер- нет-данным. Особенностью Knowledge Vault является то, что отражаемые в нем факты имеют оценку «правдоподобности» или «доверия», т. е. сте-
пень истинности или ложности. Словом, инженерия знаний предлагает всё более сложные семантические представления, отвечающие высоким требованиям современных интеллектуальных процессоров.
Достарыңызбен бөлісу: |