11 Часть I. Компоненты 14 Глава Компьютерная



бет45/197
Дата19.03.2022
өлшемі4,29 Mb.
#136225
түріЛитература
1   ...   41   42   43   44   45   46   47   48   ...   197
Байланысты:
nikolaev is mitrenina ov lando tm red prikladnaia i kompiute

Таблица 1. Фрейм «Регистрация в гостинице»



Имя фрейма

Регистрация в гостинице

Слоты

Значения слотов

участники

клиент администратор

действия участников

предъявить записать заполнить выделить выбрать взять

объекты действия

паспорт
удостоверение личности регистрационная книга регистрационная форма бланк
номер комната этаж ключ

место действия

вестибюль

Если фреймовая модель создается для описания сложного события или динамически развивающейся ситуации, принято говорить о сценари- ях (scripts), которые сами по себе могут представлять систему связанных между собой фреймов. Так, сложная экстралингвистическая ситуация Гостиница хорошо описывается с помощью сценария, в сокращенном виде представленного в табл. 2. и содержащего в качестве элемента фрейм Регистрация в гостинице.




Таблица 2. Сценарий «Гостиница»









Слоты

Значения

Фрейм 1

Приезд

Регистрация в гостинице Перемещение к номеру Размещение в номере














Фрейм 2

Пребывание

Услуги горничной Услуги портье Питание












Получение информации















Фрейм 3

Отъезд

Оплата номера Отъезд от гостиницы



Особой разновидностью фреймов также являются падежные фреймы, предложенные Чарльзом Филлмором для описания семантико- синтаксических отдельных слов и целых предложений [Филлмор 1988]. Простейший падежный фрейм включает в себя данные о сочетаемости целевого слова с точки зрения семантических ролей тех контекстных эле- ментов, которые связаны с ним синтаксическими отношениями (в преде- лах рамки валентностей или модели управления). Такой фрейм состоит из метки имени, слотов с метками семантических падежей и значений слова, то есть лексических единиц контекста. Тем самым, падежные фреймы яв- ляются удобным способом формализации моделей управления или рамок валентностей, а также основным формальным средством, используемым в Грамматике конструкций.


Фреймы используются как способ хранения данных в базе конструк- ций FrameNet, в ресурсах PropBank и NomBank, а также для аннотации аргументно-предикатных структур в корпусах текстов [Palmer, Gildea, Kingsbury 2005]. Например, так в PropBank выглядит падежный фрейм для глагола buy (покупать, приобретать):
Arg0-PAG: buyer (agent) покупатель (агенс)
Arg1-PPT: thing bought (theme) покупаемый объект (тема)
Arg2-DIR: seller (source) продавец (источник)
Arg3-VSP: price paid (asset) выплачиваемая сумма (средства)
Arg4-GOL: benefactive (beneficiary) бенефактив (лицо, получающее экономическую выгоду)
Аналогичным образом производится аннотация контекстов в PropBank, которая представима в том числе и в виде фреймовых структур:
The company bought sugar on the world market to meet export commitments. (Компания приобрела сахар на мировом рынке, чтобы вы- полнить обязательства по экспорту).
Arg0: The company (Компания)
Rel: bought (приобрела)
Arg1: sugar (сахар)
Argm-loc: on the world market (на мировом рынке)
Argm-pnc: to meet export commitments (чтобы выполнить обязатель- ства по экспорту)

Фреймовые модели успешно используются в качестве основы для он- тологий, в разработке семантических модулей для систем автоматической обработки и генерации текстов, например, в вопросно-ответных системах. Так, при моделировании информационно-справочных диалогов классифи- кационные фреймы и фреймы-сценарии позволяют адекватным образом представлять параметры экстралингвистических ситуаций, явно выражае- мые в репликах. В частности, приведенные выше в табл. 1 и 2 примеры фреймовых описаний для ситуации Гостиница были составлены для лин- гвистического процессора с опорой на типовые диалоги из словарей- разговорников [Азарова, Герд, Митрофанова 2002].




    1. Современные разновидности семантических представлений

Сегодня появляются новые виды представления знаний, среди кото- рых на передовую вышли так называемые графы знаний (knowledge graphs) — иерархически организованные базы знаний, создаваемые для оптимизации информационного поиска [Singhal 2012]. В графе знаний хранится разнообразная информация о той или иной теме, дополняемая ссылками на информативные сайты. Источниками данных для графа зна- ний являются Wikipedia, Freebase, Wikidata, Factbook и ряд других. Графы знаний начали широко применяться в различных прикладных системах, например в компании Google, где он используется для быстрого ответа на информационные запросы прямо на странице результатов поиска. Графы знаний также помогают справляться с лексической неоднозначностью: например, при запросе об одинаково именуемых объектах факты о них приводятся отдельно, ср. Taj Mahal (Тадж-Махал) — название памятника архитектуры и имя музыканта. Граф знаний показывает связи между фак- тами об одном и том же объекте, которые могут быть неизвестны или не- очевидны для пользователя: при запросе о Марии Кюри можно получить факты о её жизни, научной биографии, семье, достижениях родственников и т. д. В 2012 году объем графа знаний компании Google составлял 570 млн объектов и 18 млрд фактов об объектах и их отношениях. Граф знаний поддерживается на нескольких языках: помимо английского в нем пред- ставлены испанский, французский, немецкий, португальский, японский, русский, итальянский. Объем хранимых объектов и отношений между ними постоянно увеличивается.
Граф знаний передает эстафету появившемуся несколько позже ре- сурсу аналогичного типа, а именно Knowledge Vault, созданному автома- тически на основе применения алгоритмов машинного обучения к интер- нет-данным. Особенностью Knowledge Vault является то, что отражаемые в нем факты имеют оценку «правдоподобности» или «доверия», т. е. сте-

пень истинности или ложности. Словом, инженерия знаний предлагает всё более сложные семантические представления, отвечающие высоким требованиям современных интеллектуальных процессоров.






  1. Достарыңызбен бөлісу:
1   ...   41   42   43   44   45   46   47   48   ...   197




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет