Структура формальных онтологий
Формальная онтология (formal ontology) — это особый вид семан- тических представлений, которые можно определить как модель наблю- даемой действительности, либо как иерархическую форму представления знаний, отражающая структуру наблюдаемой действительности, либо как логическую теорию, позволяющую систематизировать категории действи- тельности и/или выражаемые в языке значения [Gruber 2009]. Традицион- ной лексикографией и терминоведением накоплен богатый опыт состав- ления таких описаний. Классификации понятий (или синоптические схе- мы), создаваемые философами и лингвистами, составляют каркас идео- графических словарей и тезаурусов (ср. тезаурусы Питера Марка Роже, Жана-Батиста Буассьера, Хосе Касареса, Франца Дорнзайфа, Рудольфа Халлига и Вальтера фон Вартбурга и т. д.). Ту же роль в терминологиче- ских тезаурусах, рубрикаторах и классификаторах выполняют логико- понятийные схемы предметных областей. Потребность в формальных он- тологиях связана с необходимостью систематизации, адекватной передачи и компактного хранения знаний об окружающем мире в целом и об от- дельных предметных областях.
Структура формальных онтологий включает в себя следующие ком- поненты:
классы, являющиеся обобщением наборов сущностей и организуемые в таксономию (например, класс Транспорт включает в себя подклас- сы Наземный, Водный, Воздушный и др. транспорт),
отношения, фиксирующие допустимые связи между классами (на- пример, класс Локомотив связан с классом Железнодорожный со- став отношением Быть частью),
аксиомы, задающие условия соотнесения классов и отношений (на- пример, в формальной онтологии может быть аксиома Если X являет- ся штурманом, то X не является пилотом, представимая в вид фор- мулы исчисления предикатов Штурман(Х) → ¬Пилот(Х)),
индивиды (или экземпляры), являющиеся отдельными представите- лями класса сущностей или явлений (например, Лев Яшин является экземпляром класса Вратарь) — для экземплярных онтологий, в без- экземплярных онтологиях данный уровень отсутствует.
Классификация формальных онтологий
Разработчики и исследователи формальных онтологий используют целый ряд оснований для их классификации. Формальные онтологии мо- гут различаться прежде всего по уровню формализации знаний, по типу наполнения, по цели практического применения [Константинова, Митро- фанова 2008; Соловьев, Добров, Иванов, Лукашевич 2006].
По уровню формализации знаний онтологии и подобные им ресурсы можно расположить на шкале, нижние уровни в которой занимают терми- нологически-ориентированные глоссарии, словари и тезаурусы предмет- ных областей, а на высших уровнях располагаются насыщенные научны- ми знаниями формальные таксономии и фреймовые модели.
По типу наполнения противопоставляются общие онтологии, онто- логии задач и предметные онтологии. В общих онтологиях отражаются наиболее абстрактные понятия (например, Сущности, События, Про- странство, Время и т. д.). В онтологиях задач фиксируются классы и от- ношения, связанные с применением формальной онтологии в тех или иных практических приложениях (например, в онтологии для компьютер- ных инструментов проектирования радиоэлектронных средств должны фигурировать термины, связанные с расчетом печатных плат и микросхем: тип проводника, диэлектрика, топологические характеристики, электроди- намические параметры, характеристики антенн или фильтров и т. д.). Предметные онтологии ориентированы на реестры объектов, которые ис- пользуются в различных производственных процессах (например, в про- ектной документации на мобильные устройства связи и, соответственно, в формальной онтологии по данной области упоминаются компоненты мо- бильных телефонов, модемов и т. п.).
По цели практического применения различаются онтологии пред- ставления, онтологии верхнего уровня, онтологии предметных облас- тей и прикладные онтологии. Онтологии представления создаются и используются для характеристики языка задания онтологий низших уров- ней. Онтологии верхнего уровня создаются для стандартизации знаний, разделяемых несколькими предметными областями. В них присутствуют наиболее абстрактные классы, обладающие свойством универсальности. Число таких классов относительно невелико: это категории типа Абст- рактное, Конкретное, Действие, Процесс и т. д. Примерами таких онто- логий являются модель Дж. Совы, Cyc, SUMO, DOLCE и др. Онтологии предметных областей рассчитаны на описание основных понятий и тер- минов отдельных предметных областей (например, медицина, приборо- строение, компьютерные технологии и т. д.) и не имеют ограничений на сферу их применения. В настоящее время специалисты могут пользовать- ся стандартными онтологиями предметных областей, например, онтологи-
ческими ресурсами по медицинским наукам, например, SNOMED CT (Systematized Nomenclature Of Medicine Clinical Terms). Ресурсом подобно- го же типа является NAICS (North American Industry Classification System), ориентированная на целый ряд областей (технология, строительство, сельское хозяйство и др.). Востребованы такие проекты, как онтология сферы товаров и услуг UNSPSC (United Nations Standard Products and Services Code), онтология в области культурного наследия CIDOC CRM (International Committee for Documentation Conceptual Reference Model). Прикладные онтологии ориентированы на структурирование знаний по конкретной практической задаче в некоторой области деятельности. При- мерами ресурсов данного вида являются онтология по производству TOVE (Toronto Virtual Enterprise), онтология по керамическим материалам Plinius, онтология по техническим системам во время их функционального цикла KACTUS.
Принципиально важным является также разграничение формальных онтологий, создаваемых по типу строгих аксиоматизированных теорий, и лингвистических онтологий, в которых фиксируются связи между систе- мой понятий в картине мира и средствами выражения этих понятий в ес- тественном языке. Следует признать, однако, что в современных онтоло- гических разработках существует тенденция совмещения формального и естественно-языковых приемов. Особенности лингвистических онтологий заключаются в их ориентации на описание лексических значений слов и их связей между собой (синонимия, антонимия, родо-видовые отношения, меронимия и т. д.). Лингвистические онтологии могут быть как одноязыч- ными, так и многоязычными. Наиболее известные ресурсы данного типа
это WordNet, EuroWordNet, MikroKosmos, Sensus, РуТез и некоторые другие.
Особенности создания формальных онтологий
Чтобы построить формальную онтологию, необходимо перечислить классы, обозначающие сущности или явления в моделируемой предмет- ной области, связать классы определенными отношениями, соотнести классы с языковыми значениями и конкретными лексемами. Для этого используют самые разные методы: классификацию, поиск прототипов, определение интуитивных различий между понятиями, описание межъя- зыковых соответствий, анализ предметных областей и т. п.
Создать формальную онтологию непросто. Не всегда очевидно, на- пример, по каким критериям выделять классы: как атомарные понятия (Аристотель), как прототипы (Элеанор Рош), как примитивы (Анна Веж- бицкая), как лингвоспецифические семантические классы (Джордж Ла- кофф) и пр. Кроме того, возникает вопрос о числе классов и отношений. С
этой точки зрения возможны экономный и неэкономный подходы. Сто- ронники экономного подхода предполагают, что формальные онтологии должны включать незначительное число классов, с помощью которых можно описать много более сложных понятий (Роджер Шенк, Рей Джа- кендофф, Джон Сова, Анна Вежбицкая и пр.). Сторонники неэкономного подхода считают, что формальная онтология может включать любое сколь угодно большое число классов (Джордж Миллер, Кристиана Фелльбаум и пр.).
Кроме того, классификация понятий и их признаков может оказаться неоднозначной. Например, для понятия «человек» допустимы два вариан- та его включения в иерархию: в первом случае, сначала можно ввести дифференциальный признак «пол», противопоставив понятия «лица муж- ского пола» и «лица женского пола», и затем добавить признак «возраст», противопоставив понятия «мужчина» и «мальчик», «женщина» и «девоч- ка». В то же время, возможно первичное разделение понятия «человек» по признаку «возраст» и вторичное — по признаку «пол».
Еще одна проблема, с которой сталкиваются разработчики формаль- ных онтологий — это проблема микротеории, или проблема выбора между несколькими вариантами структурирования комплекса значений. Напри- мер, есть несколько микротеорий, позволяющих по-разному включить по- нятие «цвет» в иерархию категорий формальной онтологии: «цвет» с пози- ций языковых категорий (как известно, существует зависимость между числом выражаемых в языке цветообозначений и лексическим составом этой группы), с точки зрения физики (цвета различаются по значениям па- раметров длины волны и интенсивности), с позиций нейрофизиологии (восприятие цветов глазом человека определяется тремя рецепторами).
Решение этих и других задач зависит от цели создания онтологии и от области ее применения. Но есть и общие требования к структуре фор- мальных онтологий, с учетом которых производится выбор того или иного варианта решения: онтология должна иметь четкую и прозрачную органи- зацию, она должна быть приспособлена к многократному использованию и допускать дальнейшее ее расширение.
Языки представления и редакторы формальных онтологий
Веб-документы (точнее, интернет-страницы, содержание текстовую информацию) содержат не только доступный обычным пользователям текст, но и скрытые метаданные URI (Uniform Resource Identifier). Они содержат важные сведения о документе и позволяют проводить поиск по тем или иным параметрам. Метаданные обладают особой структурой и содержанием, которое передается в форматах XML (Extensible Markup
Достарыңызбен бөлісу: |