Л. Партыка, И. И. Попов системы управления базами данных



бет116/215
Дата29.01.2022
өлшемі4,64 Mb.
#115817
1   ...   112   113   114   115   116   117   118   119   ...   215
Байланысты:
Голицына О Л Партыка Т Л Попов И И Системы

Логическая структура. С логической точки зрения входящие в JURIUS БД имеют относительно стандартную структуру и включают две компоненты — регистрационные карты (РК) и полные тексты. РК представляют собой форматированные записи, содержащие относительно стандартный набор библиографических данных, а также ссылку на соответствующий полный текст (рис. 3.25). Полные тексты документов состоят из страниц двух типов:

Рис. 3.25. Логическая структура БД ЮРИУС



  • логических, т. е. структурных единиц текста (пункт, параграф, статья);

  • физических (принудительное разбиение длинного неструктурированного текста на фрагменты одинаковой длины).

Данная структура базы данных позволяет осуществлять по­иск по цепочкам:

Термин — РК — Документ — Страница (интерфейс IX)


или

Термин — Страница —Документ — РК'(интерфейс DC).



Физическая структура БД ЮРИУС (рис. 3.26) является примером реализации документальной системы в среде системы программирования с элементами реляционной СУБД.

Рис. 3.26. Физическая структура БД и использование файлов модулями пользовательского интерфейса



Файл текстовой части БД (szdoc.dbf) один или несколько файлов, в которых содержатся полные тексты актов (см. также рис. 3.34). На логическом уровне образует иерархическую структуру: БД (том), документ, страница (рис. 3.26).

Словарный файл текстовой части (dcfrv.dbf) представляет собой список слов и/или словосочетаний (например, «статья 256», «п. 13», «№ 1400-РП»), извлеченных из текста, сопровождаемых частотами появления в данной БД (см. рис. 3.31, 3.32). Практика выделения словосочетаний при индексировании с целью включения их в словарь и инверсный список является достаточно известной.

Инверсный файл текстовой части (dcind.dbf) — список кодов слов и словосочетаний, сопровождаемых номерами страниц. Словарный и инверсный файл используются для сквозного полнотекстового поиска.

Справочно-поисковые файлы (СПФ) (до 9 различных файлов sf 1. dbf—sf 9 . dbf). Стандартным является файл регистрационных карт нормативных актов (РК), запись которого содержит наименование, дату, номер, вид, ссылки на страницы БД и другие поля, перечень которых может изменяться для конкретной БД (рис. 3.27).

 

Рис. 3.27. Взаимодействие программных компонент ЮРИУС в процессе создания и использования БД

Словарь справочно-поисковых файлов (ixfrv.dbf) содержит значения и коды полей (например, РК) совместно с частотой появления (см. рис. 3.27) и ссылкой на номер файла СПФ.

Инверсный файл СПФ (ixind.dbf) содержит коды слов и словосочетаний. Словарный и инверсный файлы используются для поиска записей СПФ (РК, рубрики указателя и т. д.) с доступом к странице БД.

Файл синонимов (ixtrc) служит для расшифровки кодов или для обеспечения двуязычного поиска в словарных файлах (см. рис. 3.26).

Файл описания СПФ (словарь данных ixddm.dbf — табл. 3.3) содержит данные о полных, сокращенных и внутренних именах полей каждого СПФ, типах данных, разделителях слов, методах обработки числовых кодов и т. д. Используется при поиске через СПФ и при построении словарных и инверсных файлов.

Файлы хранимых запросов (sql—sq9) содержат запросы к СПФ БД, отлаженные и сохраненные пользователем.

Файл заметок (NotaBene) позволяет пользователю дополнить СПФ собственными именованными прямыми ссылками на страницы БД.

Программные средства БД ЮРИУС. Рассмотрим структуру программных средств ИБД ЮРИУС (см. рис. 3.27).

Средства администратора БД и АРМ подготовки данных. Программные средства ЮРИУС позволяют осуществлять выделение тематических фрагментов БД на основе дескрипторного поиска и объединения нескольких фрагментов и БД (нескольких БД) при установке у пользователя.

Функции интерфейса оператора подготовки данных (ОПД) встроены в интерфейс АБД, однако в состав ЮРИУС входит также АРМ ОПД, распространяемый отдельно и предназначенный для децентрализованного использования в пунктах подготовки данных.

АРМ оператора подготовки данных реализует следующие функции:


  • ввод текстов актов и регистрационных карт;

  • поиск РК по названию, дате, номеру;

  • просмотр и корректировка РК и текста акта.

Различаются: центральный интерфейс АБД, предназначенный для создания и поддержания дистрибутивной версии БД, и локальный интерфейс администратора базы данных, предназначенный для выполнения на ПЭВМ конечного пользователя (единичного или в режиме сети).

Центральный интерфейс АБД обеспечивает функции: .


  • построения словарного и инверсного файлов для СПФ;

  • корректировки (вставку, удаление, редактирование элементов) СПФ с соответствующим обновлением ассоциированных файлов;

  • построение словарного и инверсного файлов для полнотекстового словарного поиска;

  • просмотр словарей, визуальное обнаружение ошибок, исправление словарей и текста; дозагрузку данных в БД;

  • слияние нескольких БД (соединение и обновление файлов, описанных выше). Построение частотных словарей сопровождается накоплением статистики словопоявлений с целью создания критериев отбора терминов индексирования.

Основные операции при загрузке БД в рамках центрального интерфейса (случай поиска по РК) включают построение на основе файла sfl файлов ixind, ixfrv, управление процессом загрузки  (типом  обработки  полей)  осуществляется с помощью файла ixddm, структура и содержание основных полей которого приведены в табл. 3.3.



Достарыңызбен бөлісу:
1   ...   112   113   114   115   116   117   118   119   ...   215




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет