Рекомендации по составлению запроса интеллектуального поиска:
1. Поиск по заданной проблеме – запрос должен быть направлен на смысловое содержание документа, описывать проблему. Вводите слова полностью, с окончаниями. Слова поисковой цепочки объединяются по принципу логического И, поэтому порядок слов не важен. Если ищете по точной фразе, воспользуйтесь атрибутным поиском. Не используйте отрицания при формулировке запроса: не, кроме, без. Для задания сложных условий обратитесь к атрибутному поиску. Можно не вводить предлоги и союзы, так как они находятся в словаре «шумовых» слов и автоматически отбрасываются системой.
2. Поиск по номеру – в этом случае вводите такие последовательности: символ «№» или «N» плюс число. Пример: № 122 или N 13. Между символом номера и числом могут быть символы-разделители (дефис, точка), пробел. Пример: N-10084 или № 43. 3. Поиск по дате – в строке интеллектуального поиска можно указать дату для поиска документа по дате принятия.
Для задания даты используйте формат: D.M.Y, где D – день, М – месяц, Y – год, выраженные цифровыми значениями. При этом длина хотя бы одной последовательности цифр должна быть больше единицы. То есть поиск не будет корректным, если введете «1.6.6», подразумевая 1 июня 2006 года. Достаточно ввести «01.6.6» или «7.06.6» или «1.6.06». В качестве символов-разделителей при задании даты можно использовать точку, косую черту или запятую.
Нельзя использовать разные символы-разделители при задании даты, например «01.06,06». Такие подстроки не распознаются как дата и не участвуют в поиске.
Возможно задание даты по другому шаблону: D month Ystr, где D – числовое значение дня месяца, month –наименование месяца на русском или английском языках, Y – числовое значение года, выраженное последовательностью цифр длиною в 4 символа, str –необязательное завершение, которое может состоять из одного (любого) слова. Пример: 3 сентября 2002 года или 3 September 2002. В наименовании месяца распознаются первые три буквы.
4. Поиск по дате и номеру – в поисковую строку можно ввести и дату, и номер одновременно.
5. Другие запросы с цифрами – в запросе могут оказаться цифры, не являющиеся номерами или датами. В таком случае система произведет анализ этих цифр, чтобы определить их значение: дата, номер или слово, и в соответствии с этим выдать результат. Например, в запросе «13 процентов» система обрабатывает «13» как номер, но по окончании поиска «сообщит»: «13» рассматривалось как «номер». Искать как «слово». При необходимости можно запустить новый поиск.
6. Примерная дата – если известна о документе только примерная дата принятия, например год и месяц, или год (период), следует воспользоваться атрибутным поиском. Интеллектуальный поиск по условиям типа «1995 год» не даст положительного результата.
7. Раздел документа – если требуется найти «пункт 2 статьи 9 части 1 Налогового кодекса», то не следует вводить указанную последовательность в строку интеллектуального поиска. Система исключает из поиска слова: «пункт», «часть», «глава», «статья», «раздел», «приложение» в любых их грамматических формах, так как эти слова в большом количестве содержатся во многих документах и являются шумовыми. Для доступа к необходимому разделу большого документа воспользуйтесь ярлыком Оглавление данного документа.
Алгоритм интеллектуального поиска включает:
подбор списка документов по искомой проблеме;
представление документов в этом списке по степени соответствия запросу (чем лучше документ соответствует запросу, тем выше в списке он будет находиться).
При решении задач алгоритм интеллектуального поиска учитывает:
частоту вхождения каждого слова запроса в документ, особенно в названии документа;
количество слов в документе;
количество документов в системе;
частоту вхождений слова относительно других слов;
расстояние между словами запроса в тексте документа;
совпадение атрибутов анализируемого документа с введенными пользователем атрибутами (номер и дата) и другие параметры.
Атрибутный поиск. Нахождение документов по известным атрибутам осуществляется с помощью атрибутного поиска нажатием по кнопке . Результаты поиска сортируются по дате принятия.
Атрибутный поиск позволяет искать документы по общим или специализированным атрибутам. Общие атрибуты – это атрибуты, присущие большинству видов информации: поиск по тексту, наименование, вид документа/материала, принявший орган/ источник, номер, дата принятия, действие / актуальность. Специализированные атрибуты – это атрибуты, свойственные только данному виду информации. Для каждого вида они свои. Например, для вида информации Судебная практика таковым атрибутом является атрибут Нижестоящий суд. При нахождении на ярлыке определенного вида информации будет доступен поиск только по документам и материалам данного вида информации.
Окно атрибутного поиска делится на две части по горизонтали (рис. 3.49): карточку запроса с полями для ввода атрибутов и карточку статистики, которая содержит перечень видов информации, к которым относятся документы и материалы, представленные в системе, и сведения о количестве документов по каждому виду. Отсюда осуществляется переход к результатам поиска.