Подходы к поиску информации

We use cookies. Read the Privacy and Cookie Policy

Подходы к поиску информации

Обозначим два подхода к поиску информации

1. Использование списков специальных дескрипторов (ключевых слов, систематических индексов), заранее присвоенных вручную каждому элементу информации (справке об организации, книге, газетной статье) в соответствии с некоторыми правилами. Эти дескрипторы могут встречаться или не встречаться в тексте документа. Они могут иметь обобщающий или аналитический характер, как, например, библиотечные предметные рубрики или систематические индексы УДК и ББК. Этот способ применяется в обычных записных книжках, телефонных и иных справочниках, указателях, картотеках, библиотечных каталогах, реляционных базах данных и т. п. Дескрипторы могут выстраиваться в линейный список (алфавит фамилий в каталоге, хронология публикаций в газете, адреса строений вдоль улицы) или образовывать древовидную структуру. Например, дерево предметных рубрик в предметном указателе или библиотечном каталоге, дерево рубрик в систематическом каталоге, выстроенное вручную дерево ссылок на тематические сайты в интернет-каталогах.

2. Контекстный поиск, т. е. поиск нужной информации путем сплошного просмотра массива документов. При этом, разумеется, весь массив не «пролистывают» заново при каждом обращении к нему. Поисковая машина (локальная или в Интернете) заранее просматривает его и строит по особым правилам список встречающихся в нем слов. Этот список периодически обновляется и используется для поиска при запросе. Такой список является формально правильным, но не может нести элемента обобщения или анализа информации. Этот способ применяется поисковыми машинами в Интернете и локальными «искалками».

Кроме того, широко применяется комбинированный способ, когда каждому документу из массива вручную, в соответствии с правилами, присваивается некоторый набор дескрипторов, характеризующих содержание документа, раскрывающих его смысл, назначение и т. д. Эти дескрипторы при сплошном просмотре массива документов также включаются в список встретившихся слов. Данный метод нередко используют для организации работы поисковых машин в Интернете и в полнотекстовых справочных правовых системах, таких как «Консультант Плюс» и др.

Перечисленные способы отличаются еще по одному параметру: поиск только с помощью дескрипторов, как правило, очень точно выделяет нужные документы, хотя некоторые из них могут не попасть в выборку из-за недостатков систематизации или предметизации. Правильно сформулированный контекстный поиск даст все нужные документы – но, к сожалению, и большое количество ненужных (велик «информационный шум»).

Для изменения результатов поиска (расширения или сужения) могут применяться специальные операторы:

• замены символа: (одного) или * (нескольких);

• усечения слова (слева, справа);

• больше, меньше, равно;

• операторы буквального соответствия;

• операторы диапазона значений;

• логические операторы: И (и то и это), ИЛИ (или то, или это, или оба вместе), НЕ, исключительное ИЛИ (или только то – или только это);

• операторы близости расположения и порядка следования слов.

Может задаваться старшинство операторов (как в алгебраических выражениях, с помощью скобок).

Развитые системы поиска и базы данных позволяют сохранять результаты поисков и не только производить логические операции над выражениями, но и комбинировать с помощью логических операторов результаты предыдущих поисков, уточняя и дополняя запрос сколь угодно долго, вплоть до получения удовлетворительного результата.

Данный текст является ознакомительным фрагментом.