Избранное
ЭБ Нефть
и Газ
Главная
Оглавление
Поиск +
Еще книги ...
Энциклопедия
Помощь
Для просмотра
необходимо:


Книга: Главная » Труды И.И. Основные направления совершенствования автоматизированной системы НТИ нефтяной промышленности
 
djvu / html
 

ко падение до 39% показателя точности ставит под сомнение работоспособность системы при обслуживании абонентов по запросам, требующим минимально возможной степени поискового шума.
Общеизвестно, что наиболее действенным средством снижения уровня шума, возникающего из-за ложной координации содержащихся в поисковых образах ключевых слов, является введение средств фиксации синтагматических отношений, позволяющих учитывать при поиске позиционные и реляционные характеристики слов текста. Именно по такому пути было решено пойти и при создании описываемой системы автоматического индексирования. При этом каждой включаемой в ПОД лексической единице ИПЯ ставятся в соответствие указатели связи, фиксирующие номера предложений, сегментов и связок, в которые входит отождествленное с этой единицей слово текста. Анализ же этих указателей должен осуществляться по различным критериям для каждого поискового предписания в зависимости от конкретного лексического наполнения ПП и требований полноты и точности по данному запросу. Например, если предписание состоит из высокоспецифичных и низкочастотных слов, то нет необходимости требовать при поиске дополнительного анализа синтагматики ПОД. Если же запрос описывается набором общих терминов, отсутствие такого анализа как раз и приводит к появлению значительного поискового шума из-за ложной координации терминов.
Для определения стратегии поиска по каждому предписанию в них решено ввести специальные указатели, называемые в дальнейшем указателями контекста (УК). Причем в процессе разработки средств реализации разных стратегий поиска по различным критериям и системы УК учитывалось требование минимизации объема коррекции поисковых предписаний при переходе от поиска по ручным к поиску по автоматическим ПОД. Это требование и не позволило использовать в ПП обычные способы записи подобных указателей, принятые в других системах. Так, например, если поисковое предписание для поиска по ручным ПОД выражено конструкцией
(AVB) /\ (С \/Дх/Е),
а документ должен считаться релевантным лишь в тех случаях, когда термины А и С или А и Д находятся в одном предложении текста документа, а А и Е - в одном сегменте, или В - в одной связке с любым из терминов С, Д или Е, то традиционные способы записи УК, предусматривающие
40

 

1 10 20 30 40 41 42 43 44 45 46 47 48 49 50 60 70 80


Автоматизация производства в нефтяной и химической промышленности. Справочники, статьи