Избранное
ЭБ Нефть
и Газ
Главная
Оглавление
Поиск +
Еще книги ...
Энциклопедия
Помощь
Для просмотра
необходимо:


Книга: Главная » Труды И.И. Основные направления совершенствования автоматизированной системы НТИ нефтяной промышленности
 
djvu / html
 

отождествления слов в случаях неполного совпадения производных основ.
Благодаря использованию перечисленных методов достигается высокая (близкая к стопроцентной) точность морфологического анализа и отождествления слов текста с лексическими единицами КПЯ.
Структурно-семантический анализ служит, как было указано выше, для формирования контекстов разного уровня. Самым крупным, тривиальным, контекстом является весь текст реферата. Вторым, формально устанавливаемым, типом контекста является предложение исходного текста. Еще два типа контекстов («сегменты» и «смысловые блоки») выделяются путем анализа функциональных и позиционных характеристик элементов текста. Сегменты выделяются в ходе членения предложений, составляющих текст реферата. Одновременно производится разделение этих сегментов на более дробные, относительно замкнутые по смыслу, компоненты (приблизительно соответствующие минимальным комплексам единиц ИПЯ, формируемым в поисковых образах документов в соответствии с «грамматикой» ИПЯ). Эти компоненты («минимальные» сегменты) служат как бы «заготовками» для формирования контекстов следующего из рассматриваемых типов контекстов - смысловых блоков.
Сегментация предложений производится на основе специально разработанных структурно-семантических, грамматических, формальных и других специальных критериев. Одновременно с сегментацией производится предварительное опреде -ление информативности получаемых сегментов и их ролей как компонентов основы смыслового содержания рефератов. В результате этой процедуры реферат представляется в виде последовательности текстовых сегментов, причем некоторые из этих сегментов снабжены признаками потенциальной информативности и указателями роли.
Выделенные на стадии сегментации предложений минимальные сегменты объединяются в смысловые блоки (транстекстовые комплексы). Для этого оценивается степень смыслового сходства этих сегментов, и сегменты, признанные достаточно близкими по смыслу, объединяются в единый смысловой блок.
В системе АИ предусмотрена возможность оценки информационной значимости получаемых смысловых блоков. Эта оценка проводится в два приема.
Сначала осуществляется оценка информационной значимости отдельных «понятий» (соответствующих дескрипторам ИПЯ). Эта оценка проводится для групп взаимосвязанных
30

 

1 10 20 30 31 32 33 34 35 36 37 38 39 40 50 60 70 80


Автоматизация производства в нефтяной и химической промышленности. Справочники, статьи