Abstract: В статье представлено описание предполагаемых подходов к реализации подсистемы
обработки информации на Интернет-портале. Основные проблемы связаны с экспоненциальным
ростом числа документов, отсутствием семантического индексирования и неструктурированным
характером информации. При реализации предлагаемого подхода пользователь получает
эффективные интеллектуальные средства поиска электронных документов на основе
семантической индексации, автоматической классификации и каталогизации документов с
построением семантических связей между ними и автоматического реферирования документов с
использованием знаний. Эффективность работы с электронными документами предлагается
значительно увеличить за счет их интеллектуального анализа, для которого применяются агентный
и онтологический подходы. В соответствии с предлагаемым подходом онтология используется для
описания семантики данных документа и его структуры. В процессе анализа документа онтология
является центральным понятием – благодаря использованию онтологий из документа можно
получить требуемые данные: известно, где искать данные и как они могут быть интерпретированы.
Репозитарий онтологий содержит три уровня онтологий: на первом уровне расположены онтологии,
описывающие объекты, используемые в конкретной системе и учитывающие ее особенности; на
втором в терминах объектов первого уровня описываются объекты, инвариантные к предметной
области; объекты третьего уровня описывают наиболее общие понятия и аксиомы, с помощью
которых описываются объекты нижележащих уровней. Третий и второй уровни можно разделить на
две составляющие: описание структур и описание самих документов.
Keywords: онтология, агент, мультиагентные системы, интеллектуальный поиск, семантическое
индексирование, анализ документов, адаптируемые информационные системы, CASE-технология.
ACM Classification Keywords: H.2 Database Management: H.2.3 Languages – Report writers;
H.3.3 Information Search and Retrieval – Query formulation.
Link:
СИСТЕМА ИНТЕЛЛЕКТУАЛЬНОГО ПОИСКА, КЛАССИФИКАЦИИ
И РЕФЕРИРОВАНИЯ ДОКУМЕНТОВ ДЛЯ ИНТЕРНЕТ-ПОРТАЛА
Вячеслав Ланин
http://foibg.com/ibs_isc/ibs-11/ibs-11-p22.pdf