Menu
Home
Contact us
Stats
Categories
Calendar
Toggle Wiki
Wiki Home
Last Changes
Rankings
List pages
Orphan pages
Sandbox
Print
Toggle Image Galleries
Galleries
Rankings
Toggle Articles
Articles home
List articles
Rankings
Toggle Blogs
List blogs
Rankings
Toggle Forums
List forums
Rankings
Toggle File Galleries
List galleries
Rankings
Toggle Maps
Mapfiles
Toggle Surveys
List surveys
Stats
ITHEA Classification Structure > H. Information Systems  > H.3 INFORMATION STORAGE AND RETRIEVAL  > H.3.3 Information Search and Retrieval 
ЛОГИКО-ЛИНГВИСТИЧЕСКАЯ МОДЕЛЬ ИЗВЛЕЧЕНИЯ ФАКТОВ ИЗ СЛАБОСТРУКТУРИРОВАННОЙ ...
By: Нина Хайрова, Наталья Шаронова (4061 reads)
Rating: (1.00/10)

Аннотация: Одним из перспективных направлений информационного поиска является фактографический поиск и разработка фактографических баз данных. Существующие сегодня модели и алгоритмы фактографического поиска в своем большинстве направлены на излечение фактов из хорошо формализованной информации, в том числе из хорошо формализованной текстовой информации. В работе предлагается модель извлечения фактографической информации из динамически меняющихся слабоформализованных текстовых потоков, не ограниченных определенными предметными областями. Для извлечения некоторого факта используется шаблон «агент-предикат-значение», отображающий отношения, формально выражаемые семантическими падежами партиципантов предложения. В предлагаемой логико-лингвистической модели семантические роли именных групп определяются отношением четко выделенных множеств морфологических, синтаксических и семантически категорий, описываемым с помощью базового аппарата алгебры конечных предикатов. В работе рассмотрена реализация данной модели для извлечения фактографической информации о дате, месте рождения и роде деятельности персоналии из русскоязычных слабоформалзованных текстов. Экспериментальная проверка программной имплементации модели показала правильность выделения факта примерно в 94,3% случаев.

Ключевые слова: фактографический поиск, слабоформализованная текстовая информация, лингвистический процессор, алгебра конечных предикатов.

ACM Classification Keywords: H.3.3 .Information Search and Retrieval

Link:

ЛОГИКО-ЛИНГВИСТИЧЕСКАЯ МОДЕЛЬ ИЗВЛЕЧЕНИЯ ФАКТОВ ИЗ СЛАБОСТРУКТУРИРОВАННОЙ ТЕКСТОВОЙ ИНФОРМАЦИИ

Нина Хайрова, Наталья Шаронова

http://www.foibg.com/ijima/vol02/ijima02-02-p10.pdf

Print
H.3.3 Information Search and Retrieval
article: Facts extraction from the semi-structured text information · NEAREST NEIGHBOR SEARCH AND SOME APPLICATIONS · SOCIAL SEARCH ENGINE AND INTELLECTUAL DATABASE OF PEOPLE · INTELLECTUAL SEARCH ENGINE OF ADEQUATE INFORMATION IN INTERNET FOR CREATING ... · ИНФОРМАЦИОННАЯ ТЕХНОЛОГИЯ ПРИМЕНЕНИЯ СЕМАНТИЧЕСКИ ОРИЕНТИРОВАННЫХ МЕТОДОВ ... · SYSTEM OF INTELLIGENT SEARCH, CLASSIFICATION AND DOCUMENT SUMMARISATION FOR INTE · IMPLEMENTATION OF DICTIONARY LOOKUP AUTOMATA FOR UNL ANALYSIS AND GENERATION · THE SYSTEM OF MULTILINGUAL TEXT DATA PROCESSING ON THE BASE OF THE MODIFIED ... · LOGIC-LINGUISTIC MODEL OF FACT GENERATION FROM TEXT STREAMS OF CORPORATE... · ЛОГИКО-ЛИНГВИСТИЧЕСКАЯ МОДЕЛЬ ИЗВЛЕЧЕНИЯ ФАКТОВ ИЗ СЛАБОСТРУКТУРИРОВАННОЙ ... · Solution of the Problem of Formal Evaluation of Effectiveness of ... · МЕТОДЫ АВТОМАТИЗИРОВАННОГО ДИСКУРСИВНОГО � · BUILDING THE LIBRARY CATALOG SEARCH MODEL BASED ON THE FUZZY SIMILARITY ... · DATABASE SERVER USAGE IN THE SOCIAL NETWORKS ANALYSIS · REGIONS OF SUFFICIENCY FOR METRICAL DATA RETRIEVAL · DATA AND METADATA EXCHANGE REPOSITORY USING AGENTS IMPLEMENTATION · DISTANCE MATRIX APPROACH TO CONTENT IMAGE RETRIEVAL · DISTANCE MATRIX APPROACH TO CONTENT IMAGE RETRIEVAL · BRIDGING THE GAP BETWEEN HUMAN LANGUAGE AND COMPUTER-ORIENTED REPRESENTATIONS ·
Login
[ register | I forgot my password ]
World Clock
Powered by Tikiwiki Powered by PHP Powered by Smarty Powered by ADOdb Made with CSS Powered by RDF powered by The PHP Layers Menu System
RSS Wiki RSS Blogs rss Articles RSS Image Galleries RSS File Galleries RSS Forums RSS Maps rss Calendars
[ Execution time: 0.08 secs ]   [ Memory usage: 7.55MB ]   [ GZIP Disabled ]   [ Server load: 0.33 ]
Powered by Tikiwiki CMS/Groupware