Abstract: Управление данными на современном предприятии характеризуется наличием большого количества разнородных источников данных, не связанных едиными механизмами управления, в том числе и слабоструктурированных или неструктурированных данных и т.п. При этом модель данных, лежащая в основе большинства систем, – реляционная – не является эффективной для решения многих задач. Раздельно существуют системы аналитической обработки и оперативного управления данными, системы управления документами и пр. Различные задачи требуют использования различных моделей представления данных. На этом фоне ставится задача интеграции гетерогенных данных, эффективное решение которой требует создания модели интеграции (или «интеграции» различных моделей данных), которую можно было бы рассматривать как основу для реализации системы, поддерживающей оперативное управление разнородными данными и их аналитическую обработку. Предлагается модель интеграции данных, в которой должны поддерживаться унифицированное представление разнородных источников данных, управление ограничениями целостности, управление выполнением операций манипулирования данными и запросов, согласование данных из разных источников, возможность расширения и настройки на новые источники данных. Существующие подходы к интеграции гетерогенных данных имеют ограничения, которые не позволяют в полной мере говорить об их универсальности. Предлагаемый подход к интеграции основан на рекурсивной декомпозиции источников данных, при которой каждый источник данных последовательно разбивается на атомарные элементы данных, причем на каждом уровне рекурсивной вложенности данные и их описания представляются единообразно. Такая модель позволяет осуществлять интеграцию различных источников данных на любом уровне посредством задания связей между произвольными элементами схемы, ограничений целостности и допустимых операций. Разработанная модель представления источников данных, которая позволяет осуществлять многоуровневую интеграцию гетерогенных источников данных в единое информационное пространство, обеспечивает поддержку ограничений целостности на любом уровне интеграции источников данных, а также поддержку структурных и ассоциативных связей между источниками данных на любом уровне интеграции. Обеспечивается возможность динамического изменения схемы данных, а также расширяемость системы за счет новых моделей данных.
Keywords: модель данных, гетерогенные системы, интеграция.
ACM Classification Keywords: H. Information Systems: H.2. DATABASE MANAGEMENT (E.5): H.2.1. Logical Design – Data models.
Link:
ИНТЕГРАЦИЯ ГЕТЕРОГЕННЫХ ИСТОЧНИКОВ ДАННЫХ НА ОСНОВЕ РЕКУРСИВНОЙ ДЕКОМПОЗИЦИИ
Алексей Кашников, Людмила Лядова
http://foibg.com/ijitk/ijitk-vol05/ijitk05-3-p08.pdf