Операционные системы и программное обеспечение на платформе zSeries

       

Интеграция информации (IBM DB2 Information Integration)


Информационная интеграция - это набор технологий, которые позволяют использовать при решении прикладных задач данные различного типа (структурированные, неструктурированные) вне зависимости от места их размещения, полученные с помощью запросов на языке SQL или XML, а также с помощью Web-служб.

Интеграция обеспечивает:

  • объединение данных, полученных от разных источников (базы данных, Web-службы, хранилища);
  • создание моделей данных и интерфейсов;
  • доступ к разнообразным типам данных;
  • преобразование данных в требуемый формат.

Обычно рассматривают три функции интеграции: объединение данных, перемещение данных (репликация), преобразование данных (конвертация) (см. рис. 6.17).


Рис. 6.17.  Основные функции интеграции

Объединение позволяет предоставить доступ к данным от большого числа различных источников и платформ так, как если бы эти данные принадлежали единому ресурсу.

Возможности систем объединения:

  • данные можно хранить в исходных системах, не перемещая их в единую систему хранения;
  • можно использовать единый API для поиска и преобразования данных;
  • объединенная система скрывает любые различия в местоположении, диалектах сети, топологии данных;
  • можно получить доступ к хранилищам данных либо непосредственно, либо путем запроса, который возвращает данные динамически, что позволяет осуществлять управление данными с помощью единого диалекта SQL.

Объединение имеет смысл использовать, когда технические требования проекта информационной системы предполагают многократный поиск, вставку, обновление и удаление данных из разнородных источников.

Репликация - это процесс дублирования и размещения в результирующем ресурсе данных из различных источников. В зависимости от требований архитектуры информационной системы предприятия можно использовать различные схемы дублирования и размещения данных.

Репликация предоставляет следующие возможности:

  • автоматизированное и надежное перемещение изменений данных из одной системы в другую (позволяет автоматически вносить изменения при появлении их в источнике);
  • создание идентичных копий в двух системах (например, поддержка второй копии данных для их восстановления);
  • копирование подмножества данных из одной системы во многие (например, с целью синхронизации информации в разных системах).
    Такой вид репликации называется распределением данных;
  • копирование выбранных данных из многих источников в один (например, чтобы объединить информацию в информационное хранилище). Такой вид репликации называется консолидацией данных.


Репликация поддерживает целостность данных.

Конвертация данных - формирование документов на основе оптимизированных SQL-запросов к различным источникам данных. Преобразование данных может осуществляться как в момент их перемещения, так и при создании представлений.

Оптимизация SQL-запросов избавляет программиста от необходимости рассматривать особенности фактических источников данных при написании прикладной программы. Оптимизация позволяет приспособиться к факторам, которые не могли быть известны при написании программы, а также при ее изменении в связи с изменениями среды окружения.

При использовании информационной интеграции можно работать с данными, которые находятся как внутри информационной системы предприятия, так и за ее пределами.

Семейство IBM DB2 Information Integration состоит из двух продуктов: IBM DB2 Information Integration и IBM DB2 Information Integration for Content. Первый продукт (IBM DB2 Information Integration) предназначен для применения в тех случаях, когда основными источниками информации для работы приложений, использующих SQL, являются реляционные базы данных, дополненные нереляционными источниками (документы XML, Web-службы и др.).

Продукт IBM DB2 Information Integration for Content предназначен для случаев, когда приложениям необходима интеграция гетерогенной информации. Этот продукт очень подойдет тем разработчикам решений по управлению информационным наполнением, которые знакомы с программными интерфейсами управления контентом и объектно-ориентированным программированием.

Информация по функциям и поддерживаемым форматам данных семейства IBM DB2 Information Integration представлена в таблице 6.4.

Таблица 6.4. Основные функции, особенности и форматы данных семейства IBM DB2 Information Integrator№ п/пСтратегия интеграцииОсновные функцииПоддерживаемые форматы данных
1.Объединение данных
  1. Возможность доступа к гетерогенным данным, хранящимся в исходных системах, без их перемещения в единую систему хранения.
  2. Использование языка SQL и процедур оптимизации запросов.
  3. Единый интерфейс для поиска и преобразования данных.
Реляционные источники: DB2, Informix Dynamic Server, Informix Extended Parallel Server, Microsoft SQL Server, ORACLE, Sysbase SQL Server, Sysbase Adaptive Server Enterprise, Teradata; источники, доступные с помощью ODBC. Нереляционные источники: Excel, Documentum Enterprise Content; источники данных, доступные с помощью IBM Lotus Extended Search, IBM DB2 Information Integrator for Content
2.Репликация данных
  1. Автоматический перенос изменений данных из одной системы в другую.
  2. Поддержка идентичных копий.
  3. Копирование подмножества данных из одной системы во многие (распределение данных).
  4. Копирование подмножеств данных из многих источников в один (консолидация данных).
  5. Автоматизация перемещения данных (по графику, в зависимости от событий и т.д.).
DB2, Informix Dynamic Server, Microsoft SQL Server, ORACLE, Sysbase SQL Server, Sysbase Adaptive Server Enterprise, Informix Extended Parallel Server, Teradata; источники, доступные с помощью ODBC
3.Конвертация данных
  1. Создание и публикация XML-документов с использованием разнообразных источников данных.
  2. Использование языка SQL с процедурами оптимизации доступа к данным.
  3. Возможность использования Web-сервисов для конвертации данных.
Реляционные источники (те же, что в п.1). Нереляционные источники: Очереди сообщений IBM WebSphere MQ; Web-службы; Excel; XML-документы; Documentum Enterprise Content Management System; источники данных доступные с помощью IBM Lotus Extended Search; каталоги LDAP; источники IBM DB2 Information Integrator for Content (IBM DB2 Content Manager и др.)


<

Содержание раздела