С.В. Панюшев. И.В. Саенко

РАСШИРЕНИЕ РЕЛЯЦИОННОЙ МОДЕЛИ ДЛЯ представления ТЕМПОРАЛЬНЫХ данных в реляционных информационных системах

И.Б. Саенко

Военный университет связи

Abstract – The questions of temporal data imaging in relational information systems are considered. The construction of an appropriate model of data representation is examined. The description of structural and constrain parts are represented. The formulas defining main operations of manipulation part of a model are obtained.

Проблема отображения динамики предметной области в базах данных информационных систем является актуальной для многих научно-практических задач. Ключевым вопросом ее решения является построение модели представления темпоральных данных (МПТД). Традиционно усилия разработчиков в этой области связываются с созданием обособленных темпоральных моделей, для реализации которых требуются специализированные программно-инстру-ментальные системы. Вместе с тем, развитие технологии клиент/сервер и, в частности, появление в традиционных реляционных системах механизма хранимых на серверах баз данных процедур предопределяет возможность построения МПТД на основе традиционной реляционной модели и ее основных положений [1].

Решение данной проблемы в реляционных базах данных всегда требует создания и учета взаимной связности большого числа вспомогательных таблиц. Практическая реализация таких систем отличается чрезвычайной сложностью. Основная же идея предлагаемой модели заключается в переходе на концепцию объектно-реляционного подхода, который заключается в создании информационных объектов определенной структуры и разработке операций манипулирования ими [2,3]. Модели такого типа являются по своей сути расширением реляционной модели, операции манипулирования которых сводятся к стандартным операциям реляционной алгебры.

Целью настоящей работы является рассмотрение формальных основ МПТД, предназначенной для реализации в реляционных системах и обеспечивающей свойственную реляционной модели простоту манипулирования данными.

В соответствии с общепринятыми взглядами на моделирование данных, МПТД включает в себя структурную, манипуляционную и целостную части.

В структурной части описывается базовый (атомарный) элемент МПТД. Для его формирования воспользуемся методом аналогии с реляционной моделью [4].

Как известно, базовым элементом реляционной модели является реляционное отношение. Схема R реляционного отношения R представляется в виде R = {K, A}, где K - атрибуты, образующие первичный ключ, A - неключевые атрибуты отношения R. Положим, что A = A⁰ И A^{^}И A^~, где A⁰ - множество статических атрибутов, A^{^} и A^~ - множества динамических атрибутов, дискретно и непрерывно изменяющихся во времени, соответственно, для которых требуется хранение в базе данных истории этих изменений.

Дискретные динамические атрибуты будем представлять временными рядами их значений. Непрерывные динамические атрибуты будем представлять коэффициентами кусочно-непрерывных генерирующих функций. При этом не будем рассматривать механизмы такой аппроксимации, так как они достаточно хорошо разработаны [5].

Так как значения атрибутов в реляционных системахдолжны быть атомарными, для представления динамических атрибутов недостаточно одного реляционного отношения. Предложим базовый элемент МПТД (назовем его темпоральным отношением) в виде совокупности взаимосвязанных реляционных отношений - компонентов темпорального отношения

R^t = {R⁰ , R₁^{^},..., R_N^{^}_,R₁^~, ..., R_M^~}, (1)

где R⁰ - компонент, описывающий статические атрибуты и имеющий схему R⁰= {K⁰, A⁰}, причем K⁰=K; R₁^{^},..., R_N^{^} - компоненты, описывающие дискретно изменяющиеся динамические атрибуты A^{^}= {A₁^{^}, ..., A_N^{^}} и имеющие схемы R_i^{^}= {K_i^{^}, T, A_i^{^}}, в которых T есть атрибут времени, пара (K_i^{^}, Т) – первичный ключ, A_i^{^}- дискретный динамический атрибут, входящий в состав A^{^}; R₁^~, ..., R_M^~ - компоненты, описывающие непрерывно изменяющиеся динамические атрибуты A^~ = {A₁^~, ..., A_M^~} и имеющие схемы R_j^~= {K_j^~, T, F_j^~}, в которых (K_j^~, Т) – первичный ключ, F_j^~- множество параметров, характеризующих вид и коэффициенты генерирующей функции для непрерывного динамического атрибута A_j^~из A^~.

В общем случае в роли K_i^{^} и K_j^~может выступать подмножество K⁰ или A⁰. Это означает, что в темпоральном отношении R^t существуют частичные зависимости от ключа или транзитивные зависимости. Если же R^t нормализовано, тогда K_i^{^} и K_j^~совпадают с K.

Приведем пояснение выражения (1). Компонент R⁰ предназначен для представления статических атрибутов A⁰ некоторого объекта учета. Для однозначной идентификации объекта в R⁰ входит первичный ключ K⁰. Компоненты {R_i^{^}} и {R_j^~} предназначены для представления дискретных и непрерывных динамических атрибутов объекта. В случае, если объект не обладает динамическими атрибутами, {R_i^{^}} и {R_j^~} отсутствуют, а R^t фактически сводится к стандартному реляционному виду R . Пара (T, A_i^{^}) представляет собой временной ряд значений дискретного атрибута A_i^{^}. Пара (T, F_j) есть временной ряд параметров генерирующих функций, используемых для представления непрерывного атрибута A_j^~

Как легко заметить, в R^t атрибут времени T понимается как "время-момент". Это означает, что T определяет момент времени, в который изменяют свои значения динамические атрибуты. При этом считается, что в течение периода времени от Т = t_i , содержащемся в i-м кортеже, до Т = t_i+1, содержащемся в (i+1)-м кортеже, динамический атрибут имеет значение, определяемое i-м кортежем.

Недостатком представления "время-момент" является невозможность рассмотрения отдельных кортежей R_i^{^} и R_j^~ без их связи с другими кортежами. Этот недостаток устраняется при переходе к другому представлению - "время-период". Согласно представлению "время-период" темпоральное отношение также представляется в виде (1), однако компоненты R_i^{^} и R_j^~ имеют схемы R_i^{^}= {K_i, T_н, T_к, A_i^{^}} и R_j^~= {K_j, T_н, T_к, F_j^~}, где T_н и T_к - соответственно, начальный и конечный моменты некоторого периода времени. Будем обозначать темпоральное отношение R^tв представлении "время-период" как R^t.

Манипуляционную часть МПТД будем формировать также по аналогии с реляционной моделью. Как известно, основными операциями над реляционными отношениями являются проекция, селекция и соединение. Применение их различных комбинаций позволяет получать любые другие операции и обрабатывать запросы к базе данных произвольной сложности. Поэтому указанные операции обязательно входят в минимальный набор операций МПТД.

Кроме того, так как при манипулировании темпоральными отношениями возможен переход от представления "время-момент" к представлению "время-период" и обратно, в данный набор необходимо включить операцию преобразования представления темпорального отношения (назовем ее t-операцией).

Как специфическая операция модели, t-операция имеет алгоритмическое определение. Иными словами, она не может быть выведена через реляционные операции над компонентами темпоральных отношений.

Особенностью прямой t-операции R_i^t= t(R_i^t) является то, что в домен атрибута T_к результирующего представления R^t обязательно должно входить специфическое значение now, имеющее смысл "по настоящее время". Для обратной t-операции R_i^t=t^-1(R_i^t ) характерно, что в результирующем представлении R_i^t возможно появление "пустого" значения (null-значения) атрибута времени.

Проекцию определим, по аналогии с реляционной моделью, как "разрезание" темпорального отношения по вертикали с последующим "склеиванием" только тех столбцов, которые заданы в условии операции. Обозначим через А_pОА множество атрибутов, задаваемых в условии проекции. Заметим при этом, что ключевые атрибуты K⁰ или K_i^{^}должны входить в состав А_p, если в него входят соответствующие атрибуты A⁰или A^{^}. Иначе результирующее темпоральное отношение распадается на не связанные друг с другом компоненты.

Можно показать, что R^t₂= p (R^t₁| А_p), если выполняются соотношения

R₂⁰ = p (R₁⁰| А_pЗ A⁰),

"i, R_i2^{^} = p (R_i1^{^}| А_pЗ A_i1^{^}),

"j, R_j2^~ = p (R_j1^~| А_pЗ A_j1^~).

Селекцию определим как "разрезание" темпорального отношения по горизонтали с последующим "склеиванием" только тех строк, поля которых удовлетворяют логическому условию, указанному в операции. Условие поиска обозначим Р (А_s), где А_sОА- множество атрибутов, входящих в логическое условие.

Условие поиска Р (А_s) может быть простым и сложным. Под простым будем понимать условие, атрибуты А_sкоторого полностью входят в состав одного из компонентов исходного темпорального отношения, т.е. А_s = А_s^a; А_s^a Н А^a, где aО{0,^,~}. Иначе условие считается сложным.

Для простого условия поиска селекция выполняется в два этапа. Вначале осуществляется формирование компонента R₂^aпутем селекции по простому условию Р(А_s^a) компонента R₁^a. Затем из остальных компонентов выбираются те строки, значения ключевых атрибутов которых содержатся в R₂^a.

Можно показать, что R^t₂= s (R^t₁|P(А_s) ), если выполняются соотношения

R₂^a = s (R₁^a| P (А_s^a)), a О{0,^,~},

R₂^b = p_k(R₂^a ) Ґ R₁^b, b О {0,^,~}, b № a,

где p_kозначает проекцию по ключевому атрибуту, а Ґ - символ операции соединения двух реляционных отношений.

Следует отметить, что если в простое условие поиска входят динамические атрибуты, т.е. a = ^ или a = ~, то для отбора требуемых кортежей из R₁^aследует изменить его представление и применить к нему t-операцию. Иными словами, если a О{^,~}, то тогда

s (R₁^a| P (А_s^a)) =

= t ^-1 (s (t (R₁^a ) | P (А_s^a) ) .

Кроме того, если в простое условие поиска входят непрерывные динамические атрибуты, т.е. a = ~, то селекция компонента R₁^a не является обычной реляционной операцией, так как значения атрибутов А_s^~вычисляются через параметры генерирующих функций F_s^~, а при выборке требуемых кортежей следует учитывать допустимую погрешность аппроксимации.

Сложное условие поиска Р (А_s) всегда может быть представлено в виде конъюнкции простых условий Р(А_s)=Р (А_s1) Щ ... Щ Р (А_sN). В этом случае селекцию по сложному условию поиска можно реализовать как совокупность последовательно применяемых селекций с простыми условиями поиска, т.е.

s (R₁| P (А_s)) =

= s₁ ( ... ( s_N (R₁|P(А_sN)) ... |P(А_s1) ).

Соединение, по аналогии со стандартной реляционной алгеброй, является бинарной операцией, предназначенной для связывания двух темпоральных отношений, имеющих общие атрибуты.

В качестве возможных пар общих атрибутов будем рассматривать только те, которые имеют практическую значимость. Общим атрибутом одного из операндов должен быть первичный ключ. Во втором операнде общим атрибутом могут быть: первичный ключ, статический атрибут или динамический атрибут. Остальные варианты общих атрибутов в МПТД не рассматриваются.

Пусть имеется два темпоральных отношения R₁ и R₂ со схемами R₁= {R₁⁰, R₁^{^},R₁^~} и R₂ = {R₂⁰, R₂^{^}, R₂^~}, соответственно. Общими атрибутами являются: в R₁ - А₁^a, a О{0,^} (вариант с А₁⁰ будет охватывать также случай с общим первичным ключом К₁), в R₂ - первичный ключ К₂.

Тогда можно показать, что результирующее отношение R₃= R₁Ґ R₂ будет обладать следующими свойствами:

схема R₃представляет собой объединение схем операндов, т.е. R₃= {R₃₁⁰, R₃₂⁰, R₃₁^{^}, R₃₂^{^}, R₃₁^~, R₃₂^~ }, где R_3i⁰= R_i⁰, R_3i^{^}= R_i^{^}, R_3i^~= R_i^~ , i О{1; 2};

компоненты R_3i^a отношения R₃ вычисляются по соотношению

R_3i^a = s (R_i^a| K_i^a О K_i), a О{0,^,~},

где K₁= p_k1(R₁^a Ґ R₂⁰), K₂= p_k2(R₁^a Ґ R₂⁰), а p_k1и p_k2 есть операции проекции по ключевым атрибутам К₁и К₂, соответственно.

Таким образом, полученные выше формулы позволяют определить операции проекции, селекции и соединения манипуляционной части МПТД через известные операции реляционной алгебры, применяемые к компонентам темпорального отношения, представленного в виде (1).

Целостная часть МПДД включает в себя совокупность правил, которые обеспечивают поддержание базы темпоральных данныхи в непротиворечивом состоянии, а также предохраняют ее от потерь в ходе ведения. Основными правилами, поддерживающими целостность темпорального отношения в МПТД, являются (будем рассматривать представление "время-момент" R^t, так как именно в таком виде должны храниться данные в целях экономии памяти):

уникальность ключевых атрибутов темпорального отношения и его компонентов, т.е. уникальность К⁰ в R⁰, а также пар (K_i, T) в компонентах R_i^{^}и R_j^~;

упорядочность кортежей по атрибуту Т в компонентах R_i^{^}и R_j^~;

исключение в R_i^{^}кортежей с повторяющимися значениями атрибутов A_i^{^} и F_j^~;

ссылочная целостность между компонентами R⁰, R_i^{^}и R_j^~, означающая, что области значений K_iи K_jобязательно должны принадлежать доменам соответствующих К⁰ или А⁰.

Остальные ограничения налагаются на выполнение отдельных операций манипуляционной части, что было рассмотрено выше.

Литература

Иванов А.Ю., Саенко И.Б. Основы построения и проектирования реляционных баз данных. - СПб: ВАС, 1998 г. - 80с.

Аткинсон М. и др. Манифест систем объектно-ориентированных баз данных // Системы Управления Базами Данных, №4, 1995, с.142-155.

Чемберлин Д. Анатомия объектно-реляционных баз данных // Системы Управления Базами Данных, №1-2, 1998, с.3-24.

Мейер Д. Теория реляционных баз данных./ Пер. с англ. - М.: Мир, 1987 г., 608с.

Гуляев А.И. Временные ряды в динамических базах данных. - М.: Радио и связь, 1989 г. - 128с.

Site of Information Technologies
Designed by inftech@webservis.ru.