Виды действий (манипуляций) над данными в реляционной модели представляют собой множество операций, получивших в совокупности название реляционной алгебры.

Каждая операция реляционной алгебры использует одно или два отношения в качестве операндов и создает в результате некоторое новое отношение. Э.Ф. Коддом были определены восемь таких операций, объединенных в две группы по четыре операции в каждой.

Пер вая группа - традиционныетеоретико-множествен-ные операции (рис. 5.7).

Рис. 5.7. Диаграммы традиционных теоретико-множественных операций: а - объединение; б - пересечение; в - разность; г - декартово произведение В каждой из этих операций используются два операнда (отношения). Для всех операций, кроме декартова произведения, эти два операнда должны быть совместимы по объединению, т.е. они должны быть одной степени и их i-e атрибуты (I = 1,п) должны быть связаны с одним и тем же доменом.

Операция “объединение”. Объединением двух отношений А и В называется множество всех кортежей принадлежащих либо отношению А, либо В, либо им обоим. Символически эта операция показана на рис. 5.7, а. Математически операция объединения записывается так:

Вторая группа - специальные реляционные операции (рис. 5.8).

Операция "селекция". Пусть Ле1а представляет собой любой достижимый оператор сравнения скаляров, например =, ^, >, >, < и т.д. ТЪе!а-селекцией отношения А по атрибутам х и у называется множество всех кортежей t из А, таких, что истин предикат t.x theta t.y. Атрибуты х и _щолжны быть определены на одном и том же домене, и для этого домена оператор theta должен иметь смысл. Вместо атрибута у может быть задана константа (например, выбрать из платежной ведомости записи о сотрудниках, имеющих зарплату 500 руб.). Таким образом, оператор theta-ce-лекции позволит получать "горизонтальные" подмножества заданного отношения, т.е. подмножества таких кортежей заданного отношения, для которых выполняется поставленное условие (см. рис. 5.8, а).

Операция "проекция ". Она позволяет получить "вертикальное" подмножество заданного отношения, т.е. такое подмножество, которое получается выбором специфицированных (определенных) атрибутов с последующим исключением, если это необходимо, избыточных дубликатов кортежей, состоящих из значений выбранных атрибутов (см. рис. 5.8, б).

Рис. 5.8. Диаграммы специальных реляционных операций: а - селекция; б - проекция; в - соединение; г - деление Операция "соединение"(рис. 5.8, в). Пусть theta имеет тот же смысл, что и в операции селекции. Тогда /Лей-соединением отношения А по атрибуту х с отношением В по атрибуту у называется множество всех кортежей /, таких, что / является конкатенацией какого-либо кортежа а, принадлежащего А, и какого-либо кортежа в, принадлежащего В, и предикат а.х theta Ъ.у. принимает значение "истина". При этом атрибуты А.х и В.у должны быть определены на одном и том же домене, а оператор theta должен иметь смысл для этого домена. Если оператор - theta-равенство, то соединение называется эквисоединением (лат. aequus - равный). Из этого определения следует, что результат эквисоединения должен включать два идентичных атрибута. Если один из этих атрибутов исключается, что соединение можно осуществить с помощью проекции, результат называется естественным соединением. Под неуточненным термином "соединение" понимают естественное соединение.

Операция "соединение" похожа на декартово произведение. Отличие состоит в том, что декартово произведение предполагает сцепление каждого кортежа из отношения А с каждым кортежем из В, а в операции "соединение" кортеж из отношения А сцепляется только с теми кортежами из В, для которых выполнено условие а.х = Ь.у.

Операция "деление". В простейшей форме операция деления делит отношение степени два (делимое) на отношение степени один (делитель) и создает (продуцирует) результирующее отношение степени один (частное). Пусть делимое А имеет атрибуты х и у, а делитель В - атрибут у (см. рис. 5.8, г). Атрибуты Л.^ и В.у должны быть определены на одном домене. Результатом деления А на В является отношение С с единственным атрибутом х, таким, что каждое значение х этого атрибута С.х появляется как значение А.х, а пара значений (х,у) входит в А для всех значений у, входящих в В. Другими словами, кортеж включается в результирующее отношение С только в том случае, если его декартово произведение с отношением В содержит отношение А.

Из восьми рассмотренных нами реляционных операций пять являются базовыми. Это селекция, проекция, декартово произведение, объединение и разность. Остальные три операции могут быть определены через базовые. Например, естественное соединение может быть выражено как проекция селекции декартова произведения.

Назначение реляционной операции присваивания состоит в том, чтобы сохранить значение какого-либо алгебраического выражения.

Операции реляционной модели данных дают возможность произвольно манипулировать отношениями, позволяя обновлять БД, а также выбирать подмножества хранимых данных и представлять их в нужном виде. Таким образом, особенностями, определившими преимущества реляционной модели, являются:

• множество объектов реляционной модели БД однородно - структура БД определяется только в терминах отношений;

• основная единица обработки в операциях реляционной модели не запись (как в сетевых и иерархических моделях), а множество записей - отношение.

НАУЧНО-МЕТОДИЧЕСКИЙ АППАРАТ ОПИСАНИЯ ЭКОНОМИЧЕСКОЙ ИНФОРМАЦИИ В РЕЛЯЦИОННЫХ БД

Функционирование материальных систем может быть описано в форме сообщений. Сообщение о событиях, происходящих в материальной системе, представляет собой информационное отображение материальных процессов.

Сообщение может быть выражено на естественном языке, однако часто применяют форматированные сообщения, когда в них приводятся названия опорных свойств (параметров) происходящего события и их значения.

Форматированные сообщения - наиболее массовый вид сообщений, хранимых и обрабатываемых в ЭИС.

Набор сообщений, истинных для соответствующей материальной системы, непротиворечивых по отношению друг к другу и к концептуальной схеме, является базой данных.

Сообщения в БД обычно представляются в форматированном виде и хранятся в виде единиц информации. Единицей информации называется набор символов, которому придается определенный смысл.

Минимально необходимы две единицы информации - атрибут и составная единица информации (СЕИ).

Атрибутом называется информационное отображение отдельного свойства некоторого объекта, процесса или явления. Любое сообщение, как правило, записывается в форматированном виде как указание свойств (параметров) предметов, о которых мы говорим. Поэтому информационное отображение любого явления представляет собой набор соответствующим образом подобранных атрибутов.

Составная единица информации - это набор, состоящий из атрибутов и, возможно, других СЕИ. Простейшими СЕИ являются таблицы. СЕИ позволяет создавать произвольные комбинации из атрибутов.

Разработка баз данных, как известно, начинается с построения ее концептуальной схемы (модели).

Концептуальная схема (от слова concept - понятие) представляет собой описание структуры всех единиц информации, хранящихся в БД. Под структурой понимается вхождение одних единиц информации в состав других единиц информации. Следует отметить, что БД в целом также является слиницей информации. Если рассматривать единицы информации как информационные объекты, то можно говорить об их свойствах. В то же время единицы информации - это нефизические объекты, так как они не занимают место в пространстве.

Простейшими характеристиками СЕИ являются имя, структура и значение. Имя СЕИ - это ее условное обозначение в процессах обработки информации. Структура СЕИ показывает взаимосвязь входящих в нее единиц информации.

Существует сравнительно много способов описания структуры СЕИ. Для описания, не зависимого от конкретных языков программирования и СУБД, достаточно указывать после имени СЕИ список имен входящих в нее атрибутов и СЕИ. Этот список указывается в круглых скобках, а имена внутри скобок перечислять через запятую. Имя СЕИ может сопровождаться размерностью, т.е. указанием на количество одинаковых по. структуре значений этой СЕИ. Размерность, если она не равна 1, указывается в скобках после имени СЕИ.

Значением СЕИ называются набор значений непосредственно входящих в нее атрибутов и набор собраний непосредственно входящих в нее СЕИ. Одно значение СЕИ при хранении ее в памяти ЭВМ часто называется записью. Все языки программирования содержат средства описания структуры СЕИ. Над СЕИ производятся нижеследующие операции.

Присвоение единице информации нового имени называется переименованием, объявление синонима - это установление второго, третьего и т.д. равноценного имени для единицы информации.

Над значением атрибута производится всего одна операция - перекодирование, т.е. существующий код заменяется на новый для всех значений.

Выборка - операция выделения подмножества значений СЕИ, которые удовлетворяют заранее поставленным условиям выборки.

Корректировка означает выполнение одной из операций:

• добавление нового значения СЕИ;

• исключение существующего значения СЕИ;

• замена некоторого значения СЕИ на новое значение.

Декомпозиция - операция преобразования исходной СЕИ в несколько СЕИ с различными структурами. В результате декомпозиции одновременно производится преобразование множества значений.

Композиция - операция преобразования нескольких СЕИ с различными структурами в одну СЕИ. Декомпозиция и композиция являются взаимообратными операциями.

Нормализация - это операция перехода от СЕИ с произвольной структурой к СЕИ с двухуровневой структурой. Одновременно происходит перекомпоновка значений СЕИ.

Свертка - операция преобразования СЕИ с двухуровневой структурой в СЕИ с произвольной многоуровневой структурой.

При анализе экономических документов ставится задача разделения документа на элементарные осмысленные фрагменты, называемые показателями. Это позволяет установить смысловые взаимосвязи между различными документами, обеспечить одинаковое понимание всеми пользователями применяемых единиц информации и их единое обозначение, использовать полученные результаты для определения структуры базы данных.

Показатель представляет собой полное описание количественного параметра, характеризующего некоторый объект или процесс. Соответствующее описание произвольного свойства (необязательно количественного) называется атомарным фактом.

Чтобы точнее характеризовать атрибуты, образующие показатель, необходимо отметить существенные различия свойств, которые отображаются атрибутами. Материальные процессы, как известно, имеют качественную и количественную характери-

стики. Соответственно и атрибуты должны разделяться на два класса, которые называются "атрибуты-признаки" и "атрибуты-основания". Атрибут-признак представляет собой информационное отображение качественного свойства некоторого объекта, предмета, процесса, а атрибут-основание является отображением их количественного свойства. В состав показателя должны входить один атрибут-основание и несколько атрибутов-признаков, однозначно характеризующих условия существования основания.

Как единица информации, показатель является разновидностью СЕИ. Схематично структура показателя П представляется выражением где Р{2,…,Р^- атрибуты-признаки;

Q - атрибут-основание.

Если представить себе показатель с двумя, например, атрибутами-основаниями, то его можно разделить на две части, в каждой из которых будут один атрибут-основание и характеризующие его признаки. Полученные части содержат меньше атрибутов и поэтому соответствуют определению показателя.

Таким образом, в показателях отображаются количественные свойства объектов и процессов. Вместе с тем существуют документы, не содержащие атрибутов-оснований, например анкеты кадрового учета, сведения о структуре подразделений предприятия и т. д. Следовательно, не вся экономическая информация может быть представлена в форме показателей.

Минимальный набор атрибутов показателя должен содержать:

• атрибуты, отображающие идентификаторы объектов;

• атрибуты, отображающие признак времени;

• атрибут, отображающий некоторое количественное свойство объекта или взаимодействия.

При установлении признаков и оснований в конкретных документах необходимо учитывать следующие закономерности:

1) если значение атрибута является исходным данным или результатом арифметической операции - это основание;

2) если значение текстовое - это признак;

3) если атрибут обозначает предмет - это признак;

4) если атрибут в некотором показателе является признаком (основанием), он будет играть эту роль и в других показателях;

5) если показатели описывают сходные процессы, их признанные части совпадают;

6) если основание показателя вычисляется по значениям других оснований, то набор признаков такого показателя есть объединение признаков, связанных с этими основаниями.

Критерием качества создания базы данных может служить минимальная избыточность хранимой информации. Обычно минимальная избыточность выражается принципом: каждое сообщение хранится в БД один раз. Соблюдение этого принципа дает ряд преимуществ:

• сокращается объем памяти ЭВМ, требуемой для хранения базы данных;

• сокращается трудоемкость ввода данных в ЭВМ и упрощается контроль за достоверностью вводимой информации;

• упрощаются алгоритмы корректировки данных, так как корректировка сообщения может быть проведена за одно обращение к базе данных.

Использование аппарата экономических показателей позволяет создать структуру БД с минимальной избыточностью, если сначала расчленить все сведения, циркулирующие в ЭИС, на показатели, а потом объединить атрибуты родственных показателей по принципу: в один файл включается группа экономических показателей с одинаковым составом атрибутов-признаков.

Одна из причин выделения показателей в особую разновидность единиц информации заключается в том, что показатель является минимальной группой атрибутов, сохраняющей информативность (осмысленность) и поэтому достаточной для образования самостоятельного документа.

Для показателей, описывающих экономические процессы (взаимодействие объектов), можно классифицировать их составные части:

• формальную характеристику, указывающую на алгоритм получения атрибута-основания в показателе;

• перечень объектов, участвующих в процессе;

• название процесса;

• единицу измерения атрибута-основания;

• определение момента времени или периода времени;

• название функции управления;

• название экономическом системы, в которой происходит описываемый процесс.

Указание всех названных частей необходимо для точного обозначения показателя. Атрибуты-признаки показателя должны отображать в обязательном порядке лишь перечень объектов, участвующих в процессе, и период (момент) времени. Очень часто в показатель включается признак, отмечающий единицу измерения, а остальные характеристики показателя обычно указываются в его названии, а не в хранимых значениях.

Показатель удобно применять как обобщающую единицу измерения объема данных.

Существует аналогия между экономическими показателями и переменными с индексами, которые рассматриваются, например, в линейной алгебре. Так, показатель П (Код материала, Цена) соответствует величине С(/), где С - цена материала с г-м Кодом материала. Переменная С соответствует атрибуту-основанию Цена, индекс I - атрибуту-признаку Код материала. В общем случае переменная всегда отображает атрибут-основание, а индексы этой переменной - значения соответствующих атрибутов-признаков показателя.

Естественное отличие состоит в том, что индекс /' переменной С обычно изменяется от 1 до некоторого фиксированного значения, а номенклатурные номера материалов (и вообще любые значения атрибутов-признаков) могут кодироваться не только порядковыми кодами, но и другими способами.

Закономерности, установленные в математике для арифметических операций над переменными с индексами, естественно, трансформируются в правила арифметических действий над показателями.

Целостность реляционных данных | Информационные системы и технологии в зкономике | Объектная модель баз данных