112.00K
Категория: Базы данныхБазы данных

Базы данных. Теоретические основы

1.

БАЗЫ ДАННЫХ
Теоретические основы

2.

ОПРЕДЕЛЕНИЕ
БАЗА ДАННЫХ - это объективная
форма представления и организации
совокупности данных (например: статей,
расчетов), систематизированных таким
образом, чтобы эти данные могли быть
найдены и обработаны с помощью ЭВМ.
Определено законом РФ от 23 сентября 1992 года
N 3523-1 «О правовой охране программ для
электронных вычислительных машин и баз данных»
в редакции Федеральных законов от 24.12.2002
N 177-ФЗ, от 02.11.2004 N 127-ФЗ (статья 1).

3.

СУБД
СУБД входит в понятие баз данных как
элемент сложной иерархической системы.
Основные функции СУБД – это определение
данных (описание структуры данных), обработка
данных и управление данными.
Любая СУБД позволяет выполнять четыре
простейшие операции с данными:
• добавлять в таблицу одну или несколько записей;
• удалять из таблицы одну или несколько записей;
• обновлять значения нескольких полей в одной или
нескольких записях;
• находить одну или несколько записей, удовлетворяющих заданному условию.

4.

ВЫПОЛНЕНИЕ ОПЕРАЦИЙ
Для выполнения операций используется
механизм запросов. Результатом выполнения
запросов является либо отобранное по
определенным критериям множество записей,
либо изменения в таблицах.
Запросы к базе формируются на
специально созданном языке.

5.

ВАЖНЫЕ ФУНКЦИИ СУБД
Самая важная функция СУБД – это
управление данными.
Под управлением данными обычно понимают
защиту данных от несанкционированного
доступа, поддержку многопользовательского
режима работы с данными и обеспечение
целостности и согласованности данных.

6.

ЭТАПЫ СОЗДАНИЯ БАЗ ДАННЫХ
• проектирование базы данных (определение
объекта и выделение атрибутов объекта в
качестве полей базы данных);
• задание структуры базы данных (однотабличная
БД или состоящая из нескольких связанных
таблиц);
• ввод структуры данных с описанием типов
данных вводимых в поля таблицы;
• непосредственный ввод данных в БД;
• редактирование данных;
• манипулирование данными (сортировка,
выборка данных с использованием фильтрации
и/или запросов).

7.

КЛАССИФИКАЦИЯ БАЗ ДАННЫХ
По технологии обработки данных
Централизованная
База данных (БД) хранится целиком в памяти
одной вычислительной системы. Если система
входит в состав сети, то возможен доступ к этой
БД других систем.
Распределенная
БД состоит из нескольких, возможно
пересекающихся или дублирующих друг друга БД,
хранимых в памяти разных вычислительных
систем, объединенных в сеть.

8.

КЛАССИФИКАЦИЯ БАЗ ДАННЫХ
По способу доступа к данным
Локальный доступ
СУБД обрабатывает БД, которая хранится на
том же компьютере.
Удаленный (сетевой) доступ
Это обращение к БД, которая хранится на
одном из компьютеров, входящих в
компьютерную сеть. Удаленный доступ может
быть выполнен по принципу «файл – сервер»
или «клиент – сервер».

9.

Схема работы с БД в локальной сети с
выделенным файловым сервером

10.

Схема работы с БД в архитектуре
"Клиент-сервер"

11.

Схема работы с БД в трехуровневой
архитектуре
Трехуровневая архитектура функционирует в Интранет- и Интернетсетях. Клиентская часть ("тонкий клиент"), взаимодействующая с
пользователем, представляет собой HTML-страницу в Web-браузере
либо Windows-приложение, взаимодействующее с Web-сервисами. Вся
программная логика вынесена на сервер приложений, который
обеспечивает формирование запросов к базе данных, передаваемых на
выполнение серверу баз данных. Сервер приложений может быть Webсервером или специализированной программой (например, Oracle
Forms Server).

12.

Типы данных MS Access
Текстовый
Алфавитно-цифровые данные (до 255 символов)
Memo
Алфавитно-цифровые данные – приложения, абзацы,
текст (до 64 000 символов)
Числовой
Различные числовые данные (имеет несколько
форматов: целое, длинное целое, с плавающей точкой)
Дата \ Время
В одном из предлагаемых Access форматов
Денежный
Денежные суммы, хранящиеся с 8 знаками в десятичной
части. В целой части каждые три разряда разделяются
запятой.
Счетчик
Уникальное длинное целое, создаваемое Access для
каждой новой записи
Логические
Логич. данные, имеющие значения Истина или Ложь
Объект OLE
Картинки, диаграммы и другие объекты OLE из
приложений Windows
Гиперссылка
В полях этого типа хранятся гиперссылки, которые
представляют собой путь к файлу на жестком диске,
либо адрес в сетях Internet или Intranet.

13.

ПРИМЕРЫ СЕРВЕРОВ
1. файловый сервер, поддерживающий общее
хранилище файлов для всех рабочих станций;
2. интернет-сервер, обеспечивающий
предоставление информации в глобальной
сети Интернет;
3. почтовый сервер, обеспечивающий работу с
электронной почтой;
4. сервер баз данных - СУБД, которая принимает
запросы по локальной сети и возвращает
информацию, соответствующую запросу.

14.

РАСПРЕДЕЛЕННЫЕ БАЗЫ ДАННЫХ
Основная задача систем управления распределенными
базами данных состоит в обеспечении средства
интеграции локальных баз данных, располагающихся в
некоторых узлах вычислительной сети, с тем, чтобы
пользователь, работающий в любом узле сети, имел
доступ ко всем этим базам данных как к единой базе.
Возможны однородные и неоднородные
распределенные базы данных. В однородном случае
каждая локальная база данных управляется одной и
той же СУБД. В неоднородной системе локальные
базы данных могут относиться даже к разным
моделям данных. Сетевая интеграция неоднородных
баз данных - очень сложная проблема.

15.

Ранние подходы к организации баз данных
Иерархические базы данных
В этой модели имеется один главный объект и остальные подчиненные - объекты, находящиеся на разных уровнях
иерархии. Взаимосвязи объектов образуют иерархическое
дерево с одним корневым объектом. Основное правило:
никакой потомок не может существовать без своего
родителя.
Первая версия появилась в 1968 г.

16.

Ранние подходы к организации баз данных
Сетевые базы данных
В сетевой модели данных любой объект может быть
одновременно и главным, и подчиненным, и может
участвовать в образовании любого числа взаимосвязей
с другими объектами.
Первая версия появилась в 1971 г.

17.

Современные базы данных
Реляционные системы
Реляционная модель данных основывается на
математических принципах, вытекающих
непосредственно из теории множеств и логики
предикатов.
Статья "Реляционная модель данных для больших
разделяемых банков данных« доктора Е.Ф. Кодда,
опубликованная в 1970 г., является родоначальницей
современной теории реляционных БД.

18.

ПРАВИЛА РЕЛЯЦИОННОЙ МОДЕЛИ
Правила Кодда
1. Реляционная СУБД должна быть способна полностью
управлять базой данных через ее реляционные
возможности.
2. Информационное правило - вся информация в
реляционной БД (включая имена таблиц и столбцов)
должна определяться строго как значения в таблицах.
3. Гарантированный доступ - любое значение в
реляционной БД должно быть гарантированно доступно
для использования через комбинацию имени таблицы,
значения первичного ключа и имени столбца.
4. Поддержка пустых значений (null value) - СУБД должна
уметь работать с пустыми значениями (неизвестными или
неиспользованными значениями), в отличие от значений по
умолчанию и независимо для любых доменов.

19.

Продолжение
ПРАВИЛА РЕЛЯЦИОННОЙ МОДЕЛИ
Правила Кодда
5. Онлайновый реляционный каталог - описание БД и ее
содержания должны быть представлены на логическом
уровне как таблицы, к которым можно применять запросы,
используя язык базы данных.
6. Исчерпывающий язык управления данными - по крайней
мере, один из поддерживаемых языков должен иметь четко
определенный синтаксис и быть всеобъемлющим. Он
должен поддерживать описание структуры данных и
манипулирование ими, правила целостности, авторизацию
и транзакции.
7. Правило обновления представлений (views) - все
представления, теоретически обновляемые, могут быть
обновлены через систему.

20.

Продолжение
ПРАВИЛА РЕЛЯЦИОННОЙ МОДЕЛИ
Правила Кодда
8. Вставка, обновление и удаление - СУБД поддерживает
не только запрос на отбор данных, но и вставку,
обновление и удаление.
9. Физическая независимость данных - на программыприложения и специальные программы логически не
влияют изменения физических методов доступа к
данным и структур хранилищ данных.
10. Логическая независимость данных - на программыприложения и специальные программы логически не
влияют, в пределах разумного, изменения структур
таблиц.

21.

Продолжение
ПРАВИЛА РЕЛЯЦИОННОЙ МОДЕЛИ
Правила Кодда
11. Независимость целостности - язык БД должен быть
способен определять правила целостности. Они должны
сохраняться в онлайновом справочнике, и не должно
существовать способа их обойти.
12. Независимость распределения - на программыприложения и специальные программы логически не
влияет, первый раз используются данные или повторно.
13. Неподрывность - невозможность обойти правила
целостности, определенные через язык базы данных,
использованием языков низкого уровня.

22.

ОТНОШЕНИЕ
Формулируя принципы реляционной модели,
доктор Кодд выбрал термин "отношение"
(relation), потому что, по его мнению, этот
термин однозначен (в то время как, например,
термин "таблица" имеет множество различных
видов - таблица в тексте, электронная таблица
и пр.). Весьма распространено следующее
заблуждение: реляционная модель названа так
потому, что она определяет связи между
таблицами. На самом деле, название этой
модели происходит от отношений (таблиц базы
данных), лежащих в ее основе.

23.

ОСНОВНЫЕ ПРИНЦИПЫ РЕЛЯЦИОННОЙ МОДЕЛИ
Основные принципы реляционной модели на
концептуальном уровне можно сформулировать
следующим образом:
• все данные представляются в виде упорядоченной
структуры, определенной в виде строк и столбцов и
называемой отношением;
• все значения являются скалярами. Это означает,
что для любой строки и столбца любого
отношения существует одно и только одно
значение;
• все операции выполняются над целым
отношением, и результатом их выполнения также
является целое отношение. Этот принцип
называется замыканием.

24.

ТЕРМИНОЛОГИЯ РЕЛЯЦИОННЫХ БАЗ
Каждая строка, содержащая данные, называется
кортежем.
Каждый столбец отношения называется атрибутом
(на уровне практической работы с современными
реляционными БД используются термины "запись"
и "поле").
Сущность - некоторый обособленный объект или
событие, информацию о котором необходимо
сохранять в базе данных, имеющий определенный
набор свойств - атрибутов.
Домен - это набор всех допустимых значений,
которые может содержать атрибут. Понятие "домен"
часто путают с понятием "тип данных". Необходимо различать эти
два понятия. Тип данных - это физическая концепция, а домен логическая. Например, "целое число" – это тип данных, а "возраст"
- это домен.

25.

ПОСТРЕЛЯЦИОННЫЕ БАЗЫ ДАННЫХ
В основе постреляционных баз лежат
модель данных в виде многомерных
таблиц (например, в системе Cache фирмы
InterSystems Сorporation) и широкое
использование принципов объектноориентированного подхода при организации
баз данных и программировании.

26.

ВИДЫ СУБД ДЛЯ ПК
1. Системы управления базами данных в буквальном
смысле этого термина, для которых работа с базами
возможна только после запуска в работу этой системы
без возможности создания автономных программ,
работающих с базами. К этим системам относятся:
Access, Paradoх, dBase.
2. Системы, имеющие как средства для работы с базами
данных, так и возможности разработки исполняемых в
операционной системе пользовательских программ
(приложений), т. е. средства разработчика программ FoхPro.
3. Системы для разработки пользовательских программ
для работы с базами данных - Clipper, Clarion.

27.

END
English     Русский Правила