Язык разметки XML
Вопросы
История средств разметки
Язык разметки
SGML
Возможности языка SGML
HTML
Недостатки HTML
Примеры кода HTML и XML
XML
XML
Архитектура XML
XML архитектура
XML – универсальный формат данных
Преимущества XML
Преимущества в области бизнеса
Технологические преимущества
Реальное использование языка XML
Структура документа XML
Правильно сформированные и корректные документы
Синтаксические анализаторы
Синтаксические анализаторы
Данные и разметка
Создание документа XML
Составление декларации XML
Создание корневого элемента
Создание кода XML
Комментарии
Инструкции обработки
Символьные данные
PCDATA
CDATA
Примитивы
Примеры использования примитивов
Декларации DOCTYPE
Атрибуты
Выводы
Выводы
553.00K
Категория: ПрограммированиеПрограммирование

Язык разметки XML

1. Язык разметки XML

2. Вопросы

1.
2.
3.
4.
5.
6.
История появления языков разметки
Перечислить и объяснить недостатки HTML
Архитектура документов XML
Перечислить преимущества XML
Синтаксический анализатор
Компоненты документа XML
Символьные данные
Комментарии
Инструкции обработки
Примитивы
Общие примитивы
Объявления DOCTYPE
Ссылки на примитивы

3. История средств разметки

Документы записываются с
помощью бумаги и ручки
Наборщики
форматируют документы
Средства, используемые
наборщиками для
форматирования документа

4. Язык разметки

Язык разметки определяет правила, которые
помогают добавить смысловое значение к
содержимому и структуре документов
Языки классифицируются, как:
Stylistic Markup (Стилистическая разметка) – Определяет
представление документа
Structure Markup (Структурная разметка) – Определяет
структуру документа
Semantic Markup (Семантическая или Смысловая
разметка) – Определяет содержимое документа

5. SGML

Система форматирования документов была названа
Generalized Markup Language (GML) – Язык разметки
общего назначения
Язык GML тщательно разрабатывался и
дорабатывался и в конечном итоге стал известен, как
Standard Generalized Markup Language (SGML) –
Стандартный язык разметки
SGML считается родоначальником всех языков
разметки

6. Возможности языка SGML

Описывает язык разметки, позволяющий авторам
создавать собственные тэги, связанные с
содержанием
Необходим файл, который должен содержать все
правила этого языка для его интерпретации
Язык разметки, производный от SGML, называется
приложением SGML

7. HTML

HTML – это самый известный язык разметки,
являющийся производным от SGML
Он был создан для разметки технической
документации, с тем, чтобы документы могли бы
передаваться между различными платформами в
научном сообществе
Сейчас он используется и многими другими
пользователями, которые заинтересованы в
визуальном представлении своих документов

8. Недостатки HTML

Фиксированный набор тэгов
Технология представления не связана с содержанием
«Плоская» разметка
Излишнее количество служебных данных
HTML не является международным языком
Невозможен обмен данными
Не имеет надёжного механизма связывания
HTML не обеспечивает повторное использование

9. Примеры кода HTML и XML

<UL>
Код HTML
<LI> TOM CRUISE
<UL>
<LI> CLIENT ID : 100
<LI> COMPANY : XYZ Corp.
<LI> Email : [email protected]
<LI> Phone : 3336767
<LI> Street Adress : 25th St.
<LI> City : Toronto
<LI> State : Toronto
<LI> Zip : 20056
</UL>
</UL>
Код XML
<Details>
<CONTACT>
<PERSON_NAME>TOM
CRUISE
</PERSON_NAME>
<ID>
100
</ID>
<COMPANY>
XYZ
Corp.
</COMPANY>
<Email>
[email protected]</Email>
<Phone>
3336767
</Phone>
<Street>
25th
St.
</Street>
<City>
Toronto
</City>
<State>
Toronto
</State>
<ZIP>
20056
</ZIP>
</CONTACT>
</Details>

10. XML

XML – это аббревиатура от Extensible Markup
Language (XML) – расширяемый язык разметки
Устраняет все недостатки, присущие HTML
Позволяет пользователю определить собственный
набор тэгов, а также даёт возможность понять их и
другим пользователям
Гораздо более гибкий язык, чем HTML
Наследует свойства языка SGML и объединяет их с
положительными свойствами HTML
Является более компактной версией SGML

11. XML

XML – это метаязык, который описывает другие
языки
Данные, содержащиеся в файле XML, могут быть
выведены различными способами
Данные также могут быть переданы в другие
приложения для дальнейшей обработки
Таблицы стилей (Style sheets) помогают
преобразовать структурированные данные в
различные HTML-представления для вывода данных
в различных браузерах

12. Архитектура XML

XML поддерживает трёхзвенную архитектуру для
обработки и манипулирования данными
Может быть сгенерирован из существующих баз
данных с использованием масштабируемой
трёхзвенной модели
Тэги XML представляют логическую структуру
данных, которая может быть интерпретирована и
использована различными способами в
многочисленных приложениях
Среднее звено используется для доступа к
многочисленным базам данных и трансляции данных
в формат XML

13. XML архитектура

Настольный
компьютер
Вид 2
Вид 1
Вывод
Несколько видов,
созданных из
данных,
основанных на
XML
XML
Среднее звено
Web-сервер
Доступ к БД,
бизнес-правила
интеграции
Хранение
База данных
Мэйнфрейма
Доставка и обработка
данных
Обмен данными в формате
XML через HTTP
Интеграция данных
XML создаётся или
генерируется

14. XML – универсальный формат данных

HTML – это один язык разметки, а XML является
семейством языков разметки
Любой тип данных может быть с лёгкостью
определён в XML
XML популярен, благодаря широкому спектру
областей его применения, а также потому, что он
прост в использовании
XML имеет структурированный формат данных,
который позволяет хранить сложные (составные)
данные

15. Преимущества XML

Трёхзвенная архитектура обеспечивает
лёгкость масштабирования и улучшенную
безопасность
Преимущества XML классифицируются
следующим образом:
Преимущества в области бизнеса
Технологические преимущества

16. Преимущества в области бизнеса

Совместное использование информации
XML в составе одного приложения
Позволяет отраслям бизнеса определять собственные форматы
данных в XML, с лёгкостью создавать средства для чтения этих
данных, для записи данных и для преобразования данных
между XML и другими форматами
Весьма мощный и гибкий язык для описания сложных свойств
реального мира
Расширяемость – даёт приложению возможность дальнейшего
роста и разработки без каких-либо радикальных изменений
Доставка содержания
Способность поддерживать различных пользователей и
информационные каналы (механизмы доставки информации)
для построения более эффективных приложений

17. Технологические преимущества

Разделение данных и
представления
Семантическая
информация
Технологические
преимущества
Повторное
использование
данных
Расширяемость

18. Реальное использование языка XML

EDI документы электронные
SABRE (сфера международного туризма)
Chemical Markup Language
(химический язык разметки)

19. Структура документа XML

Документ XML состоит из наборов «примитивов»
(«entities»), идентифицируемых по неповторяющимся,
уникальным именам
Все документы начинаются с примитива «корневой»
(root) или «документ» (document)
Примитивы – это псевдонимы для более сложных
функций
Документы логически состоят из объявлений,
элементов, комментариев, символьных ссылок и
инструкций обработки

20. Правильно сформированные и корректные документы

Спецификация XML 1.0 определяет синтаксис XML
Документ считается правильно сформированным, если он
удовлетворяет минимальному набору требований,
определённых пользователем
Требования гарантируют, что используются правильные
языковые конструкции, что они используются по назначению,
именно так, как определено спецификацией языка XML.
Корректный документ – это правильно сформированный
документ, который к тому же полностью соответствует
правилам, определённым в DTD
DTD определяет правила, по которым XML выполняет
разметку в документе, и должен неукоснительно их соблюдать.

21. Синтаксические анализаторы

Синтаксические анализаторы помогают
компьютеру интерпретировать файл XML
Существуют два типа синтаксических
анализаторов:
Синтаксический анализатор без проверки
корректности
Синтаксический анализатор с проверкой
корректности

22. Синтаксические анализаторы

XML
файл
Синтаксический
анализатор загружает XML
и другие связанные файлы
для проверки: является ли
документ XML правильно
сформированным и
корректным
Прочие
связанные
файлы (такие,
как DTD файл)
Дерево
данных

23. Данные и разметка

Документ XML
Данные
Текст, который описывает данные – Разметка
<NAME>ЛЦПбп-17-1</NAME>
Тэги <NAME> и </NAME> - это разметка
‘ЛЦПбп-17-1’ – это символьные данные

24. Создание документа XML

Этапы, которые вы должны пройти для
создания документа XML
Составление декларации XML
Создание корневого элемента
Создание кода XML
Проверка документа

25. Составление декларации XML

Помогает браузеру и читателю документа обработать документ
Синтаксис
<?xml version=“1.0”?>
Декларация XML не является обязательной
Версия XML 1.0 принята по умолчанию
Сообщает синтаксическому анализатору и другим приложениям о
способе, которым должны быть обработаны данные в файле
<?xml version=“1.0” standalone=“no” encoding=“UTP-8”?>
Атрибуты “standalone” и “encoding” не являются обязательными, только
номер версии обязателен
‘Standalone’ определяет, используется ли внешняя декларация или не
используется
‘Encoding’ определяет кодировку символов, используемую автором

26. Создание корневого элемента

Может существовать только один корневой
элемент
Он описывает функцию документа
Каждый документ XML обязательно должен
содержать корневой элемент
<?xml version=“1.0” standalone=“no” encoding=“UTP-8”?>
<BOOK>
</BOOK>

27. Создание кода XML

Это процесс создания собственных элементов и
атрибутов в соответствии с требованиями нашего
приложения
Элементы – это базовые единицы содержимого XML
Тэги сообщают пользовательскому агенту, что
нужно сделать с содержимым, заключённым между
начальным и конечным тэгами
Открывающий Содержание Закрывающий
тэг
тэг
Части
элемента
<TITLE>
Группа ЛЦПбп
Элемент
</TITLE>

28. Комментарии

Специальная информация, которая приводится в
документе для того, чтобы в будущем читатель мог
с нею ознакомиться, и которая должна
игнорироваться процессором, называется
комментариями
Синтаксис
<!-- Здесь записать комментарии -->
Пример
<!-- эти строки не показывать
<NAME>KATE WINSLET</NAME>
<NAME>NICOLE KIDMAN</NAME>
<NAME>ARNOLD</NAME>
-->
<NAME>TOM CRUISE</NAME>
Приведённый пример должен
вывести только имя TOM
CRUISE, а другие имена
воспринимаются, как
комментарии

29. Инструкции обработки

Обработка информации является частью
информации, значимой для приложения,
использующего документ XML.
Эти инструкции передаются непосредственно в
приложение с помощью синтаксического
анализатора.
Декларация XML – это также агент обработки
<?xml:stylesheet type=“text/xsl”?>
Имя приложения
Информационная инструкция

30. Символьные данные

Текст между начальным и конечным тэгами
определяется, как "символьные данные"
(‘character data’)
Символьные данные могут быть любыми
допустимыми символами (Unicode)
Символьные данные делятся на:
PCDATA
CDATA

31. PCDATA

Это означает parsed character data (обрабатываемые
символьные данные)
PCDATA – это текст, который будет обрабатываться
синтаксическим анализатором
Тэги в этом тексте будут восприняты, как разметка,
а примитивы будут развёрнуты.
Имя примитива
&lt;
&gt;
&amp;
&quot;
&apos;
Символ
<
>
&
"
'
Предопределённые
примитивы

32. CDATA

Это означает character data (символьные данные)
Не обрабатываются синтаксическим анализатором
CDATA используются для обеспечения удобства
включения больших блоков специальных символов.
Строку символов ‘]]>’ нельзя использовать внутри
блока CDATA, так как она сигнализирует об
окончании блока CDATA.
Пример
<SAMPLE>
<![CDATA[<DOCUMENT>
<NAME>TOM CRUISE</NAME>
<EMAIL>[email protected]</EMAIL>
</DOCUMENT>]]>
</SAMPLE>

33. Примитивы

Примитивы (Entities) используются в документе, чтобы
сократить трудозатраты в тех случаях, когда необходимо
многократно вводить большие фрагменты текста в
документ.
Существуют две категории примитивов:
Общие примитивы (General entities)
Синтаксис
<!ENTITY ADDRESS "text that is to be represented by an entity">
Параметризованные примитивы (Parameter entities)
Синтаксис
<!ENTITY % ADDRESS "text that is to be represented by an entity">

34. Примеры использования примитивов

Параметризованные примитивы: Объявление примитива:
< CLIENT = "&APTECH;"
<!ENTITY full_address
PRODUCT =
" My Address 12
"&PRODUCT_ID;"
Tenth Ave. Suite 12
QUANTITY = "15">
Paris, France">
Объявление примитива
Синтаксис
%PARAMETER_ENTITY_NAME;
Пример
%address;
Объявление примитива
Синтаксис
&ENTITY_NAME;
Пример
&address;

35. Декларации DOCTYPE

Декларация <!DOCTYPE [..]> следует за
декларацией XML в документе XML
Синтаксис
<?xml version="1.0"?>
<!DOCTYPE myDoc [
...здесь объявляются примитивы....
<myDoc>
...тело документа....
</myDoc>
Пример
<!DOCTYPE CUSTOMERS [
<!ENTITY firstFloor "15 Downing St Floor 1">
<!ENTITY secondFloor "15 Downing St Floor 2">
<!ENTITY thirdFloor "15 Downing St Floor 3">
]>

36. Атрибуты

Атрибут даёт информацию об элементе
Атрибуты включаются в стартовый тэг
элемента
Атрибут состоит из имени атрибута и
значения атрибута
Пример
<TV count="8">SONY</TV>
<LAPTOP count="10">IBM</LAPTOP>

37. Выводы

Язык разметки определяет набор правил, которые добавляют
смысловую нагрузку к содержанию и структуре документов.
XML – это расширяемый язык, то есть мы можем определить
собственный набор тэгов, и дать возможность другим
сторонам (людям или программам) знать и понимать эти тэги.
Это делает XML гораздо более гибким языком, чем HTML.
XML наследует свойства языка SGML и объединяет их с
положительными свойствами HTML. XML может быть
сгенерирован из существующих баз данных с использованием
масштабируемой трёхзвенной модели. Основанные на XML
данные не содержат информации о том, каким образом
должны выводиться данные.
Документ XML состоит из наборов "примитивов" (“entities”),
идентифицируемых по неповторяющимся, уникальным
именам.
Правильно сформированный документ – это такой документ,
который соответствует основным правилам XML.
Синтаксический анализатор помогают компьютеру
интерпретировать файл XML.

38. Выводы

Шаги, предполагаемые при создании документа XML:
Составление декларации XML
Создание корневого элемента
Создание кода XML
Проверка документа
Символьные данные разделяются на PCDATA и CDATA.
Примитивы (Entities) используются в документе, чтобы
сократить трудозатраты в тех случаях, когда необходимо
многократно вводить большие фрагменты текста в документ.
Существуют две категории примитивов:
Общие примитивы
Параметризованные примитивы
Декларация <!DOCTYPE [..]> следует за декларацией XML в
документе XML.
Атрибут даёт информацию об элементе.
English     Русский Правила