Информатика и информационно-коммуникационные технологии
Лекция 5 ОСНОВЫ КЛАССИФИКАЦИИ, СТРУКТУРИРОВАНИЯ И КОДИРОВАНИЯ ИНФОРМАЦИИ
Структура информации в информационных системах
Структура информации в информационных системах
Структура информации в информационных системах
Основы классификации информации
Основы классификации информации
Основы классификации информации
Иерархическая система классификации
Иерархическая система классификации
Фасетная классификация
Фасетная классификация
Фасетная классификация
Дескрипторная система классификации
Дескрипторная система классификации
Современные микропроцессоры
80.50K
Категория: ИнформатикаИнформатика

Лекция 5. Основы классификации, структурирования и кодирования информации

1. Информатика и информационно-коммуникационные технологии

Информатика и информационнокоммуникационные
технологии
Сафарьян Ольга
Александровна

2. Лекция 5 ОСНОВЫ КЛАССИФИКАЦИИ, СТРУКТУРИРОВАНИЯ И КОДИРОВАНИЯ ИНФОРМАЦИИ

Структура информации в
информационных системах
Основы классификации информации
Контрольные вопросы

3. Структура информации в информационных системах

Информационные совокупности состоят из элементарных
логически неделимых элементов информации –
реквизитов. Каждый реквизит описывает определённое
свойство отображаемой сущности (объекта, процесса,
явления). Реквизиты по своему содержанию
подразделяются на реквизиты-основания и
реквизиты-признаки.
Реквизиты-основания дают количественное описание
сущности, выраженное в определённых единицах
измерения и представленное числовыми данными
(например, вес, стоимость, количество экземпляров). Их
значениями могут быть только числа. При обработке над
ними выполняются арифметические операции.
Реквизиты-признаки характеризуют качественные
свойства сущности. К ним относятся фамилии,
наименования изделий, материалов и т.д. Реквизитыпризнаки выражаются буквенно-цифровыми значениями,
они служат для логической обработки информации, т.е.
для поиска, сортировки, группировки, выборки.

4. Структура информации в информационных системах

Каждый реквизит имеет конечное множество
конкретных значений на конкретном отрезке
времени. Перечень возможных значений реквизита
составляет его номенклатуру.
Показатель – логическое высказывание,
содержащее качественную и количественную
характеристику отображаемой сущности.
Эта элементарная информационная совокупность
уже имеет определённый смысл и состоит, как
правило, из одного реквизита-основания и
нескольких реквизитов-признаков.

5. Структура информации в информационных системах

Группы взаимосвязанных показателей образуют следующую
информационную совокупность – документ.
В этом случае показатель может рассматриваться с точек
зрения формы и содержания. Под формой элементов
показателя понимается структура граф и строк табличного
документа, а под содержанием – конкретные значения,
проставляемые в этих строках и графах. В свою очередь,
совокупность однородных документов, объединённых по
определённому признаку, образует информационную
совокупность – массив. Несколько массивов (они могут быть
разнородными), относящихся к определённому объекту,
образуют информационную систему. Структура исходных
данных определяющим образом влияет на организацию
информационных массивов и скорость их обработки.

6. Основы классификации информации

Классификация – особый вид логической операции,
заключающейся в распределении элементов
рассматриваемого множества по подмножествам (делении на
классы) в соответствии с определённым признаком (группой
признаков). Совокупность правил на основе взаимосвязанных
признаков, в соответствии с которыми производится
упорядоченное расположение классифицируемых элементов,
составляет систему классификации.
Признаком классификации называется реквизит (свойство
объекта, характеристика, значение), позволяющий установить
сходство или различие с другими объектами классификации.
Классификатор – систематизированный свод наименований
и кодов классификационных группировок.

7. Основы классификации информации

Системы классификации характеризуются гибкостью,
ёмкостью и степенью заполненности.
Гибкостью системы классификации называют свойство
системы классификации допускать включение новых
классификационных группировок без разрушения
существующей структуры классификатора.
Ёмкостью системы классификации называют наибольшее
возможное количество группировок в данной системе
классификации.
Степень заполненности (коэффициент заполненности)
системы классификации определяется отношением
фактического количества используемых классификационных
группировок к ёмкости.

8. Основы классификации информации

Логическим продолжением классификации является
кластеризация, которую можно рассматривать как
автоматическую классификацию
К системам классификации предъявляются следующие
требования:
полнота охвата объектов рассматриваемой области;
однозначность реквизитов;
возможность включения новых объектов.
На основе различных методов применения
классификационных признаков строятся иерархическая,
фасетная и дескрипторная системы классификации.

9. Иерархическая система классификации

Под иерархией понимается расположение элементов
множества или частей целого в порядке подчинённости от
высшего уровня к низшему. В иерархической системе
классификации устанавливается такое отношение
соподчинения между классификационными признаками, при
котором каждое множество высшего порядка содержит
непересекающиеся между собой подмножества низшего
порядка.
Иерархическая система классификации строится путём
последовательного деления исходного множества
элементов, составляющего нулевой уровень, на классы
(подмножества первого уровня), каждый из которых может
делиться на подклассы (подмножества второго уровня),
подклассы – на группы (подмножества третьего уровня),
группы – на подгруппы (подмножества четвёртого уровня) и
т.д.

10. Иерархическая система классификации

Достоинства иерархической системы
классификации:
наглядность, простота и логичность построения;
использование независимых классификационных
признаков в различных ветвях иерархической
структуры.
Недостатки иерархической системы классификации:
сложность внесения в структуру изменений,
связанная с перераспределением объектов по
классификационным группировкам;
невозможность группировать объекты по заранее
не предусмотренным сочетаниям признаков.

11. Фасетная классификация

Фасетная система классификации, в отличие от
иерархической, позволяет выбирать признаки
классификации независимо как друг от друга (без
соподчинения), так и от семантического содержания
классифицируемого объекта. Признаки классификации
называются фасетами (facet – рамка). Каждый фасет
содержит совокупность однородных значений данного
классификационного признака. Причём значения в фасете
могут перечисляться произвольно, хотя предпочтительнее
их упорядочение.
Общая схема построения фасетной системы классификации в
виде таблицы отображена на рисунке 1. Названия столбцов
соответствуют выделенным классификационным признакам
(фасетам), обозначенным Ф1, Ф2, …, Фi, …, Фn. В каждой
клетке таблицы хранится конкретное значение фасета.
Количество значений (строк таблицы) для разных фасетов
может отличаться.

12. Фасетная классификация

Фасеты
Направление
(Ф1)
Значения
фасетов
Менеджмент
Сервис
Туризм
Психология

Экономика
Юриспруденция
Форма
обучения
(Ф2)
Очная
Заочная
Вечерняя
Курс
(Ф3)
… Фi … Фn
Первый
Второй
Третий

Четвёртый
Пятый

Рисунок 1 - Фасетная система классификации

13. Фасетная классификация

При построении фасетной системы классификации
необходимо, чтобы значения, используемые в различных
фасетах, не повторялись. Фасетную систему легко
можно модифицировать, добавляя новые фасеты, удаляя
существующие или изменяя конкретные значения любого
фасета.
Достоинства фасетной системы классификации:
возможность создания большой ёмкости классификации,
т.е. использования большого числа признаков классификации и
их значений для создания группировок;
возможность простой модификации всей системы
классификации без изменения структуры существующих
группировок.
Недостатком фасетной системы классификации является
сложность её построения, так как необходимо учитывать всё
многообразие классификационных признаков, а также низкая
наглядность.

14. Дескрипторная система классификации

Для организации поиска информации, для ведения словарей
эффективно используется дескрипторная (описательная)
система классификации, язык которой приближается к
естественному языку описания информационных объектов.
Особенно широко она используется в библиотечной системе
поиска.
Суть дескрипторного метода классификации:
• отбирается совокупность ключевых слов или
словосочетаний, описывающих определённую предметную
область или совокупность однородных объектов. Причём
среди ключевых слов могут находиться синонимы;
• выбранные ключевые слова и словосочетания подвергаются
нормализации, то есть из совокупности синонимов
выбирается один или несколько наиболее употребительных;
• создаётся словарь дескрипторов, т.е. словарь ключевых
слов и словосочетаний, отобранных в результате процедуры
нормализации.

15. Дескрипторная система классификации

Между дескрипторами устанавливаются связи, которые
позволяют расширить область поиска информации. Связи
могут быть трёх видов:
синонимические – указывают некоторую совокупность
ключевых слов как синонимы (студент – учащийся –
обучаемый);
родовидовые – отражают включение некоторого класса
объектов в более представительный класс (студент –
группа – факультет);
ассоциативные – соединяют дескрипторы, обладающие
общими свойствами (студент – преподаватель – занятие –
аудитория).

16. Современные микропроцессоры

Процессоры для ПК выпускают многие фирмы, но законодателем
моды здесь является фирма Intel.
К основным особенностям архитектуры Intel Core можно отнести
следующие:
•имеется специальный внутренний кэш размером 2 Мбайта;
•добавлена арбитражная шина, которая уменьшает нагрузку системной
шины;
•внутренняя микроархитектура процессора базируется на двух ядрах –
параллельно работающих конвейерах команд (суперскалярная
архитектура), которые исполняют сразу несколько команд в 12 разных
фазах обработки (чтение, дешифрация, загрузка операндов, исполнение и
т.д.). Конвейеры заканчиваются двумя АЛУ: АЛУ, работающим на
удвоенной частоте процессора для коротких арифметических и логических
команд, и АЛУ для выполнения медленных команд;
•введено управление питанием ядра, которое включает в себя блок
температурного контроля, способный управлять отдельно питанием
каждого ядра.

17.

Контрольные вопросы
1. Дайте определение понятий «классификация»,
«кодирование», «классификатор».
2. Назовите известные методы классификации.
3. Перечислите основные достоинства и недостатки
иерархической и фасетной систем классификации.
English     Русский Правила