Информационные технологии
BI и хранилища данных
Основные составляющие Хранилища данных:
Предметная ориентированность:
Интегрированность (целостность и внутренняя взаимосвязь):
Временная привязка:
Неразрушаемая совокупность данных :
Особенности хранилищ данных:
Структура СППР с физическим ХД
Проблемы создания ХД
Разновидности хранилищ – витрины данных:
Достоинства подхода ВД
Структура СППР с ВД
Стадии Data Mining
Методы Data Mining. Технологические методы.
Зачем нужны специализированные СХД?
Характеристики жёстких дисков
Ленточные накопители: фантастические твари мира архивирования
Программно-определяемое хранение
СХД на ДНК
MED
А что еще?
2.40M
Категория: ИнформатикаИнформатика

Информационные технологии. Хранение данных . Концепция, физическая реализация Перспективы развития

1. Информационные технологии

Хранение данных .
Концепция, физическая реализация
Перспективы развития
МТУСИ

2. BI и хранилища данных

Концепция, методы и средства хранилища данных
(Data
warehousing)
определяют
подходы
и
обеспечивают интеграцию, очистку, ретроспективное
хранение информации, предназначенной для анализа,
отвечают на вопрос "Как подготовить информацию для
анализа?".
Следует отметить, что часто термином "хранилище
данных" обозначают систему поддержки принятия
решений DSS или информационно-аналитическую
систему, основанные на технологиях хранилища
данных и бизнес-интеллекта.
МТУСИ
2

3. Основные составляющие Хранилища данных:

предметная ориентированность;
интегрированность (целостность
и внутренняя взаимосвязь);
временная привязка;
неразрушаемая совокупность
данных.
3

4. Предметная ориентированность:

Локальные базы данных содержат
Гигабайты информации, абсолютно не
нужной для анализа (адреса, почтовые
индексы, идентификаторы записей и др.).
Подобная информация не заносится в
хранилище, что ограничивает спектр
рассматриваемых данных при принятии
решения до минимума.
4

5. Интегрированность (целостность и внутренняя взаимосвязь):

Несмотря на то что данные погружаются из
различных источников, но они объединены
едиными законами именования, способами
измерения атрибутов и др. Это имеет большое
значение для корпоративных организаций, в
которых одновременно могут эксплуатироваться
различные по своей архитектуре
вычислительные системы, представляющие
одинаковые данные по-разному. Например,
могут использоваться несколько различных
форматов представления дат или один и тот же
показатель может называться по-разному,
например, "вероятность доведения
информации" и "вероятность получения
информации". В процессе погружения подобные
несоответствия устраняются автоматически;
5

6. Временная привязка:

Оперативные системы охватывают
небольшой интервал времени, что
достигается за счет периодического
архивирования данных. DW, напротив,
содержит исторические данные,
накопленные за большой интервал
времени (пять—семь лет);
6

7. Неразрушаемая совокупность данных :

Модификация данных не производится,
поскольку может привести к нарушению
их целостности.
Поскольку не требуется минимизировать
время погружения, то структура
хранилища может быть оптимизирована
для обработки определенных запросов,
что достигается за счет денормализации
реляционной схемы, предварительного
агрегирования и построения
соответствующих индексов.
7

8. Особенности хранилищ данных:

Хранилища данных содержат информацию, собранную из
нескольких оперативных баз данных. Хранилища, как правило,
на порядок больше оперативных баз, зачастую имея объем от
сотен гигабайт до нескольких терабайт.
Как правило, хранилище данных поддерживается независимо от
оперативных баз данных организации, поскольку требования к
функциональности и производительности аналитических
приложений отличаются от требований к транзакционным
системам.
Хранилища данных создаются специально для приложений
поддержки принятия решений и предоставляют накопленные за
определенное время, сводные и консолидированные данные,
которые более приемлемы для анализа, чем детальные
индивидуальные записи. Рабочая нагрузка состоит из
нестандартных, сложных запросов, которые обращаются к
миллионам записей и выполняют огромное количество
операций сканирования, соединения и агрегирования. Время
ответа на запрос в данном случае важнее, чем пропускная
способность.
8

9. Структура СППР с физическим ХД

9

10. Проблемы создания ХД

необходимость интеграции данных из неоднородных источников в
распределенной среде;
потребность в эффективном хранении и обработке очень больших
объемов информации;
необходимость наличия многоуровневых справочников метаданных;
повышенные требования к безопасности данных.,
10

11. Разновидности хранилищ – витрины данных:

Поскольку конструирование хранилища данных — сложный
процесс, который может занять несколько лет, некоторые
организации вместо этого строят витрины данных (data mart),
содержащие информацию для конкретных подразделений.
Например, маркетинговая витрина данных может содержать
только информацию о клиентах, продуктах и продажах и не
включать в себя планы поставок.
Несколько витрин данных для подразделений могут
сосуществовать с основным хранилищем данных, давая
частичное представление о содержании хранилища. Витрины
данных строятся значительно быстрее, чем хранилище, но
впоследствии могут возникнуть серьезные проблемы с
интеграцией, если первоначальное планирование проводилось
без учета полной бизнес-модели.
Витрина данных (ВД) — это упрощенный вариант ХД, содержащий
только тематически объединенные данные.
11

12. Достоинства подхода ВД

проектирование ВД для ответов на определенный круг вопросов;
быстрое внедрение автономных ВД и получение отдачи;
упрощение процедур заполнения ВД и повышение их
производительности за счет учета потребностей определенного круга
пользователей.
Недостатки
многократное хранение данных в разных ВД, что приводит к
увеличению расходов на их хранение и потенциальным проблемам,
связанным с необходимостью поддержания непротиворечивости
данных;
отсутствие консолидированности данных на уровне предметной
области, а следовательно — отсутствие единой картины.
12

13. Структура СППР с ВД

13

14.

Многомерное представление данных
14

15.

Операции над многомерными данными
15

16.

Операции над многомерными данными
16

17.

Архитектура
МТУСИ
17

18. Стадии Data Mining

СВОБОДНЫЙ ПОИСК (в том числе
ВАЛИДАЦИЯ)
ПРОГНОСТИЧЕСКОЕ МОДЕЛИРОВАНИЕ
АНАЛИЗ ИСКЛЮЧЕНИЙ

19. Методы Data Mining. Технологические методы.

Непосредственное использование данных, или
сохранение данных:
кластерный анализ, метод ближайшего соседа, метод kближайшего соседа, рассуждение по аналогии
Выявление и использование формализованных
закономерностей, или дистилляция шаблонов:
логические методы; методы визуализации; методы
кросс-табуляции; методы, основанные на уравнениях

20.

21. Зачем нужны специализированные СХД?

Основу функционирования любой ИС составляет работа с БД. Как было
показано в предыдущей лекции, БД удобно хранить на выделенном
сервере. Но существует ряд причин, по которым для хранения данных
целесообразно использовать специализированные устройства - системы
хранения данных (СХД). СХД нужны для:
централизации информации – в противном случае каждая функциональная
система потребует отдельного хранилища;
надежной защиты информации - трудно осуществить резервное копирование
данных, находящихся на разных серверах и (или) разнесенных территориально;
ускорения обработки информации - даже при достаточно «толстом» канале
связи не всегда возможно полноценное использование существующих сетей.
расширения дисковых ёмкостей - сложно получить в сервере ёмкости порядка
терабайт.
более эффективной утилизации ресурсов – трудно угадать, в каком сервере
данные будут расти быстрее;
упрощения
управлением
потоками
информации

управлять
централизованными данными проще, чем распределенными;
повышения экономического эффекта внедрения ИС – централизованные
системы дешевле распределенных и их эксплуатация также дешевле, т.к. они не
требуют большого штата квалифицированного персонала и дорогих аппаратных
решений.
МТУСИ
21

22.

Что такое СХД?
СХД – это специализированное оборудование и программное
обеспечение для надежного хранения и передачи больших массивов
информации.
СХД – неотъемлемая часть современных ЦОД.
Хранение данных, занимает второе место среди расходов на ИТ.
Структура СХД
устройства хранения (дисковые массивы, ленточные библиотеки,
оптические накопители, SSD);
инфраструктура доступа к устройствам хранения;
подсистема резервного копирования и архивирования данных;
программное обеспечение управления хранением;
система управления и мониторинга всей системы в целом.
МТУСИ
22

23.

СХД, связанные с сервером
DAS (Direct Attached Storage)
или SAS (Server Attached
Storage), т.
е. системы,
подключаемые
непосредственно к серверу.
Достоинства:
низкая стоимость; по сути – это дисковая корзина, вынесенная за пределы
сервера;
простота развертывания и администрирования;
высокая скорость обмена между дисковым массивом и сервером.
Недостатки:
низкая надежность (при выходе из строя сервера данные перестают быть
доступными);
избытки памяти одного сервера не могут использоваться другими;
отсутствие возможности создать единую систему управления, что создает
проблемы при резервировании/восстановлении данных и защите
информации.
23
МТУСИ

24.

Сеть хранения данных
SAN (Storage Area Networks) —
архитектурное
решение
для
подключения внешних устройств
хранения
данных
(дисковых
массивов, ленточных библиотек,
оптических
накопителей)
к
серверам таким образом, чтобы эти
ресурсы
распознавались
из
внешней сети, как локальные.
Позволяет обеспечить:
• централизованное управление ресурсами серверов и СХД;
• «горячее» подключение новых дисковых массивов и серверов;
• использование ранее приобретенного оборудования совместно с новыми
устройствами хранения данных;
• сеть хранения разгружает основную сеть;
• оперативный и надежный доступ к накопителям данных, находящимся на
большом расстоянии от серверов, без значительных потерь
производительности;
• ускорение процесса резервного копирования и восстановления данных.
МТУСИ
24

25.

NAS – Network Attached Storage
В ОТЛИЧИЕ ОТ SAN, NAS НЕ СЕТЬ, А СЕТЕВОЕ
ДИСКОВОЕ ХРАНИЛИЩЕ, ИНТЕГРИРОВАННОЕ С ЛВС
ЧЕРЕЗ
ФАЙЛОВЫЙ
NAS-СЕВЕР,
СО
СПЕЦИАЛИЗИРОВАННОЙ ОС И НАБОРОМ ФУНКЦИЙ
ДОСТУПА К ФАЙЛАМ. БЫСТРОЕ РЕШЕНИЕ ПРОБЛЕМЫ
НЕХВАТКИ СВОБОДНОГО ДИСКОВОГО ПРОСТРАНСТВА.
ЗАДАЧА – УПРОСТИТЬ РАБОТУ С ФАЙЛАМИ.
ОТЛИЧИЕ ОТ DAS – РАБОТА С ФАЙЛАМИ, А НЕ С
БЛОКАМИ.
Достоинства:
• дешевизна и доступность ресурсов для любых рабочих станций в сети;
• простота коллективного использования ресурсов (Интернет, САПР);
• простота развертывания и администрирования;
• универсальность для клиентов (один сервер может обслуживать рабочие
станции с разными ОС).
Недостатки:
• доступ через протоколы “сетевых файловых систем” обычно медленнее, чем
непосредственно к локальному диску;
• большинство недорогих NAS-серверов не позволяют обеспечить скоростной
и гибкий доступ к данным на уровне файлов.
МТУСИ
25

26.

Блочная дедубликация данных
Объем хранимых резервных копий может превышать объем
продуктивных данных в 10-20 раз при различии между копиями в единицы
процентов.
Дедупликация данных - выделение уникальных блоков данных,
сохраняемых только один раз:
в источнике, т.е. на клиентах системы резервного копировании (EMC
Avamar) - 500-кратное снижение загрузки сети и 20-кратное снижение
емкости
устройств
хранения
данных
резервного
копирования.
Специальный патентованный алгоритм разбивает исходные данные на
блоки переменной длины, пытаясь выделить как можно больше
одинаковых блоков. Клиенты системы передают только уникальные блоки,
еще не содержащиеся в хранилище. Если же блок уже содержится в
хранилище, то передается только метаинформация о том, что данный
блок существует и на данном клиенте.
на целевом устройстве, т.е. в самой системе резервного копирования
(ЕМС Data Domain) - сокращение объема хранилища резервных копий в
десятки раз. Система поддерживает дедупликацию «на лету» (inline), за
счет чего достигается более эффективное (в разы) использование
дискового пространства по сравнению с системами, использующими
отложенную репликацию.
МТУСИ
26

27.

Устройства хранения данных
SSD — твердотельные диски (Solid State Disks или Solid
State Drive). Очень производительны, но и очень дороги.
Применяются для активно используемых данных.
Жесткие магнитные диски с
последовательным интерфейсом
SAS/FC — скорость передачи
информации 6 Гбит/с.
Жесткие диски с параллельным интерфейсом SATA - скорость
передачи информации 3 Гбит/с из-за низкой тактовой частоты.
Магнитные ленты - низкая удельная стоимость хранения, но нет
выборочного доступа к данным.
Оптические диски - выборочный доступ к данным, высокая
производительность, но в обычных CD перезапись невозможна;
у CD-RW малое число циклов «запись-считывание» - до 1000.
МТУСИ
27

28.

Многоуровневое хранение
(Multi Tier Storage)
Реализуется принцип различной доступности к
информации различной важности:
Уровень
1

«уровень
производительности»
(Performance Tier) - SAS/FC, SSD.
Уровень 2 - «уровень емкости» (Capacity Tier) – диски
SATA.
Уровень 3 – «уровень архивирования» (Archive Tier) оптические диски и/или ленточные накопители.
Специализированное
ПО
управляет
автоматической
миграцией между уровнями или в пределах одного из них
на основе заданных алгоритмов.
Разгружаются первичные системы хранения, ускоряется
процесс копирования и восстановления данных,
удешевляется общая стоимость хранения, повышается
надежность, уменьшаются трудозатраты.
МТУСИ
28

29.

Твердотельные накопители (SSD)
Достоинства:
- быстрый переход в рабочее состояние (нет
раскрутки),
- быстрый случайный доступ к данным;
отсутствие
шума
при
отсутствии
вентиляторов;
низкое
энергопотребление
и,
следовательно, тепловыделение;
- высокая механическая надёжность (отсутствие) движущихся частей;
- лучшая способность переносить экстремальные внешние условия (перегрузки, вибрации,
перепады давления, температуры);
- постоянная производительность по всему объёму хранения;
- относительно низкий вес и размеры;
- SSD с многоуровневой структурой.
Недостатки:
- цена, в разы выше, чем у обычных жёстких дисков;
- меньшая, хотя и быстро растущая ёмкость (сейчас – до нескольких Тбайт);
- большая уязвимость к внезапному отключению питания, магнитным полям, статическому
электричеству;
- ограниченное число циклов записи;
- в отношении к SSD справедливы те же принципиальные ограничения по длине затворов
транзисторов, что и для процессоров.
МТУСИ
29

30. Характеристики жёстких дисков

Ёмкость
• В современных жестких дисках
емкость измеряется в гигабайтах
или терабайтах.
Для HDD эта величина кратна ёмкости
одного магнитного диска внутри
коробки, умноженной на число
магнитных, которых обычно бывает
несколько.
Скорость вращения (только для HDD)
• Скорость вращения дисков внутри
привода, измеряется в оборотах в
минуту RPМ (Rotation Per Minute),
обычно составляет
5400 RPM или 7200 RPM.
• HDD с интерфейсами SCSI/SAS имеют
скорость вращения 10000 15000 RPM.
Среднее время доступа
• Среднее время доступа = Среднее время
поиска (Mean seek time) + Среднее время
ожидания (Mean wait time), т.е. время
извлечения
информации с диска.
Скорость передачи данных
• Это скорости считывания и записи данных
на жестком диске, измеряемая в
мегабайтах в секунду (MB/S).
IOPS (Input/Output Per Second)
• Число операций ввода-вывода (или чтениязаписи) в секунду (Input/Output Operations Per
Second).
• IOPS – важный показатель, именно от него
зависит быстродействие бизнес-приложений.
30

31. Ленточные накопители: фантастические твари мира архивирования

Ленточные накопители – это довольно старый тип носителя
информации. Магнитная лента была разработана еще в 30-х годах
XX века и первоначально применялась для хранения звукозаписей.
Первый случай ее использования для записи и хранения именно
компьютерных данных был зафиксирован в 1951 г.
Ленточный накопитель стандарта LTO и картридж LTO-2 к нему
МТУСИ
31

32.

МТУСИ
32

33.

Но почему ленты?
Аргументов в пользу ленточных накопителей сегодня все еще
достаточно много:
Это надолго. Ведь ленточные накопители считаются самыми
надежными из распространенных накопителей (срок хранения от
15 до 30 лет).
Большой объём. Ленточные накопители обладают наибольшим
объемом: картриджи стандарта LTO-9 имеют физический объем
18ТБ и могут вмещать до 45ТБ при сжатии информации.
Fujifilm и IBM создали ленточный накопитель объемом в 580 ТБ
Низкая стоимость. Стоимость хранения данных ($ за гигабайт)
для ленточных накопителей значительно ниже, чем для любых
других типов накопителей.
МТУСИ
33

34.

Инновации в СХД
1. Все более широкое использование твердотельных
накопители (SSD). SSD обеспечивают время отклика
менее 1 мс, снижение на 98 % энергопотребления на одну
операцию ввода-вывода, уменьшение веса на 58 % в
расчете на 1 Тб, повышение надежности из-за отсутствия
подвижных деталей.
2. Виртуальное выделение ресурсов. Благодаря
виртуальному выделению ресурсов снижается общая
стоимость владения, повышается уровень использования
емкости, упрощается выделение ресурсов, комплексный
мониторинг, уведомление и отчетность, поддерживаются
дополнительные возможности.
3. Технология «spin-down». Снижение скорости вращения дисков при неактивной
(например, в ночное время) системе.
4. Повышенная способность сохранения данных в случае отказа по питанию.
Обеспечивается встроенными источниками питания и/или за счет постоянного обмена
данными между кэш-памятью и первыми пятью дисками; последняя технология
обеспечивает сохранность данных при отказе по питанию в течение любого промежутка
времени.
МТУСИ
34

35.

5. Механизм проактивной замены диска (pro-active hot sparing) позволяет
определить диск, который выйдет из строя в ближайшее время, и начать перенос
данных на резервный диск без остановки сервисов и деградации производительности.
6. Технологии переноса данных между физическими дисками без остановки
сервисов, позволяющие также увеличивать размер хранилища, добавляя физические
диски.
7. Создание систем, предусматривающих возможность самостоятельной
установки, настройки и подключения оборудования, что позволяет заказчикам не
привлекать для этих работ сертифицированных специалистов вендора.
8. Использование ПО управления,
написанного и оптимизированного под
конкретное «железо», встроенного в
контроллерную пару или установленного
на отдельный сервер.
9. Создание в пределах одной дисковой группы логические хранилищ с разным
уровнем RAID для более эффективного расходования дисковых ресурсов, поскольку
при этом не требуется создавать отдельную дисковую группу для нового уровня
RAID.
10. Выполнение большинства операций на уровне микрокода, что обеспечивает
простое конфигурирование и настройку массива (для настройки требуется на 70%
меньше времени, чем у любой другой СХД).
МТУСИ
35

36.

Программно-определяемое
хранение
Актуальное направление в СХД - программно-определяемое (или
программируемое) хранение - Software Defined Storage (SDS). Этот термин
отражает общую тенденцию постепенного внедрения концепции
«программно-определяемого ЦОД» (Software Defined Data Center, SDDC).
Строгого определения SDS пока не существует, но обычно под программноопределяемым хранением понимают группу программ для хранения
данных, работающую на серверах, гипервизорах и в облаках, которая
должна независимо от оборудования с помощью виртуализации дисковых
ресурсов обеспечивать полный набор используемых для хранения
сервисов хранения (включая дедупликацию, репликацию и динамическое
выделение ресурсов).
В системах, реализующих концепцию SDS, отсутствуют
аппаратные компоненты. Аппаратной платформой решений SDS является
сервер x86, к которому для расширения емкости напрямую (а не через
сеть) подключены внешние дисковые полки (схема DAS). Для ускорения
доступа к данным в сервере вместе с жесткими дисками устанавливаются
твердотельные накопители, выполняющие функции кэш-памяти системы.
МТУСИ
36

37.

Программно-определяемое
хранение
Внедрение
технологии
SDS
обеспечивает
следующие
результаты, которые невозможно получить при использовании
традиционной виртуализации СХД:
координацию предоставления сервисов хранения (независимо от
того, где хранятся данные), для обеспечения требований
соглашения об обслуживании SLA (Service Level Agreement) с
помощью программного обеспечения;
улучшение
эффективности
использования
ресурсов
и
продуктивности персонала за счет обработки запросов на
сервисы и управления текущими операциями с помощью
программного обеспечения;
использование стандартного оборудования для уменьшения
зависимости от специализированного «железа» и реализация
всех интеллектуальных функций на уровне программного
обеспечения.
использование
общего набора интерфейсов прикладного
программирования (application programming interface – API) для
интеграции между собой различных сервисов хранения и
вычислений, сетевых и прикладных сервисов.
МТУСИ
37

38. Программно-определяемое хранение

Виртуализация
ресурсов
давно
применяется
в
СХД
корпоративного
класса.
Однако
раньше
она
чаще
всего
реализовывалась с помощью специализированных микросхем. SDS, в
дополнение к традиционной виртуализации ресурсов СХД, реализует
механизмы самообслуживания и использования политики управления,
значительно
упрощающие
администрирование
хранения
и
позволяющие легко и быстро предоставлять нужные данные и
дисковую емкость приложениям и пользователям.
Применение SDS решений существенно снижает расходы на
приобретение СХД по сравнению с традиционными дисковыми
массивами,
поскольку
использует
стандартное
серверное
оборудование. Они также легко масштабируются добавлением в
конфигурацию нового сервера. По мнению экспертов SDS решения
могут существенно изменить рынок СХД, дополнив его сектором
относительно дешевых горизонтально хорошо масштабируемых
решений на базе стандартного оборудования x86.
Решения SDS горизонтально-масштабируются до нескольких
десятков узлов и по максимальной емкости могут превосходить
традиционные дисковые массивы корпоративного класса, а также
обеспечивают высокий уровень отказоустойчивости благодаря
резервированию узлов.
МТУСИ
38

39. СХД на ДНК

В 2016 году корпорация Microsoft объявила о покупке 10
миллионов волокон синтетической ДНК для исследования
возможностей построения устройств хранения данных на основе
молекул из генетического кода. Исследователи из Microsoft
намерены выяснить, каким образом молекулы, из которых
состоит генетический код человека и всех живых существ, могут
быть использованы для кодирования цифровой информации.
До разработки коммерческой продукции пока еще очень
далеко, однако первичные тесты показали, что синтетическая
ДНК позволяет расшифровать 100% данных, закодированных с
ее помощью.
Новая технология призвана решить проблему Больших
данных, количество которых удваивается каждые два года.
Системы хранения, построенные на основе синтетических ДНК,
смогут обойти две ключевых проблемы нынешних СХД –
ограниченный срок жизни носителей и низкую плотность
хранения. Специалисты ожидают, что носители на основе ДНК
смогут сохранять информацию до 2 тыс. лет, а в устройстве
весом один грамм может поместиться 1 Зетабайт (270).
МТУСИ
39

40.

В
рамках
проведенного
эксперимента
были
сконвертированы бесчисленные ряды единиц и нулей с четырех
образов диска в четыре основания ДНК — аденин, гуанин, тимин
и цитозин. Был произведен и обратный процесс — найдены
нужные последовательности уже в полной цепочке ДНК и
реконструированы образы диска без каких-либо потерь, причем
в ходе этого процесса не «потерялось» ни одного байта.
Возможность хранения информации в течение сотен или
даже тысяч лет выгодно отличает «ДНК-память» от привычных
сегодня способов хранения цифровой информации — жестких
дисков, твердотельных накопителей, магнитных и оптических
дисков. Последние сохраняют работоспособность только в
течение нескольких лет или, максимум, нескольких десятилетий.
Сегодня главный барьер на пути внедрения «ДНКпамяти» — высокая стоимость производства, а также
эффективность, с которой ДНК можно синтезировать и
считывать в больших масштабах.
МТУСИ
40

41. MED

Компания Huawei разрабатывает инновационную
технологию магнитоэлектрических дисков для
архивирования данных с кодовым названием
OceanStor Arctic. Впервые об этой разработке
производитель упомянул в ходе международной
выставки электроники MWC 2024. Отмечается,
что новая технология хранения данных позволит
на 20 % снизить общую стоимость подключения
по сравнению с магнитными лентами и на 90 %
снизить энергопотребление по сравнению с
жёсткими дисками.
МТУСИ
41

42.

По словам Huawei, магнитоэлектрический диск (MED) представляет собой
инновационную разработку в области магнитных носителей. Первое поколение
MED будет предлагаться в виде дисков большой ёмкости. Общая ёмкость
серверной стойки на базе таких дисков составит более 10 Пбайт. При этом её
потребляемая мощность будет ниже 2 кВт. Первое поколение дисков MED
будет предназначено для архивного хранения данных. Такие диски должны
появиться в продаже примерно в первой половине 2025 года.
МТУСИ
42

43.

Портал Tom’s Hardware в качестве сравнения приводит типичную серверную
стойку формата 42U, которая может вмещать до 288 жёстких дисков, общим
объёмом до 8,64 Пбайт, если в расчёт берутся, например, новейшие жёсткие
диски Seagate с технологией магнитной записи с подогревом (HAMR)
объёмом по 30 Тбайт каждый. Общее энергопотребление такой стойки
составит около 2,88 кВт.
Эксперты решили разобраться в том, что такое эти самые
магнитоэлектрические диски. Скорее всего, решили они, внутри
стандартного накопителя от Huawei размещены магнитные пластины с
дорожками. Возможно, они вращаются так же, как и пластины винчестеров.
Но что там за компоненты покрытия пластин используются, неясно. Кроме
того, у специалистов вызывает сильное сомнение то, что можно снизить
энергопотребление сразу на 90% — возможно, это чисто теоретический
минимальный показатель, который никогда не будет достигнут.
МТУСИ
43

44. А что еще?

Кроме того представили современную версию лазерного диска с емкостью сразу в
200 ТБ. Его разработала группа ученых и Шанхайского университета науки и
технологий (University of Shanghai for Science and Technology, Китай). Достаточно
долгое время они искали способ повышения емкости лазерного диска, и, похоже,
нашли. Конечно, такого рода носители информации можно будет использовать
лишь в ограниченном количестве отраслей, но бесполезными они явно не будут.
Чтобы повысить плотность записи, исследователи умудрились поместить по сто
регистрирующих слоёв на каждую сторону диска (для сравнения — у Blu-Ray их
всего по четыре). Это стало возможным благодаря комбинации высокопрозрачной
фоторезистивной плёнки и фемтосекундного лазера. Кроме того, пленка
легирована особым эмиссионным красителем. под действием лазера он застывает,
формируя «дорожки» с записанной информацией.
По словам представителей команды, диск будет еще и долговечным — его можно
будет считать через 50-100 лет после записи. А за счет размера, который
идентичен обычным DVD, диски поместятся везде и всюду.
МТУСИ
44

45.

Есть и экзотические накопители. Например, прототип архивного носителя данных от компании
Cerebyte. Он предназначен для решения всех вышеуказанных проблем при помощи материала,
который отличается большой емкостью, быстротой, низкой стоимостью и способен прослужить
людям тысячи лет. Устройство имеет стеклянную подложку — небольшой квадрат или гибкую
ленту из Gorilla Glass или Corning, на которую нанесены слои керамики толщиной от 50 до 100
атомов.
Данные записываются на керамическом покрытии при помощи фемтосекундных лазерных
импульсов. Один импульс записывает 2 000 000 бит информации. Пластины для записи
планируется хранить в роботизированных хранилищах в стандартных 19-дюймовых модулях, а
для чтения требуются микроскопы высокого разрешения. Сохраненная информация будет
представлять собой массив микроточек, которые можно сравнить визуально с QR-кодом. Для
увеличения емкости, устройство может быть двусторонним и доступным только для чтения или
записи, но не для изменений.
МТУСИ
45

46.

МТУСИ
46

47.

По долговечности этот накопитель информации способен соперничать с
древними глиняными клинописными табличками, созданными шумерами
около 3,5 тыс лет назад. Считать информацию с носителя Cerebyte можно
будет и через 5 тыс. лет, а храниться на одном накопителе может до 10 ПБ
данных. При создании своего носителя данных инженеры компании
Cerabyte черпали вдохновение у глиняных табличек шумеров, которые на
протяжении тысяч лет сохраняют информацию. Эпос о Гильгамеше, одно
из самых древних произведений, был нанесен клинописью на глиняных
табличках целых 3800 лет назад. А рецепт месопотамского пива
(бесценный артефакт) — еще старше, его записали 5 тысяч лет назад.
Если стартап будет успешным, в 2030 году такие системы хранения
обретут массовую популярность, а HDD и SSD, возможно, станут
пережитком прошлого. У современных носителей информации, которые
используются для “холодного” хранения, есть недостатки. Магнитные и
оптические системы, обладающие необходимой скоростью, плотностью и
стоимостью не способны долго хранить информацию. Со временем все
они деградируют, кто быстрее, кто медленнее. Остальные технологии
либо недостаточно быстрые, либо слишком дорогие.
МТУСИ
47

48.

Учитывая, что неорганический керамический материал нанесен на
стеклянную подложку, он будет устойчив к большинству
неблагоприятных условий: к температурам от от -273°C до 300°C,
к кислотам и другим агрессивным средам, к электромагнитным
импульсам. Компания также прогнозирует, что затраты на
производства будут снижены до 75% по сравнению с
традиционных системами холодного хранения данных. Кроме того,
новый проект позволит сократить объем электронных отходов —
тех же HDD и SSD, массово выбрасываемых на свалки каждый
год. Далеко не все из них утилизируются.
Cerabyte планирует постепенно совершенствовать технологию.
Так, в 2024 году ожидается выпуск первого носителя
информации, оборудованного картриджами с несколькими
стеклами с керамическим покрытием.
Через несколько лет компания надеется научиться производить и
выпускать носители с гибкой стеклянной лентой большей емкости.
Предполагается, что первые устройства будут иметь емкость от 10
до 100 петабайт, с размерами битов от 100 до 3 нм. В следующем
поколении носителей плотность хранения материала достигнет 1
ТБ или более на один квадратный миллиметр.
МТУСИ
48
English     Русский Правила