«Методы построения калибровочных моделей для прогнозирования свойств индивидуальных углеводородов»
Интеллектуальный анализ данных
Примеры применения
Интеллектуальный анализ данных в нефтегазовой отрасли
Хемометрика
Методы определения ОЧ
Методика определения ОЧ
Компоненты модельных смесей бензинов
Исходные данные
Результаты спектроскопии
Подготовка данных
Регрессия на главные компоненты
Нейронные сети
PLS
Деревья решений (регрессии)
Сравнение результатов
Сравнение результатов
Сравнение моделей
Сравнение моделей
Сравнение моделей
Сравнение моделей
Сравнение моделей
Сравнение моделей
Сравнение моделей
Выводы
1.30M
Категория: ИнформатикаИнформатика

Методы построения калибровочных моделей для прогнозирования свойств индивидуальных углеводородов

1. «Методы построения калибровочных моделей для прогнозирования свойств индивидуальных углеводородов»

2. Интеллектуальный анализ данных

Интеллектуальный анализ данных (ИАД) или Data mining:
Исследование и обнаружение вычислительной машиной (алгоритмами, средствами искусственного
интеллекта) в сырых данных скрытых знаний, которые ранее были не известны, нетривиальны,
практически полезны, доступны для интерпретации человеком.

3. Примеры применения

Казначейство США
◦ Финансовые преступления - поиск подозрительных транзакций
Управление по борьбе с наркотиками
◦ Анализ телефонных переговоров подозреваемых
HSBC
◦ Снижение затрат на рассылки за счет анализа клиентской базы
Финансовая группа Capital One
◦ Анализ клиентской базы и подбор соответствующих продуктов и идентификация мошенников
BBC
◦ Использование ИАД для составление сетки вещания
Boeing
◦ Улучшение тех. процессов
Southern California Gas Company
◦ Применение ИАД как средства стратегического маркетинга

4. Интеллектуальный анализ данных в нефтегазовой отрасли

Основное направление – анализ геологических данных.
◦ Классификация коллектор – не коллектор.
◦ Анализ изображений в литологии.
Регрессионный анализ и деревья решений
◦ Зависимости между уплотнением сетки скважин и характеристиками месторождения.
◦ Зависимости между оценками конечной (суммарной) добычи и геологическими/пластовыми характеристиками.
Нейронные сети
◦ Идентификация литофаций с помощью карт Кохонена.
◦ Прогнозирование оценки конечной (суммарной) добычи из геологических характеристик.
Визуализация и поиск трендов
Хемометрика
◦ Контроль качества
◦ Экспресс-методы анализа

5. Хемометрика

Хемометрика – это химическая дисциплина, применяющая математические,
статистические и другие методы, для построения или отбора оптимальных методов
измерения и планов эксперимента, а также для извлечения наиболее важной информации
при анализе экспериментальных данных

6. Методы определения ОЧ

• Моторные методы:
Арбитражные
Экспресс
• ГОСТ Р 52946-52947-2008
• ГОСТ 8226-82
• ГОСТ 511-82
• ASTM D2699 – 2700
• EN ISO 5163 - 5164:2005
• Хроматография
• По диэлектрической проницаемости
• ИК-Фурье-спектрометрия
• По показателю преломления

7. Методика определения ОЧ

Углеводород
Измерение
спектра
Диапазон длин волн:400- 4000,
4000-12500 см-1 ,
Оптическое разрешение: 2 см-1
Построение
градуировочной
модели
Предсказание
ОЧ
Выбор характеристических областей.
Использование метода ПЛС с кроссвалидацией

8. Компоненты модельных смесей бензинов

Индивидуальные
углеводороды
Для предсказания ОЧ использовались индивидуальные углеводороды,
потенциально входящие в состав бензинов (23 соединения).
Н-парафины (Нормальные алканы) – 4 - вещества
Изо-парафины (Метилы) – 11 веществ
Арены (Ароматические) – 8 веществ

9. Исходные данные

10. Результаты спектроскопии

Спектры углеводородов в БИК-диапазоне
(NIR)(4000-12000 см-1)
Спектры углеводородов в среднем ИКдиапазоне(MIR) (400-4000 см-1)

11. Подготовка данных

Импорт данных в RapidMiner Studio
Использование Метода главных компонент
Метод Главных Компонент (англ. Principal Components
Analysis, PCA) — один из основных способов уменьшить
размерность данных, потеряв наименьшее количество
информации.

12. Регрессия на главные компоненты

I
МГК
II
Многомерная
Линейная
Регрессия
Многомерная линейная
регрессия — это линейная
регрессия в n-мерном
пространстве. Задачей
множественной линейной
регрессии является построение
линейной модели связи между
набором непрерывных
предикторов и непрерывной
зависимой переменной.
Регрессионный анализ используется для прогноза, анализа
временных рядов, тестирования гипотез и выявления
скрытых взаимосвязей в данных.

13. Нейронные сети

Иску́сственная нейро́нная се́ть (ИНС) — математическая модель, построенная по
принципу организации и функционирования биологических нейронных сетей — сетей
нервных клеток живого организма.
Оператор перебора параметров
Optimize parameters (Grid)

14. PLS

15. Деревья решений (регрессии)

Дерево решений – бинарное дерево, где в каждом узле происходит проверка условия
Каждая ветвь представляет собой результат такой проверки. В каждом листе получается
предсказанное значение

16. Сравнение результатов

Октановое число для 3-х классов веществ и всех веществ, в среднем ИК диапазоне
Группы веществ
PLS
изо-алканы
Ароматические углеводороды
алканы
все вещества
2,47
0,02
0,48
1,57
Деревья решений
31,13
2,97
177,20
72,64

17. Сравнение результатов

Октановое число для 3-х классов веществ и всех веществ, в ближнем ИК диапазоне
Группы веществ
PLS
изо-алканы
Ароматические углеводороды
алканы
все вещества
3,17
0,31
3,94
2,90
Деревья решений
64,71
7,76
194,91
62,25

18. Сравнение моделей

ОКТАНОВОЕ ЧИСЛО
MIR
14,758
16
NIR
14
10,840
12
RMSE
10
9,849
7,375
7,184
8
5,969
6
2,903
4
1,567
2
0
PLS(OPUS)
PCR
Методы
NN
PLS

19. Сравнение моделей

PCR
RMSE (MIR)
30,000
26,134
25,000
NN
23,972
22,085
22,382
20,000
13,249
11,648
15,000
10,000
7,184 7,375
4,799 4,305
5,000
0,000
ОКТАНОВОЕ
ЧИСЛО
ТЕМПЕРАТУРА
КИПЕНИЯ
КОЭФФИЦИЕНТ
ПРЕЛОМЛЕНИЯ
МОЛЯРНАЯ
РЕФРАКЦИЯ
ПЛОТНОСТЬ

20. Сравнение моделей

RMSE (NIR)
30,000
27,198
PCR
NN
25,000
17,727
20,000
24,864
16,872
15,121
15,000
10,840
9,351
10,000
5,969
4,892 4,998
5,000
0,000
ОКТАНОВОЕ
ЧИСЛО
ТЕМПЕРАТУРА
КИПЕНИЯ
КОЭФФИЦИЕНТ
ПРЕЛОМЛЕНИЯ
МОЛЯРНАЯ
РЕФРАКЦИЯ
ПЛОТНОСТЬ

21. Сравнение моделей

PСR
30,000
26,13427,198
MIR
NIR
25,000
23,97224,864
20,000
15,121
13,249
15,000
10,840
10,000
7,184
4,799 4,892
5,000
0,000
ОКТАНОВОЕ
ЧИСЛО
ТЕМПЕРАТУРА
КИПЕНИЯ
КОЭФФИЦИЕНТ
ПРЕЛОМЛЕНИЯ
МОЛЯРНАЯ
РЕФРАКЦИЯ
ПЛОТНОСТЬ

22. Сравнение моделей

NEURAL NET
25,000
22,382
20,000
MIR
NIR
17,727
22,085
16,872
15,000
10,000
11,648
9,351
7,375
5,969
4,305 4,998
5,000
0,000
ОКТАНОВОЕ
ЧИСЛО
ТЕМПЕРАТУРА
КИПЕНИЯ
КОЭФФИЦИЕНТ
ПРЕЛОМЛЕНИЯ
МОЛЯРНАЯ
РЕФРАКЦИЯ
ПЛОТНОСТЬ

23. Сравнение моделей

Октановое Число (MIR)
18,000
PCR
NN
15,511
16,000
14,000
12,000
10,000
8,000
6,000
4,000
2,000
3,849
2,597
3,092
1,560
1,061
0,000
АРОМАТИКА
ИЗО-ПАРАФИНЫ
АЛКАНЫ

24. Сравнение моделей

Октановое Число (NIR)
9,000
PCR
NN
7,663
8,000
7,000
6,000
5,000
3,401
4,000
3,000
3,737
2,226
2,000
1,000
0,880
0,696
0,000
АРОМАТИКА
ИЗО-ПАРАФИНЫ
АЛКАНЫ

25. Выводы

Результатом
реализации
рассмотренных
методик
стали
модели,
способные
спрогнозировать химические и физические свойства индивидуальных углеводородов по их
среднему и ближнему инфракрасному спектру. Полученные модели были исследованы и
оценены, проведено детально сравнение этих моделей между собой. Данные модели могут
быть применены на производстве углеводородов в качестве методов экспресс-анализа
веществ и для контроля в реальном времени.
English     Русский Правила