Средства DATA MINING в MATLAB
MATLAB
История создания
Ключевые особенности (1)
Ключевые особенности (2)
Математические пакеты для решения статистических задач
Постановка задачи
Ход работы
Этап 1
Этап 2
Этап 3
Результаты классификации
Спасибо за внимание!

Средства Data Mining в Matlab

1. Средства DATA MINING в MATLAB

Харченко Лилия
Юферов Александр
Неляпина Инна
С13-507

2. MATLAB

• MATLAB— пакет прикладных программ для решения задач
технических
вычислений
и
одноимённый
язык
программирования, используемый в этом пакете. Пакет
используют более миллиона инженерных и научных
работников, он работает на большинстве современных
операционных систем.

3. История создания

• Конец 1970-х годов, Университет НьюМексико, Клив Моулер
• 1983 год, Стэнфордский университе, Джон
Литтл
• 1984 год, “The MathWorks”

4. Ключевые особенности (1)

• Платформонезависимый высокоуровневый
язык программирования ориентированный
на матричные вычисления и разработку
алгоритмов
• Интерактивная среда для разработки кода,
управления файлами и данными
• Функции линейной алгебры, статистики,
анализ Фурье, решение дифференциальных
уравнений и др.

5. Ключевые особенности (2)

• Богатые средства визуализации, 2-D и
3-D графика
• Встроенные
средства
разработки
пользовательского интерфейса для
создания законченных приложений на
MATLAB

6. Математические пакеты для решения статистических задач

7. Постановка задачи

В настоящей работе проводится исследование
исходного набора характеристик в ключе его
влияния на значение «attrition» с целью построения
наиболее эффективного классификатора для
прогнозирования
снижения
трудоспособности
сотрудников.

8. Ход работы

• Этап 1 Подготовка исходных данных
• Этап 2 Анализ описательных статистик
• Этап 3 Классификация

9. Этап 1

10. Этап 2

Результаты корреляционного анализа

11. Этап 3


Метод опорных векторов;
Метод K-ближайших соседей;
Метод на основе деревьев решений;
Логистическая регрессия.

12. Результаты классификации

13.

• Проведенный анализ показал избыточность и
частичную взаимную корреляцию исходных
данных. Был сформирован новый набор
характеристик, позволяющий осуществлять
прогнозирование изменения значения attrition
путем решения задачи классификации с
точностью 88,2 %. Полученное решение
позволяет с высокой степенью вероятности
прогнозировать
изменения
работоспособности сотрудников фирмы.

14. Спасибо за внимание!

English     Русский Правила