Похожие презентации:
Построение уравнения регрессии. Урок № 37
1. Построение уравнения регрессии
Урок № 372. Основные вопросы темы:
Статистические методы выявлениявзаимосвязей
Исследование корреляционных связей
Построение уравнения регрессии
3. Дидактическая цель
Применение полученных знаний, умений инавыков в процессе выполнении
самостоятельной вычислительной работы.
Знать:
– статистические методы выявления
взаимосвязей;
Иметь представление:
– об исследовании наличия корреляционной
связи
4. Статистика
Статистика – это наука, котораяпозволяет увидеть закономерности в хаосе
случайных данных, выделить в них
устойчивые связи и определить наши
действия с тем, чтобы увеличить долю
правильно принятых решений.
5. Статистика
Каки
все
математические
науки,
статистика появилась из потребностей
сократить
случайные
данные
до
минимума. Но сделать это полностью
редко
когда
удается.
Применяя
статистические методы, мы стремимся
найти закономерности в случайных данных
и
воспользоваться
найденными
закономерностями.
6. Виды признаков
Все процессы и явления, окружающие нас,взаимосвязаны друг с другом.
При изучении конкретных связей одни
признаки выступают в роли факторов,
другие в роли результатов.
7. Виды признаков
• Так, например, уровень производительноститруда работников предприятия будет
зависеть от совершенства применяемого
оборудования, степени совершенства
технологии, организации производства труда
и управления и других самых различных
факторов.
8. Виды признаков
Факторный признак – это признак, накоторый
можно
оказать
какое-либо
воздействие, управлять им.
Результативный признак – это
признак, который является результатом
влияния этих факторов.
9. Виды признаков
При изучении зависимости междупроизводительностью труда рабочих и
энерговооруженностью их труда уровень
производительности труда является
результативным признаком, а
энерговооруженность труда рабочих —
факторным признаком, которым мы можем
управлять.
Например, можно повысить
энерговооруженность и воздействовать тем
самым на производительность труда, если
такая связь существует.
10. Статистические методы
• С помощью статистических методовизучения зависимостей можно установить,
как проявляется теоретически возможная
связь в данных конкретных условиях.
• Статистика не только отвечает на вопрос о
реальном существовании намеченной
теоретическим анализом связи, но дает
количественную характеристику этой
зависимости.
11. Статистические методы
Зная характер зависимости одного явленияот других
• можно объяснить причины и размер
изменений в явлении,
• планировать необходимые мероприятия
для дальнейшего его изменения.
12. Линейная зависимость
Простейшей формой зависимости междупеременными является линейная
зависимость.
Проверка ее параметров является одним
из важнейших направлений в приложениях
математической статистики.
13. Вопросы о линейной зависимости
Существуют два вопроса о линейнойзависимости:
1. Связаны ли между собой линейно
переменные X и Y ?
2. Какова формула связи переменных
и Y?
X
14. Вопросы о линейной зависимости
• В первом случае переменные X и Yвыступают как равноправные, здесь нет
независимой и зависимой переменных.
• Во втором случае речь может идти о
нахождении зависимости одной переменной
от другой.
15. Вопросы о линейной зависимости
• Например, оценивание формулыŷ(х) = а0 + а1х
(где a0 и а1 — неизвестные коэффициенты
такой зависимости).
В этом случае
переменная X является независимой
(объясняющей),
переменная Y— зависимой (объясняемой).
16. Вопросы о линейной зависимости
• Вопрос о нахождении формулы зависимостиможно ставить после положительного ответа на
вопрос о существовании такой зависимости, но
эти два вопроса можно решать и одновременно.
• Для ответа на поставленные вопросы
существуют специальные статистические
методы и, соответственно, показатели,
значения которых свидетельствуют о наличии
или отсутствии линейной связи между
переменными.
17. Вопросы о линейной зависимости
• В первом случае это коэффициенткорреляции величин X и Y.
• Во втором случае — коэффициенты
линейной регрессии а0 и а1, их
стандартные ошибки и t-статистики,
по значениям которых проверяется гипотеза
об отсутствии связи величин Х и Y.
18. Исследование корреляционных связей
Корреляционная связь анализируетзависимость среднего значения
результативного признака y от изменения
факторного признака x.
19. Исследование корреляционных зависимостей
Исследование корреляционных зависимостейвключает в себя ряд этапов:
1) Предварительный анализ свойств
совокупности;
2) Установление факта наличия связи,
определение ее направления и формы;
3) Измерение степени тесноты связи между
признаками;
4) Оценка связи, полученной по выборочным
данным для всей генеральной совокупности.
20. Методы оценки
Для оценки корреляционной связи междупризнаками, заданными рядом наблюдений,
существуют различные методы.
По направлению различают прямую и
обратную связь.
Чтобы определить связь, иногда используют
предварительный анализ: параллельное
сравнение данных, графический метод
(построение поля корреляции).
21. Поле корреляции
Полем корреляции называетсясовокупность точек результативного и
факторного признаков.
22. Построение поля корреляции
Для построения поля корреляции по осиабсцисс откладываются значения
факторного признака, а по оси ординат –
соответствующие значения
результативного.
На их пересечении ставится точка.
Множество точек и образует поле
корреляции.
По нему можно судить о величине
разброса значений и о наличии связи.
23. Критерии оценки
Для более точной числовой оценки наличияи тесноты связи между признаками
используют различные критерии:
коэффициент Фехнера,
критерий Пирсона,
коэффициент корреляции.
Наиболее точный вывод о наличии или
отсутствии корреляционной связи дает
линейный коэффициент корреляции.
24. Линейный коэффициент корреляции
nr
( x x)( y y)
i 1
i
i
n x y
Где n – объем выборки
x i, y i - выборочные значения соответствующих
признаков;
x ср, y ср - среднее арифметическое выборочных значений
соответствующих признаков;
σx, σy - средние квадратические отклонения выборочных
значений.
25. Корреляционная связь
Коэффициент корреляции принимает значенияв интервале [-1;1].
Близость расчетного коэффициента к - 1
свидетельствует о наличии тесной обратной
связи между исследуемыми признаками.
Коэффициент корреляции, приближающийся
к +1, свидетельствует о прямой зависимости.
Незначительное отклонение коэффициента
корреляции от нуля означает отсутствие связи.
26. Корреляционная связь
Коэффициент корреляции оценивают с помощьюкритерия Стьюдента, проверка которого
осуществляется по следующему алгоритму:
1) Выдвигается гипотеза: «Между переменными не
существует линейной связи».
2) Альтернативная гипотеза: между переменными х и у
существует некая линейная связь
Для оценки этих двух гипотез используем критерий
Стьюдента:
t расч.
r n 2
1 r
2
27. Корреляционная связь
Расчетное значение критерия сравниваем стабличным значением t-распределения
Стьюдента для уровня значимости α = 1 - γ.
Если t-распределения больше t-табличного, то с
вероятностью γ = 1 - α можно утверждать что
между переменными существует некая связь
Если t-распределения меньше или равно tтабличному то с вероятностью γ можно
утверждать что между переменными не
существует линейной связи.
28. Построение уравнения регрессии
Если значениякоэффициента
свидетельствует о
наличии связи, можно
переходить к
построению модели
линейной регрессии.
Приблизительное
представление о
линии связи можно
получить на основе
эмпирической линии
регрессии.
29. Построение уравнения регрессии
Метод наименьших квадратовиспользуется для нахождения такой функции,
которая наилучшим образом соответствует
.
эмпирическим
данным, т. е. сумма квадратов
отклонений эмпирических точек от
теоретической линии регрессии минимальна.
Теоретическая линия регрессии может быть
представлена прямой:
ŷ(х) = а0 + а1х
30. Построение уравнения регрессии
Для определения коэффициентов линейнойрегрессии используются следующие
формулы:
y
a1 r
x
a y a x
1
0
31. Построение уравнения регрессии
Решив систему уравнений, получаемзначения а0 и а1, которые подставляются в
уравнение линейной регрессии:
ŷ(х) = а0 + а1х
Параметр а1 в уравнении называют
коэффициентом регрессии, который показывает
на сколько в среднем изменится величина
результативного признака у при изменении
факторного признака х на единицу.
32. Построение уравнения регрессии
Произведенные вычисления позволяютпроизводить вычисление коэффициента
корреляции и параметров уравнения
регрессии одновременно.
33. Основные вопросы темы
Дать понятие факторного признака.Что такое результативный признак?.
Что называется полем корреляции?
Как оценить коэффициент корреляции?
С помощью какого критерия оценивают
коэффициент корреляции?
34. Домашнее задание
ЛитератураКалинина В. Н.
Глава 12.
Корреляционно-регрессионный анализ.