ИИ-ИНЖИНИРИНГ
15.58M

ЦК, Занятие № 5 (семинар)

1. ИИ-ИНЖИНИРИНГ

Дисциплина «Цифровая культура»
ЗАНЯТИЕ № 5

2.

ОБСУЖДЕНИЕ
ВЫПОЛНЕННЫХ ДОМАШНИХ
ЗАДАНИЙ

3.

НАПОМИНАНИЕ
ДОМАШНЕЕ ЗАДАНИЕ
1. Создать своего чат бота в Mistral
2. Выслать ссылку преподавателю
3. Описать сопроводительным письмом «что делает
ваш бот и почему вы решили сделать его именно
таким?»

4.

ОБСУЖДАЕМ
ПРОВОДИМ РЕФЛЕКСИЮ
«ВАШИ ОЩУЩЕНИЯ И ЧУВСТВА ПРИ ВЫПОЛНЕНИИ ДЗ»

5.

ЗАДАЧА НА 20 МИНУТ
(РАНЕЕ ОБСУЖДАЛИ НА ЛЕКЦИИ)

6.

ЗАДАНИЕ НА ОБРАБОТКУ ДАННЫХ, ВИЗУАЛИЗАЦИЮ И «ПОДОЗРИТЕЛЬНОСТЬ»
Цель:
подготовить аналитическое предложение для венчурного инвестирования 10 млн рублей на основе
данных с сайта Innoagency
В рамках задачи необходимо:
1) Зайти на сайт «Венчурные инвестиции РФ» , после – в раздел «все направления»
или сразу по ссылке (QR-код):
https://ventureguide.i.moscow/investments/?map=spheres&mapinvest=dollars&exits=0
2) Создать Excel-таблицу на рабочем столе, дать название «ЦК, [ваши ФИО], [дата]»
3) Скопировать данные с сайта (см. следующий слайд)
4) Вставить данные в свою таблицу
5) Совершить «пред_обработку» данных для анализа
6) Построить «тепловую карту», найти «подозрительности»
7) Определить что и на предмет чего вы обрабатываете. Возможно использоваться GPT
8) Обработать и проанализировать данные, построить не менее 3-х визуализаций данных
9) Подготовить аналитическое предложение с обоснованием «куда и почему мы инвестируем» (какое
тематическое направление), размер не более 1 А4
10) Направить вашему преподавателю по истечению времени выполнения задачи
https://ventureguide.i.moscow/investm
ents/?map=spheres&mapinvest=dollars
&exits=0

7.

ЗАДАНИЕ НА ОБРАБОТКУ ДАННЫХ, ВИЗУАЛИЗАЦИЮ И «ПОДОЗРИТЕЛЬНОСТЬ»
Цель:
подготовить аналитическое предложение для венчурного инвестирования 10 млн рублей на основе
данных с сайта Innoagency
В рамках задачи необходимо:
1) Зайти на сайт «Венчурные инвестиции РФ» , после – в раздел «все направления»
или сразу по ссылке (QR-код):
https://ventureguide.i.moscow/investments/?map=spheres&mapinvest=dollars&exits=0
2) Создать Excel-таблицу на рабочем столе, дать название «ЦК, [ваши ФИО], [дата]»
3) Скопировать данные с сайта (см. следующий слайд)
4) Вставить данные в свою таблицу
5) Совершить «пред_обработку» данных для анализа
6) Построить «тепловую карту», найти «подозрительности»
7) Определить что и на предмет чего вы обрабатываете. Возможно использоваться GPT
8) Обработать и проанализировать данные, построить не менее 3-х визуализаций данных
9) Подготовить аналитическое предложение с обоснованием «куда и почему мы инвестируем» (какое
тематическое направление), размер не более 1 А4
10) Направить вашему преподавателю по истечению времени выполнения задачи
https://ventureguide.i.moscow/investm
ents/?map=spheres&mapinvest=dollars
&exits=0

8.

9.

20 МИНУТ
НА ВЫПОЛНЕНИЕ ЗАДАНИЯ

10.

МОЛОДЦЫ

11.

ПЕРЕХОДИМ
К СЛЕДУЮЩЕМУ ЗАДАНИЮ
30 МИНУТ
ЗАДАЧА КОМПАНИИ
«СЕВЕРСТАЛЬ»

12.

ЗАДАНИЕ НА ОБРАБОТКУ ДАННЫХ, ВИЗУАЛИЗАЦИЮ И «ПОДОЗРИТЕЛЬНОСТЬ»
Цель:
подготовить аналитическое предложение для венчурного инвестирования 10 млн рублей на основе
данных с сайта Innoagency
В рамках задачи необходимо:
1) Зайти по ссылке или QR-коду на гугл-папку:
https://drive.google.com/drive/folders/10110IvVQGiIVGbGrmRZJ-AE6qaIfBnKE
2) Скачать файл «Задание_1_2023 (Северсталь) на свой рабочий стол, дать название «ЦК,
Северсталь, [ваши ФИО], [дата]»
3) В файле будет 6 листов (внутри документа)
4) Прочитать задание каждого листа (см. следующий слайд), приступить к выполнению в любом
удобном для вас виде (главное выполнять задание на том же листе, что и постановка задачи)
5) Направить вашему преподавателю по истечению времени выполнения задачи
https://drive.google.com/drive/folders/1
0110IvVQGiIVGbGrmRZJ-AE6qaIfBnKE

13.

Туть: название нужного файла. Свертесь.
Туть: постановка задачи в каждом листе. Будьте
внимательными.
Туть: постановка задачи в каждом листе. Будьте
внимательными.
Туть: кол-во заданий.

14.

НА ОСТАВШИХСЯ СИЛАХ
ЧУТОК ТЕОРИИ

15.

ОСНОВЫ СТАТИСТИКИ
средние значения, медиана, мода, дисперсия, стандартное отклонение
набор методов для краткого описания основных характеристик
данных через числовые показатели и визуализацию

16.

ОСНОВЫ СТАТИСТИКИ
Вопрос № 1: где сосредоточены данные?
(меры центральной тенденции)
Вопрос № 2: Насколько они разбросаны?
(меры вариации)

17.

ОСНОВЫ СТАТИСТИКИ
(меры центральной тенденции)

18.

19.

20.

МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ
МЕРА ЦЕНТРАЛЬНОЙ
ТЕНДЕНЦИИ
в статистике
число, служащее для описания множества значений одним единственным числом (для краткости)
Арифметическое среднее
сумма всех наблюденных значений, делённая на их
количество
Взвешенное среднее
среднее значение, учитывающее весовые коэффициенты
для каждого значения
Винсоризованное среднее
среднее арифметическое, при расчёте которого все исключенные min и max
значения заменяются на max и min «оставшиеся» значения соответственно
Медиана
Мода
Усеченное среднее
значение, которое делит упорядоченные по возрастанию
(убыванию) наблюдения пополам
наиболее часто встречающееся значение
арифметическое среднее после удаления установленного
(исследователем) процента max и min значений

21.

МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ
Обобщение больших
объемов данных
Сравнение разных выборок
или групп
Простота интерпретации
Идентификация
«типичного» значения
Простота использования в
моделях и анализе
Устойчивость к выбросам

22.

МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ
Экономика
Медицина
Медиана доходов лучше отражает благосостояние
большинства, чем среднее, если есть сильное неравенство
Мода помогает определить самый частый симптом
заболевания у пациентов
Образование
Ритейл
Средний балл студентов позволяет сравнить эффективность
учебных программ
Анализ моды покупок помогает оптимизировать
ассортимент товаров
Клинические исследования
Мониторинг эпидемий
В клинических исследованиях сравнивают средние
показатели в группах пациентов, получающих разные виды
лечения, для оценки эффективности лечения
Среднее количество новых случаев заболевания в день
может использоваться для мониторинга распространения
инфекционных заболеваний

23.

МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ

24.

МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ
АРИФМЕТИЧЕСКОЕ СРЕДНЕЕ
разновидность среднего значения, является
одной из наиболее распространённых мер
центральной тенденции
не может заменить полное описание
полученной выборки
подвержено влиянию выбросов –
значений, сильно отличающихся от
остальных значений переменной величины

25.

МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ

26.

МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ
ВЗВЕШЕННОЕ СРЕДНЕЕ
величина, вычисляемая на основе чисел,
«ценность» или «вес» которых не равнозначны
общее название группы разновидностей
среднего значения либо короткое название
для любого из перечисленных:
СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ ВЗВЕШЕННОЕ
Среднее геометрическое взвешенное
Среднее гармоническое взвешенное
Среднее степенное взвешенное

27.

МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ
ВИНСОРИЗОВАННОЕ СРЕДНЕЕ
статистическая мера, которая изменяет
традиционное среднее арифметическое, чтобы
уменьшить влияние выбросов в наборе данных
(экстремальные значения могут исказить
результаты и привести к вводящим в
заблуждение интерпретациям)
некую конволюцию среднего арифметического
и усеченного среднего
Расчет сводится к тому, что
k% наибольших и k% наименьших значений
заменяется
наименьшими и наибольшими значениями
из оставшегося массива данных,
после чего рассчитывается среднее
арифметическое.

28.

МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ
ВИНСОРИЗОВАННОЕ СРЕДНЕЕ
предполагает систематический подход к обработке выбросов
процесс начинается с определения желаемого уровня винсоризации, который обычно выражается в
процентах
например, 10%-ная винсоризация означает, что будут заменены самые низкие 10% значений и самые
высокие 10% значений в наборе данных
значения, заменяющие эти крайние значения, представляют собой следующие по величине и наименьшему
значениям, попадающие в оставшиеся 80% данных
эта корректировка помогает смягчить влияние экстремальных значений, позволяя более точно представить
основную тенденцию данных.

29.

МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ

30.

МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ
МЕДИАНА
число, которое находится в середине этого
набора, если его упорядочить по возрастанию, то
есть такое число, что половина чисел из набора
не меньше него, а другая половина не больше

31.

МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ

32.

МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ
МОДА
одно или несколько значений во множестве
наблюдений, которое встречается наиболее
часто (мода = типичность)
иногда в совокупности встречается более чем
одна мода, в данном случае модой будет
арифметическое среднее всех мод

33.

МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ
МОДА
Практическое применение моды
если вы хотите узнать, какой товар наиболее
популярен среди покупателей, или какой ответ
на опрос был выбран чаще всего, мода может
дать вам эту информацию
не учитывает все значения в наборе данных и
может быть менее полезна, если ваши данные
имеют несколько мод или если они равномерно
распределены
гистограмма для числового ряда {2, 3, 4, 4, 5, 5, 5, 6, 6, 7}
число 5 встречается три раза, что является наибольшим
количеством повторений среди всех чисел в наборе данных.
Таким образом, мода этого набора данных равна 5

34.

ЗАДАНИЕ НА ДОМ
1.
Найти на просторах интернета книгу «Статистика и котики»
2.
Прочитать её
3.
Найти дополнительную информацию
4.
«Понять и выучить» когда, при каких обстоятельствах
применяются меры центральной тенденции
5.
Самостоятельно изучить: взвешенное среднее,
винсоризованное среднее, усеченное среднее
English     Русский Правила