Похожие презентации:
ЦК, Занятие № 5 (семинар)
1. ИИ-ИНЖИНИРИНГ
Дисциплина «Цифровая культура»ЗАНЯТИЕ № 5
2.
ОБСУЖДЕНИЕВЫПОЛНЕННЫХ ДОМАШНИХ
ЗАДАНИЙ
3.
НАПОМИНАНИЕДОМАШНЕЕ ЗАДАНИЕ
1. Создать своего чат бота в Mistral
2. Выслать ссылку преподавателю
3. Описать сопроводительным письмом «что делает
ваш бот и почему вы решили сделать его именно
таким?»
4.
ОБСУЖДАЕМПРОВОДИМ РЕФЛЕКСИЮ
«ВАШИ ОЩУЩЕНИЯ И ЧУВСТВА ПРИ ВЫПОЛНЕНИИ ДЗ»
5.
ЗАДАЧА НА 20 МИНУТ(РАНЕЕ ОБСУЖДАЛИ НА ЛЕКЦИИ)
6.
ЗАДАНИЕ НА ОБРАБОТКУ ДАННЫХ, ВИЗУАЛИЗАЦИЮ И «ПОДОЗРИТЕЛЬНОСТЬ»Цель:
подготовить аналитическое предложение для венчурного инвестирования 10 млн рублей на основе
данных с сайта Innoagency
В рамках задачи необходимо:
1) Зайти на сайт «Венчурные инвестиции РФ» , после – в раздел «все направления»
или сразу по ссылке (QR-код):
https://ventureguide.i.moscow/investments/?map=spheres&mapinvest=dollars&exits=0
2) Создать Excel-таблицу на рабочем столе, дать название «ЦК, [ваши ФИО], [дата]»
3) Скопировать данные с сайта (см. следующий слайд)
4) Вставить данные в свою таблицу
5) Совершить «пред_обработку» данных для анализа
6) Построить «тепловую карту», найти «подозрительности»
7) Определить что и на предмет чего вы обрабатываете. Возможно использоваться GPT
8) Обработать и проанализировать данные, построить не менее 3-х визуализаций данных
9) Подготовить аналитическое предложение с обоснованием «куда и почему мы инвестируем» (какое
тематическое направление), размер не более 1 А4
10) Направить вашему преподавателю по истечению времени выполнения задачи
https://ventureguide.i.moscow/investm
ents/?map=spheres&mapinvest=dollars
&exits=0
7.
ЗАДАНИЕ НА ОБРАБОТКУ ДАННЫХ, ВИЗУАЛИЗАЦИЮ И «ПОДОЗРИТЕЛЬНОСТЬ»Цель:
подготовить аналитическое предложение для венчурного инвестирования 10 млн рублей на основе
данных с сайта Innoagency
В рамках задачи необходимо:
1) Зайти на сайт «Венчурные инвестиции РФ» , после – в раздел «все направления»
или сразу по ссылке (QR-код):
https://ventureguide.i.moscow/investments/?map=spheres&mapinvest=dollars&exits=0
2) Создать Excel-таблицу на рабочем столе, дать название «ЦК, [ваши ФИО], [дата]»
3) Скопировать данные с сайта (см. следующий слайд)
4) Вставить данные в свою таблицу
5) Совершить «пред_обработку» данных для анализа
6) Построить «тепловую карту», найти «подозрительности»
7) Определить что и на предмет чего вы обрабатываете. Возможно использоваться GPT
8) Обработать и проанализировать данные, построить не менее 3-х визуализаций данных
9) Подготовить аналитическое предложение с обоснованием «куда и почему мы инвестируем» (какое
тематическое направление), размер не более 1 А4
10) Направить вашему преподавателю по истечению времени выполнения задачи
https://ventureguide.i.moscow/investm
ents/?map=spheres&mapinvest=dollars
&exits=0
8.
9.
20 МИНУТНА ВЫПОЛНЕНИЕ ЗАДАНИЯ
10.
МОЛОДЦЫ11.
ПЕРЕХОДИМК СЛЕДУЮЩЕМУ ЗАДАНИЮ
30 МИНУТ
ЗАДАЧА КОМПАНИИ
«СЕВЕРСТАЛЬ»
12.
ЗАДАНИЕ НА ОБРАБОТКУ ДАННЫХ, ВИЗУАЛИЗАЦИЮ И «ПОДОЗРИТЕЛЬНОСТЬ»Цель:
подготовить аналитическое предложение для венчурного инвестирования 10 млн рублей на основе
данных с сайта Innoagency
В рамках задачи необходимо:
1) Зайти по ссылке или QR-коду на гугл-папку:
https://drive.google.com/drive/folders/10110IvVQGiIVGbGrmRZJ-AE6qaIfBnKE
2) Скачать файл «Задание_1_2023 (Северсталь) на свой рабочий стол, дать название «ЦК,
Северсталь, [ваши ФИО], [дата]»
3) В файле будет 6 листов (внутри документа)
4) Прочитать задание каждого листа (см. следующий слайд), приступить к выполнению в любом
удобном для вас виде (главное выполнять задание на том же листе, что и постановка задачи)
5) Направить вашему преподавателю по истечению времени выполнения задачи
https://drive.google.com/drive/folders/1
0110IvVQGiIVGbGrmRZJ-AE6qaIfBnKE
13.
Туть: название нужного файла. Свертесь.Туть: постановка задачи в каждом листе. Будьте
внимательными.
Туть: постановка задачи в каждом листе. Будьте
внимательными.
Туть: кол-во заданий.
14.
НА ОСТАВШИХСЯ СИЛАХЧУТОК ТЕОРИИ
15.
ОСНОВЫ СТАТИСТИКИсредние значения, медиана, мода, дисперсия, стандартное отклонение
набор методов для краткого описания основных характеристик
данных через числовые показатели и визуализацию
16.
ОСНОВЫ СТАТИСТИКИВопрос № 1: где сосредоточены данные?
(меры центральной тенденции)
Вопрос № 2: Насколько они разбросаны?
(меры вариации)
17.
ОСНОВЫ СТАТИСТИКИ(меры центральной тенденции)
18.
19.
20.
МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИМЕРА ЦЕНТРАЛЬНОЙ
ТЕНДЕНЦИИ
в статистике
число, служащее для описания множества значений одним единственным числом (для краткости)
Арифметическое среднее
сумма всех наблюденных значений, делённая на их
количество
Взвешенное среднее
среднее значение, учитывающее весовые коэффициенты
для каждого значения
Винсоризованное среднее
среднее арифметическое, при расчёте которого все исключенные min и max
значения заменяются на max и min «оставшиеся» значения соответственно
Медиана
Мода
Усеченное среднее
значение, которое делит упорядоченные по возрастанию
(убыванию) наблюдения пополам
наиболее часто встречающееся значение
арифметическое среднее после удаления установленного
(исследователем) процента max и min значений
21.
МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИОбобщение больших
объемов данных
Сравнение разных выборок
или групп
Простота интерпретации
Идентификация
«типичного» значения
Простота использования в
моделях и анализе
Устойчивость к выбросам
22.
МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИЭкономика
Медицина
Медиана доходов лучше отражает благосостояние
большинства, чем среднее, если есть сильное неравенство
Мода помогает определить самый частый симптом
заболевания у пациентов
Образование
Ритейл
Средний балл студентов позволяет сравнить эффективность
учебных программ
Анализ моды покупок помогает оптимизировать
ассортимент товаров
Клинические исследования
Мониторинг эпидемий
В клинических исследованиях сравнивают средние
показатели в группах пациентов, получающих разные виды
лечения, для оценки эффективности лечения
Среднее количество новых случаев заболевания в день
может использоваться для мониторинга распространения
инфекционных заболеваний
23.
МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ24.
МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИАРИФМЕТИЧЕСКОЕ СРЕДНЕЕ
разновидность среднего значения, является
одной из наиболее распространённых мер
центральной тенденции
не может заменить полное описание
полученной выборки
подвержено влиянию выбросов –
значений, сильно отличающихся от
остальных значений переменной величины
25.
МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ26.
МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИВЗВЕШЕННОЕ СРЕДНЕЕ
величина, вычисляемая на основе чисел,
«ценность» или «вес» которых не равнозначны
общее название группы разновидностей
среднего значения либо короткое название
для любого из перечисленных:
СРЕДНЕЕ АРИФМЕТИЧЕСКОЕ ВЗВЕШЕННОЕ
Среднее геометрическое взвешенное
Среднее гармоническое взвешенное
Среднее степенное взвешенное
27.
МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИВИНСОРИЗОВАННОЕ СРЕДНЕЕ
статистическая мера, которая изменяет
традиционное среднее арифметическое, чтобы
уменьшить влияние выбросов в наборе данных
(экстремальные значения могут исказить
результаты и привести к вводящим в
заблуждение интерпретациям)
некую конволюцию среднего арифметического
и усеченного среднего
Расчет сводится к тому, что
k% наибольших и k% наименьших значений
заменяется
наименьшими и наибольшими значениями
из оставшегося массива данных,
после чего рассчитывается среднее
арифметическое.
28.
МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИВИНСОРИЗОВАННОЕ СРЕДНЕЕ
предполагает систематический подход к обработке выбросов
процесс начинается с определения желаемого уровня винсоризации, который обычно выражается в
процентах
например, 10%-ная винсоризация означает, что будут заменены самые низкие 10% значений и самые
высокие 10% значений в наборе данных
значения, заменяющие эти крайние значения, представляют собой следующие по величине и наименьшему
значениям, попадающие в оставшиеся 80% данных
эта корректировка помогает смягчить влияние экстремальных значений, позволяя более точно представить
основную тенденцию данных.
29.
МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ30.
МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИМЕДИАНА
число, которое находится в середине этого
набора, если его упорядочить по возрастанию, то
есть такое число, что половина чисел из набора
не меньше него, а другая половина не больше
31.
МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ32.
МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИМОДА
одно или несколько значений во множестве
наблюдений, которое встречается наиболее
часто (мода = типичность)
иногда в совокупности встречается более чем
одна мода, в данном случае модой будет
арифметическое среднее всех мод
33.
МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИМОДА
Практическое применение моды
если вы хотите узнать, какой товар наиболее
популярен среди покупателей, или какой ответ
на опрос был выбран чаще всего, мода может
дать вам эту информацию
не учитывает все значения в наборе данных и
может быть менее полезна, если ваши данные
имеют несколько мод или если они равномерно
распределены
гистограмма для числового ряда {2, 3, 4, 4, 5, 5, 5, 6, 6, 7}
число 5 встречается три раза, что является наибольшим
количеством повторений среди всех чисел в наборе данных.
Таким образом, мода этого набора данных равна 5
34.
ЗАДАНИЕ НА ДОМ1.
Найти на просторах интернета книгу «Статистика и котики»
2.
Прочитать её
3.
Найти дополнительную информацию
4.
«Понять и выучить» когда, при каких обстоятельствах
применяются меры центральной тенденции
5.
Самостоятельно изучить: взвешенное среднее,
винсоризованное среднее, усеченное среднее