40.37K
Категория: Английский языкАнглийский язык

Data Analyst (аналитик)

1.

Роль
Что делает
На чём фокус
Пример результата
Data Analyst (аналитик)
Достаёт данные, считает
метрики, строит отчёты и
графики
Понять, что произошло
и почему
Дашборд с продажами,
отчёт «почему упал
трафик»
Data Scientist (датасайентист)
Строит модели и проверяет
гипотезы, ищет закономерности
Предсказать будущее,
найти скрытые факторы
Модель прогноза спроса,
предсказание оттока
клиентов
ML Engineer (инженер
по ML)
Берёт модели и делает так,
чтобы они работали в
приложении/сервисе
Внедрить и
поддерживать работу
моделей
Чат-бот с ИИ,
рекомендательная система
в магазине
Data Engineer (инженер
данных)
Создаёт «трубы» для данных:
откуда брать, где хранить, как
обрабатывать
Чтобы у всех были
чистые и свежие
данные
Автоматический сбор
логов, витрина данных для
аналитиков
Research Scientist
(исследователь)
Придумывает новые алгоритмы
и методы
Двигать науку и делать
«прорывы»
Новая архитектура
нейросети, статья на
конференции
Data Engineer — строит дороги, по которым едут данные.
Data Analyst — ездит по дорогам и рассказывает, что он увидел.
Data Scientist — ищет закономерности и строит «предсказателей».
ML Engineer — ставит этих «предсказателей» на конвейер, чтобы они помогали в реальном
мире.
Research Scientist — изобретает новые машины, чтобы ездить ещё быстрее.

2.

alyst
Описательная/диагностическая
аналитика, BI
SQL-запросы, EDA, дашборды,
отчёты, ad-hoc ответы, A/Bанализ (интерпретация)
SQL, Excel, Power
BI/Looker/Tableau, базовая
статистика, Python/R
Дашборды, метрики, инсай
рекомендации
entist
Моделирование и причинноследственные выводы для
продукта/бизнеса
Формулировка гипотез,
фичеринг, обучение/валидация
моделей, экспериментирование,
интерпретация
Python (pandas, scikit-learn),
статистика/ML, базовый SQL,
визуализация, PyTorch/TF
Прототипы моделей, оценк
эффекта, рекомендации
neer
Продакшн моделей, MLOps и
масштабирование
Пайплайны обучения/инференса,
фичесторы, мониторинг, CI/CD,
оптимизация латентности и
стоимости
Python/Java, PyTorch/TF,
Docker/K8s, Airflow, Feast, FastAPI,
облака, мониторинг (Prometheus)
Надёжные сервисы ML в пр
автотренинг, мониторинг д
gineer
Инфраструктура и качество данных
Интеграции, ETL/ELT, датамоделирование
SQL, Spark/DBT, Airflow, Kafka,
облачные DWH
(BigQuery/Snowflake/Redshift)
Надёжные дата-пайплайны
витрины данных, SLA по да
h Scientist
Новые алгоритмы/методы
Исследования,
чтение/репликация статей,
разработка и оценка новых
архитектур
Математика/статистика, Python,
фреймворки DL,
CUDA/оптимизация (иногда),
эксперименты на кластерах
Публикации, внутренние
прототипы, патенты, лучши
метрики на benchmarks
Нюансы пересечения ролей:
Analyst ⇄ DS: оба делают анализ и эксперименты; у DS больше акцент на моделях/причинности.
DS ⇄ ML Eng: DS прототипирует, ML Eng доводит до продакшна и поддерживает.
ML Eng ⇄ Data Eng: оба строят пайплайны; у DE фокус на «сырых→чистых» данных, у MLE — на жизненном цикле
моделей.
DS ⇄ Research: Applied vs Research — прикладная польза здесь-и-сейчас против границ возможного.
English     Русский Правила