50%
ИТ-Инженер. Профессия Data Scientist
Получите востребованную IT-профессию. Вы узнаете, где и как собирать и обрабатывать данные, чтобы извлечь из них пользу для бизнеса. Научитесь подбирать эффективное решение для клиента и реализовывать с помощью машинного обучения. На PRO-версии программы вы погрузитесь в технологическую специализацию и сможете трудоустроиться через 9 месяцев в процессе обучения или сразу после него. Дата-сайентист превращает большие данные в пользу для бизнеса. Большие данные (Big Data) — это огромное количество различных данных различных форматов. В них входит любая информация: телефоны, эл. адреса, имена людей, действия клиентов, перемещения и многое другое.
Кто это?
Инженер Data Science нужен в компании, чтобы на основе данных и технического задания предложить работающую бизнес-модель и реализовать ее с помощью машинного обучения. Дата-сайентист — своего рода ученый. Он использует математическую статистику, логиче
Какие задачи решает?
Формирует техническое задание
Общается с бизнесом, уточняет его нужды и целесообразность использования машинного обучения. Собирает требования, формирует техническое задание. Принимает метрики эффективности будущей бизнес-модели.
Собирает и подготавливает базу данных
Внедряет инструменты, которые помогают автоматически получать и структурировать нужную информацию. Подготавливает их, размечает. Накидывает гипотезу о закономерности данных.
Разрабатывает модель машинного обучения
Переводит данные в формат, удобный для машинного обучения. Запускает пробное обучение, чтобы подтвердить гипотезы о данных. Если гипотеза жизнеспособна — получается первая версия бизнес-модели.
Внедряет бизнес-модель
Оценивает бизнес-модель на эффективность и безопасность. После внедряет в производственные процессы.
Где нужны?
Поиск и реклама в интернете
Поисковые системы используют алгоритмы Data Science, чтобы показать пользователю подходящий ему вариант. А компании используют поисковики для продвижения своих продуктов — рекомендации основываются на историях поиска пользователей.
Транспорт
Навигаторы, онлайн-карты и транспортные средства работают на основе науки о данных. Это помогает прогнозировать пробки, ситуации на дорогах, поломки транспорта, вовремя проводить техническое обслуживание.
Безопасность
Наука о данных помогает предотвратить преступления и найти виновных. Алгоритмы позволяют правоохранительным органам автоматизировать контроль безопасности с помощью данных как в открытых источниках, так и в источниках для спецслужб.
Медицина
Data Science в медицине применяется в здравоохранении и фармацевтике: диагностике, оптимизации работы врачей и клиник, подборе лечения на основании диагноза. Заболевания на ранней стадии также можно предсказать благодаря науке о данных.
Финансы
Использование Data Science дает финансовым компаниям возможность отличиться от конкурентов и оптимизировать внутреннюю структуру. А также выявить мошенничество и анализировать нужды и действия клиента.
Ритейл
Data Science анализирует историю продаж по каждому покупателю, статистику запросов в поисковых системах, время присутствия в магазине. Прогнозная модель помогает предсказать поведение покупателя или факторы, которые влияют на рост продаж.
В вашем портфолио будут сильные проекты
Предсказание оттока аудитории в соцсети
Проанализируете бриф от компании, организуете аналитическую базу данных и оцените лояльность аудитории. Аналитики будут работать с дашбордами и метриками, специалисты по машинному обучению научат модель предсказывать отток аудитории
Анализ мобильного приложения
Оцените, как новая функция повлияет на бизнес и пользователей. Подготовите модель, которая будет предсказывать время доставки
Работа с данными сервиса аренды
Будете проверять гипотезы продуктовой команды: поработаете с трафиком и целевыми каналами. Специалисты по машинному обучению построят модель для предсказания целевого действия
Модель кредитного риск-менеджмента
Поможете банку спрогнозировать платежеспособность клиента с помощью модели кредитного риск-менеджмента
Модель для поиска дублирующихся объявлений
Создадите модель, которая будет анализировать объявления в сервисе и находить дубликаты
Наши преподаватели — профессионалы из разных сфер
Кирилл Шмидт
Product analyst team lead в Citrix (США) и Wrike
Юлдуз Фаттахова
Team lead в SberData, Сбер
Владимир Ершов
Data solutions manager, Visa. В data science больше 7 лет
Артур Самигуллин
Product intelligence team lead в EQ SberDevices
Федор Ерин
Data scientist в Yousician
Алексей Железной
Middle+ дата-инженер в Wildberries
Василий Сизов
Team Lead IT-команды в ВТБ
Александр Горяинов
Доцент Московского авиационного института
Екатерина Малиборская
Основатель маркетингового и дизайн агентства EZmarket
Максим Кулаев
Руководитель команды в VK
Анна Николаева
Аналитик в VK
Илья Булгаков
Эксперт операционной поддержки продаж
Евгения Сумина
Программист-исследователь
Программа обучения
Основы Data Science
● Business Understanding. С чего начинается работа с данными ● Data Understanding. Excel ● Введение в Python ● Переменные и типы данных ● Условия ● Циклы ● Алгоритмы и структуры данных ● Функции ● Коллекции в Python ● Чтение файлов в Python и командной строке ● Библиотека Pandas ● Получение данных с помощью API ● Базы данных ● Язык запросов SQL ● Power BI ● Data Preparation ● Разведочный анализ данных. Data cleaning, data visualization, feature engineering ● Modeling ● Машинное обучение ● Линейные модели и нейронные сети ● Метрики в аналитике ● Маркетинговая аналитика ● Продуктовая аналитика ● Modeling. Заключение ● Evaluation ● Алгоритмы и структуры данных. Часть 2 ● Deployment ● Модель как API ● Мониторинг моделей ● Airflow
Машинное обучение (на выбор)
● Постановка задачи и терминология machine learning ● Выгрузка данных с помощью SQL ● Линейная регрессия и регуляризация ● Метрическая классификация. Метод ближайших соседей ● Библиотека numpy ● Линейная классификация: логистическая регрессия, опорные векторы, деревья решений ● Очистка данных ● Кластеризация: метод k-средних и DBSCAN ● Несбалансированные выборки ● Нейрон и нейронная сеть ● Основы анализа текстов
Аналитик данных (на выбор)
● Доступные источники данных, оценка качества ● Визуализация в Excel ● Объединение разнородных данных ● Требования к качеству данных ● Корреляция и факторы ● Визуализация в Python ● Формулирование гипотез по данным ● SQL для витрины данных ● Очистка данных ● Методы прогнозирования ● Программные средства визуализации ● A/B-тесты и их планирование ● Данные по API и аккумулирование источников ● Повышение качества данных ● Выявление закономерности в данных ● Прикладные программные продукты визуализации ● Интерпретация результатов А/В-тестирования ● Аналитическая отчетность и сторителлинг
Итоговый проект
● Выполните индивидуальный проект по внедрению модели ● Попробуете решить задачи дата-инженера, ML-инженера и дата-аналитика, чтобы выбрать специализацию
Дополнительный курс: Основы математики
● Базовые математические объекты и SymPy ● Интерполяция и полиномы ● Аппроксимация, преобразования функций и производные ● Функции нескольких переменных, их свойства и графики ● Частные производные функции нескольких переменных ● Векторs и матрицы. Градиент ● Линейная регрессия и системы линейных уравнений ● Задача аппроксимации как матричное уравнение
Дополнительный курс: Основы статистики и теории вероятностей
● Случайные величины и события ● Принципы и виды распределения ● Непрерывные распределения ● Статистисечкие тесты ● Составление моделей и проверка гипотез ● Gentle introduction. Теория вероятностей в Python ● Оценивание ● Проверка гипотез ● Совместные распределения ● Исследование зависимостей ● Временные ряды
Дополнительный курс: Развитие карьеры разработчика
● Поиск подходящих вакансий ● Подготовка к собеседованиям ● Переговоры с работодателем
Миру нужны ИТ-инженеры
Востребованно
Сейчас открыто более 7500 вакансий для начинающих разработчиков
Перспективно
К 2035 году в России будетболее 2,5 млн вакансий дляспециалистов из сферы IT
Высокооплачиваемо
Зарпалата начинающего IT-специалиста — от 60 000 ₽. А уже через три года —от 260 000 ₽
Учитесь и экономьте
Оставьте заявку, и наш менеджер расскажет подробности.
Зарегистрируйтесь и получите пробный урок бесплатно
Стоимость обучения
110 268 руб.
Или 3 063 руб. ежемесячно — подробности у менеджера.
450 часов практики
80 часов теории
2 проекта
в портфолио
Продолжительность
12 месяцев
Менеджер расскажет о других доступных датах после отправки заявки
Отправляя заявку, вы принимаете условия публичного договора и даёте согласие на обработку своих персональных данных в соответствии с политикой конфиденциальности.
Меню