Специалист по Data Science плюс
Расширенная программа для тех, кто хочет построить карьеру в Data Science с нуля за 16 месяцев
Что делают специалисты по Data Science
Такие специалисты анализируют данные и на их основе строят модели, которые помогают принимать решения в науке, бизнесе и обычной жизни. Data Science — это применение научных методов в работе с данными.
Курс подойдёт вам, если
Вы никогда не работали в IT и у вас нет технического образования
У вас есть опыт работы с данными, но не хватает крепкой базы по машинному обучению
Вы готовы уделять учёбе минимум 10 часов в неделю
4
этапа прохождения обучения
В любое удобное для вас время
Обучение будет разбито на спринты, а заниматься можно когда угодно, главное — уложиться в дедлайн.
С практикой и обратной связью
Теорию и задачи вы проходите в тренажёре, где всё проверяется автоматически. А по большим проектам ревьюер присылает вам подробный разбор. Задачи взяты из реальной практики, поэтому вы с первых дней готовитесь к будущей работе.
С учебными проектами
Вас ждут типичные для специалиста по Data Science задачи из разных сфер бизнеса. Добавите их в своё портфолио, чтобы искать работу не с пустыми руками.
И онлайн-встречами с наставником
Будете разбирать теорию на реальных примерах разных компаний, которые лидируют в индустрии.
С какими задачами сможете работать после учёбы
В банке
Банк хочет автоматически прогнозировать платёжеспособность новых клиентов — нужно использовать данные о текущих клиентах
В поисковом сервисе
Поисковому сервису требуется алгоритм, который поможет определять фотографии с запрещённым содержанием и исключать их из поисковой выдачи
В онлайн-кинотеатре
Онлайн-кинотеатр хочет построить рекомендательную систему фильмов и сериалов для пользователей
В любой компании
Почти в каждой организации есть техподдержка: чтобы специалисты быстрее обрабатывали обращения, нужно автоматически определять тему по тексту сообщения
Будете заниматься самостоятельно, но не в одиночестве — вас поддержат практикующие специалисты
Станислав Стрельцов
Chief Data Officer в Tele2 Казахстан. Опыт в сфере Data Science — 6 лет.
Александр Ольферук
Computer Vision Engineer на фрилансе. В IT — 7 лет, из них в ML/DL — 5,5.
Глеб Михайлов
Сейчас — фрилансер, раньше работал в Альфа банке, Сбере и Ростелекоме. В сфере анализа данных уже 10 лет.
Никита Киселев
ML-разработчик в Яндексе. В сфере ML работает уже 5 лет.
Программа курса
Основы Python и анализа данных: бесплатная вводная часть
Узнаете основные концепции анализа данных и поймёте, чем занимаются аналитики данных и специалисты по Data Science. Решите задачи из разных областей: выясните причину массовой поломки гаджетов; проверите, как новая опция в видеоигре влияет на пользователей; поможете кофейной компании классифицировать клиентов; оцените эффективность роботов в службе поддержки. Решая кейсы, вы изучите азы Python и библиотеки pandas, научитесь строить некоторые графики и верно их трактовать.
Введение в анализ данных
Спринт 1. Базовый Python Глубже погрузитесь в язык программирования Python и работу с библиотекой pandas. Спринт 2. Предобработка данных Научитесь очищать данные от выбросов, пропусков и дубликатов, а также преобразовывать разные форматы данных. Спринт 3. Исследовательский анализ данных Научитесь самостоятельно принимать решения о предобработке данных, вычислениях и визуализациях. Спринт 4. Сборный проект Проведёте сложный исследовательский анализ датасета с информацией о фильмах: показы в кинотеатрах, сборы, государственная поддержка. Потренируетесь в предобработке, вычислениях и построении визуализаций. В этой работе вы сами принимаете решения по обработке и выбору способов визуализации данных. В конце проекта вы проведёте самостоятельное исследование по фильмам с государственной поддержкой и найдёте интересные закономерности.
Основы машинного обучения
Спринт 5. Статистический анализ данных Научитесь анализировать взаимосвязи в данных методами статистики. Узнаете, что такое статистическая значимость, гипотезы и доверительные интервалы. Спринт 6. Линейные модели в машинном обучении Познакомитесь с библиотекой scikit-learn и циклом создания модели машинного обучения. Освоите линейные модели. Научитесь решать задачи регрессии и классификации. Изучите основы линейной алгебры. Узнаете, как подготовить данные для машинного обучения и проверить работу модели. Спринт 7. Обучение с учителем: качество модели Изучите новые модели — SVM и kNN. Научитесь настраивать модели машинного обучения. Освоите новые метрики качества решений модели и подходы для их улучшения. Узнаете, что такое пайплайны и как они упрощают разработку моделей. Спринт 8. Сборный проект Разработаете две модели машинного обучения и оцените их качество. Упакуете работу в пайплайн.
Машинное обучение для больших объемов данных
Спринт 9. Машинное обучение в бизнесе Узнаете, как машинное обучение (МО) помогает бизнесу, как собирать данные и как продуктовые метрики связаны с показателями МО. Научитесь запускать новую функциональность сервиса, применяя МО. Узнаете, что такое бизнес-метрики, KPI и A/B-тестирование. Спринт 10. Базовый SQL Изучите основы структурированного языка запросов SQL и операции реляционной алгебры. Познакомитесь с PostgreSQL — популярной системой управления базами данных (СУБД). Научитесь писать запросы разного уровня сложности и переводить бизнес-задачи на язык SQL. Спринт 11. Командная строка и Git Научитесь пользоваться командной строкой — интерфейсом, благодаря которому разработчики управляют компьютером и выполняют действия, вводя текстовые команды с клавиатуры. Разберётесь с Git — распределённой системой контроля версий, которая помогает хранить информацию о всех изменениях в вашем коде, а также упрощает командную работу над проектом. Спринт 12. Мастерская Мастерская — это возможность попрактиковаться в решении задач по машинному обучению. В этом спринте вы либо поработаете над проектом от реального заказчика, либо поучаствуете в соревнованиях на Kaggle. Kaggle — это популярный сервис конкурсов по исследованию данных и машинному обучению. Тысячи специалистов по Data Science со всего света участвуют в соревнованиях Kaggle, чтобы получить опыт и награды. Работа с заказчиками и участие в соревнованиях дают преимущество при трудоустройстве, ведь эти проекты пойдут в ваше портфолио. Спринт 13. Системы обработки больших данных Познакомитесь с PySpark — Python-фреймворком Apache Spark, который представляет собой систему с открытым исходным кодом, применяемую для распределённой обработки больших данных. Узнаете про концепцию обработки MapReduce: большие данные распределяют между кластерами и обрабатывают параллельно, а потом собирают результаты вместе.
Продвинутое машинное обучение
Спринт 14. Численные методы Разберёте ряд алгоритмов и приспособите их к решению практических задач с использованием численных методов. Освоите приближённые вычисления, оценки сложности алгоритма, градиентный спуск. Узнаете, что такое градиентный бустинг. Спринт 15. Мастерская Мастерская — это возможность попрактиковаться в решении задач по машинному обучению. В этом спринте вы либо поработаете над проектом от реального заказчика, либо поучаствуете в соревнованиях на Kaggle. Kaggle — это популярный сервис конкурсов по исследованию данных и машинному обучению. Тысячи специалистов по Data Science со всего света участвуют в соревнованиях Kaggle, чтобы получить опыт и награды. Работа с заказчиками и участие в соревнованиях дают преимущество при трудоустройстве, ведь эти проекты пойдут в ваше портфолио. Спринт 16. Продвинутый SQL Пройдёте дополнительный курс по работе с базами данных и станете ещё ближе к бизнесу. Рассмотрите работу с оконными функциями. Спринт 17. Модели и алгоритмы машинного обучения Узнаете о преимуществах нейросетей над классическими методами машинного обучения. Научитесь строить и обучать полносвязные нейросети с помощью фреймворка PyTorch, управлять их обучением с использованием гиперпараметров. Во многих сферах применения Data Science — от компьютерного зрения до генерации текста — нейросети достигают невероятных результатов, поэтому знакомство с ними открывает для вас новые возможности анализа данных. Спринт 18. Сборный проект Потренируетесь составлять запросы для получения данных. Самостоятельно составите датасет и обучите на нём модель.
Машинное обучение в прикладных задачах
Спринт 19. Временные ряды Временные ряды описывают, как параметры, например объём потребления электроэнергии или количество заказов такси, меняются с течением времени. Вы научитесь анализировать ряды, искать тренды и выявлять сезонность. Узнаете, как создавать табличные данные и задачу регрессии из временных рядов. Спринт 20. Машинное обучение для текстов Научитесь предобрабатывать тексты и решать для них задачи классификации и регрессии. Узнаете, как с помощью различных подходов вычислять эмбеддинги — векторные представления слов. Спринт 21. Компьютерное зрение Научитесь решать простые задачи компьютерного зрения с привлечением готовых нейронных сетей. Познакомитесь с классическими подходами в компьютерном зрении. Заглянете в мир глубокого обучения. Спринт 22. Сборный проект Погрузитесь в вопросы этичной работы с данными. Попрактикуетесь комбинировать текстовые данные и изображения для создания модели машинного обучения. Обработаете оценки соответствия текстовых данных и изображений от экспертов.
Выпускной проект
В последнем проекте вы подтвердите, что освоили новую профессию: уточните задачу заказчика, пройдёте все стадии анализа данных и машинного обучения. Теперь без уроков и домашних заданий — как на реальной работе.
Дополнительная практика
Это необязательные спринты. Значит, каждый студент сам выбирает один из вариантов прохождения: - Освоить дополнительный курс из нескольких коротких уроков, освежить в памяти теорию и решить задачи. - Пропустить курс совсем или вернуться к нему, когда будут время и необходимость. Практика Python Дополнительные задачи для тренировки индексов, циклов, логических значений, условного оператора и фильтрации на Python. Теория вероятностей Вспомните или узнаете базовые термины теории вероятностей: независимые, противоположные, несовместные события и т. д. На простых примерах и забавных задачах потренируетесь работать с числами и выстраивать логику решения. После попробуете себя в решении задач для собеседований. Практика SQL Несколько десятков дополнительных задач на отработку навыка работы с SQL.
Программа трудоустройства
В дополнение к основной образовательной программе вы можете пройти трек подготовки к трудоустройству, чтобы быстрее найти новую работу. Программа включает руководства, вебинары и домашние задания. Резюме. — Изучите подходы к составлению резюме. — Научитесь презентовать свой опыт работы. — Составите резюме вместе со специалистом по трудоустройству. Портфолио и сопроводительное письмо. — Научитесь создавать портфолио на сервисе GitHub. — Изучите особенности написания сопроводительного письма. — Напишете сопроводительное письмо вместе со специалистом по трудоустройству. Интервью. — Научитесь презентовать себя и легче проходить собеседования. Поиск работы. — Узнаете, где искать работу. — Разберёте активную и пассивную стратегии поиска работы. — Научитесь бороться со страхами во время трудоустройства. Активный поиск работы. — Начнёте погружаться в профессиональное сообщество. — Получите доступ к партнёрским вакансиям. — Поучаствуете в проектах от реальных заказчиков.
Чему научитесь
Анализировать большие объёмы данных и строить модели, которые помогают бизнесу принимать решения
Применять машинное обучение, чтобы предсказывать события, прогнозировать значения и искать неочевидные закономерности в данных
Помогать бизнесу, промышленности и науке создавать и улучшать продукты
Учитесь и экономьте
Оставьте заявку, и наш менеджер расскажет подробности.
Зарегистрируйтесь и получите пробный урок бесплатно
Стоимость обучения
228 000 руб.
Или 16 000 руб. ежемесячно — подробности у менеджера.
Соберёте портфолио из 21 учебного проекта и 2 — на реальных данных
С нуля освоите Python и его библиотеки, Jupyter Notebook и SQL
Получите помощь с поиском работы
Продолжительность
16 месяцев
Менеджер расскажет о других доступных датах после отправки заявки
Отправляя заявку, вы принимаете условия публичного договора и даёте согласие на обработку своих персональных данных в соответствии с политикой конфиденциальности.
Меню