Освойте ключевые технологии, научитесь работать с большими данными, расширьте знания в аналитике и перейдите на новый уровень в профессии
На курсе “Data Scientist” вы научитесь:
Работать с SQL
- Научитесь писать запросы, работать с базами данных, извлекать и обрабатывать информацию
Использовать Python и библиотеки анализа данных
- Автоматизировать работу с большими массивами, получать данные из внешних источников, обосновывать выводы, сделанные на основании данных
Строить модели машинного обучения
- Подготавливать данные и быстро строить на них ML-модели. Проверять гипотезы, строить рекомендательную систему и нейронную сеть, выявлять скрытые аномалии в данных
Использовать сложную математику для Data Science
- Освоите математические функции для работы с моделями данных, машинным обучением и нейронными сетями
Программа курса "Data Scientist":
- Блок 1: "Получение и подготовка данных: SQL"
- Блок 2: "Python для анализа данных"
- Блок 3: "Построение Machine Learning моделей"
- Блок 4: "Нейронные сети и NLP"
- Блок 5: "Рекомендательные системы"
- Блок 6: Дипломная работа и помощь с трудоустройством
Навыки после курса:
Машинное обучение
- Построение моделей. Линейные методы, логистическая регрессия и SVM
Продвинутая математика для ML
- Линейная алгебра, теория вероятности, теория множеств для работы с машинным обучением
Обработка языка (NLP)
- Дистрибутивная семантика (word2vec, GloVe, AdaGram) и машинный перевод
Декомпозиция метрик
- Поиск низкоуровневых метрик для улучшенния бизнес-показателей
Мат.статистика
- Продвинутый уровень мат.статистики для аналитики данных
Рекомендательные системы
- Навык построения рекомендательных систем для различных отраслей
Обработка картинок Machine Learning
- Поиск по картинкам. Сегментация изображений, детекция объектов
SQL
- Продвинутый уровень SQL: конкатенация строк, оконные функции и ускорение запросов
Python
- Аналитика данных с помощью библиотек Python: Pandas, Numpy, SciPy, Seaborn, Matplotlib и др
Визуализация данных
- С помощью Python и машинного обучения
Презентация данных
- Презентация результатов анализа данных для принятия решений