Введение в науку о данных

Для кого?

Курс предлагает особый подход к освоению основ науки о данных, во главу которого поставлены типичные практические задачи. Курс будет интересен широкому кругу слушателей.

О чем?

Курс рассматривает большой спектр подходов и методов сбора, обработки, анализа и визуализации массивов данных любого размера. Отдельным практически важным направлением науки о данных является работа с большими данными с помощью новых принципов математического и вычислительного моделирования, когда классические методы перестают работать ввиду невозможности их масштабирования. Настоящий курс призван помочь слушателю изучить основы предметной области через постановку и решение типичных задач, с которыми исследователь в области науки о данных может столкнуться в своей работе. Авторы курса предоставляют обучающемуся необходимый теоретический минимум и показывают, как пользоваться инструментальной базой на практике.

По завершении этого курса учащиеся будут:

  • Знать методологию работы исследователя в области науки о данных (постановка целей исследования, сбор данных, обработка и преобразования данных, обследование данных, построение моделей и отбор методов, представление и визуализация результатов), методы и подходы к стандартизации и преобразованию данных, методы машинного обучения (базовые методы классификации и кластеризации), способы организации хранения данных.
  • Уметь решать прикладные задачи по обработке и анализу данных на предмет выявления в них скрытых зависимостей, применять элементы теории вероятностей и математической статистики, лежащие в основе моделей и методов науки о данных, правильно подбирать методы машинного обучения для решения практических задач, организовывать рабочее окружение исследователя в области науки о данных (Jupyter),использовать пакеты и библиотеки для машинного обучения (Matplotlib, SciPy/NumPy, Pandas, Scikit-learn).
  • Владеть инструментарием для организации хранения данных, навыками программной реализации на языке Python средств обработки и анализа данных, навыками предобработки и визуализации данных.

Продолжительность: 5 недель.

Язык: русский

Платформа запуска: Coursera

Период запуска: 06 ноября 2017.

Записаться на курс:
Авторы курса:

  • Иван Станиславович Блеканов
    к.тех.н., доцент, заведующий кафедры Технологии программирования

  • Павел Алексеевич Коротков
    ст. преподаватель кафедры Технологии программирования

  • Евгений Викторович Просолупов
    к.ф.-м.н., доцент кафедры Технологии программирования

  • Алексей Юрьевич Утешев
    д.ф.-м.н., профессор кафедры Управления медико-биологическими системами, заведующий кафедрой Космических технологий и прикладной астродинамики

  • Алексей Николаевич Мишенин
    старший преподаватель кафедры Технологии программирования

  • Сергей Юрьевич Севрюков
    старший преподаватель кафедры Технологии программирования

  • Михаил Валерьевич Камалов
    аспирант кафедры Технологии программирования

  • Дмитрий Александрович Вольф
    ассистент Кафедры Математического моделирования энергетических систем

  • Евгений Александрович Малютин
    ассистент кафедры Технологии программирования