Просто о статистике (с использованием R)

Для кого?

Эта специализация адресована всем, кто хочет познакомиться с основами анализа данных, и описания зависимостей между переменными при помощи линейных моделей. Курсы нашей специализации помогут освоить базовые возможности языка статистического программирования R. Наши курсы подойдут в качестве базового курса статистики (или в качестве дополнительного материала к существующему курсу) бакалаврам, магистрантам и аспирантам высших учебных заведений, а также всем, кто хочет освежить университетские знания основ статистики.

О чем?

Статистика всегда считалась сложной дисциплиной, но мы попробуем рассказать о ней просто и понятно. В курсах этой специализации вы познакомитесь с основами статистики или сможете освежить прежние позабытые знания. Вы научитесь представлять свои данные и результаты анализов, строя графики, готовые для публикации и презентации. Вы сможете тестировать гипотезы и строить регрессионные модели. Тесты будут включать не только теоретические вопросы, но и множество практических заданий по анализу реальных данных. Для анализа данных мы будем использовать язык R, который входит в число самых современных средств, позволяющих проводить статистические анализы почти любой сложности. Не бойтесь, даже если раньше вы не сталкивались с программированием, вы сможете научиться писать скрипты на языке R для самых необходимых видов анализа. Закрепить и развить это умение вам помогут задания по написанию скриптов на R на платформе Stepik.org. Каждый курс специализации включает проект по анализу данных. Создание скрипта для анализа и автоматизированного создания отчета — это возможность потренироваться применять знания статистики в условиях, приближенных к реальности.

По завершении этого курса обучающиеся будут:

Уметь:

1. Импортировать в R данные из файлов xlsx и csv
2. Конструировать самые распространенные графики в ggplot2 (боксплоты, гистограммы, различные варианты точечных и линейных графиков)
3. Рассчитывать основные описательные статистики: медиану и квантили, среднее и стандартное отклонение, дисперсию
4. Использовать t-критерий для сравнения средних значений в независимых выборках, для тестирования значимости коэффициента корреляции
5. Оценивать коэффициенты модели простой или множественной линейной регрессии при помощи метода наименьших квадратов в R
6. Использовать t или F-критерий для проверки значимости линейной модели и отдельных предикторов
7. Записывать уравнение регрессионной модели
8. Оценивать качество подгонки регрессионной модели при помощи коэффициента детерминации (в т.ч. с поправкой для множественной регрессии)
9. Использовать линейную регрессию, чтобы предсказывать значение переменной-отклика для новых наблюдений.
10.Проводить графический анализ остатков регрессионной модели и проверку выполнения условий ее применимости

Знать:

1. Устройство графиков в терминах грамматики графиков.
2. Свойства и особенности использования основных описательных статистик.
3. Принципы использования теоретических распределений статистик для тестирования гипотез.
4. Условия применимости линейной регрессии

Владеть:

1. Методами графического анализа остатков линейных моделей для проверки выполнения их условий применимости
2. Методами описания результатов регрессионного анализа

 

Продолжительность курса: 5 курсов

Курс 1 «Знакомство с R и базовая статистика»
Курс 2 «Линейная регрессия»
Курс 3 «Линейные модели с дискретными предикторами»
Курс 4 «Обобщенные линейные модели»
Курс 5 «Смешанные линейные модели»

Платформа: Coursera

Запуск: 2018 год

Язык: русский

Записаться на специализацию:
Авторы курса:

  • Марина Александровна Варфоломеева
    PhD СПбГУ, ассистент каф. Зоологии беспозвоночных
  • Вадим Михайлович Хайтов
    канд. биол. наук, доцент каф. Зоологии беспозвоночных
Специализации:

Данный курс входит в специализацию:

Просто о статистике (с использованием R)
Подробнее