Просто о статистике (с использованием R)

Для кого?

Этот курс может быть интересен бакалаврам, магистрантам и аспирантам высших учебных заведений по направлениям Биология, Экология и природопользование — в качестве базового курса статистики или в качестве дополнительного материала к существующему курсу статистики и биометрии, исследователям, которым необходимо освежить университетские знания основ статистики и освоить базовые возможности языка статистического программирования R, а также всем тем, кому интересна обозначенная тема.

О чем?

Статистика всегда считалась сложной дисциплиной, но мы попробуем рассказать о ней просто и понятно. В этом курсе вы познакомитесь с основами статистики или сможете освежить прежние позабытые знания. Вы научитесь представлять свои данные и результаты анализов, строя графики, готовые для публикации и презентации. Вы сможете тестировать гипотезы и строить регрессионные модели. Тесты будут включать не только теоретические вопросы, но и множество практических заданий по анализу реальных данных. Не бойтесь, даже если раньше вы не сталкивались с программированием, к концу курса вы научитесь писать скрипты на языке R для самых необходимых видов анализа. Закрепить и развить это умение вам помогут задания по написанию скриптов на R на платформе Stepik.org. Финальный проект по анализу данных и отчет в формате мини-статьи позволят потренироваться применять знания статистики в условиях, приближенных к живой научной работе.

По завершении этого курса обучающиеся будут:

Уметь:

1. Импортировать в R данные из файлов xlsx и csv
2. Конструировать самые распространенные графики в ggplot2 (боксплоты, гистограммы, различные варианты точечных и линейных графиков)
3. Рассчитывать основные описательные статистики: медиану и квантили, среднее и стандартное отклонение, дисперсию
4. Использовать t-критерий для сравнения средних значений в независимых выборках, для тестирования значимости коэффициента корреляции
5. Оценивать коэффициенты модели простой или множественной линейной регрессии при помощи метода наименьших квадратов в R
6. Использовать t или F-критерий для проверки значимости линейной модели и отдельных предикторов
7. Записывать уравнение регрессионной модели
8. Оценивать качество подгонки регрессионной модели при помощи коэффициента детерминации (в т.ч. с поправкой для множественной регрессии)
9. Использовать линейную регрессию, чтобы предсказывать значение переменной-отклика для новых наблюдений.
10.Проводить графический анализ остатков регрессионной модели и проверку выполнения условий ее применимости

Знать:

1. Устройство графиков в терминах грамматики графиков.
2. Свойства и особенности использования основных описательных статистик.
3. Принципы использования теоретических распределений статистик для тестирования гипотез.
4. Условия применимости линейной регрессии

Владеть:

1. Методами графического анализа остатков линейных моделей для проверки выполнения их условий применимости
2. Методами описания результатов регрессионного анализа

 

Продолжительность курса: 5 курсов

Курс 1 «Знакомство с R и базовая статистика»
Курс 2 «Линейная регрессия»
Курс 3 «Линейные модели с дискретными предикторами»
Курс 4 «Обобщенные линейные модели»
Курс 5 «Смешанные линейные модели»

Платформа: Coursera

Запуск: 2018 год

Язык: русский

Записаться на специализацию:
Авторы курса:
  • Марина Александровна Варфоломеева
    PhD СПбГУ, ассистент каф. Зоологии беспозвоночных
  • Вадим Михайлович Хайтов
    к.б.н., доцент каф. Зоологии беспозвоночных