Дальневосточный университет
Управление вычислениями
О курсе

Технические аспекты анализа данных зачастую влияют на качество получаемых результатов. В последние годы в центре внимания находятся вопросы обеспечения воспроизводимости и автоматизации анализа – попытки воспроизвести результаты, полученные той или иной группой, часто проваливаются, а анализ больших массивов данных нередко проводится с использованием подручных средств.

Курс состоит из трех модулей, в которых рассматриваются Linux контейнеры и Docker (первый модуль), а также различные подходы к автоматизации процесса вычислений и инструменты, реализующие эти подходы (второй и третий модули). Использование этих инструментов позволяет сделать процесс анализа более воспроизводимым и эффективным.

Преподаватель курса

Доцент кафедры механики и математического моделирования ДВФУ, руководитель образовательной программы «Прикладная механика». Имею степень кандидата технических наук, а также базовое математическое образование – в 1987 году окончила Воронежский государственный университет по специальности «Прикладная математика».

Люблю свою работу, много лет преподаю дисциплины по программированию и базам данных в университете. Сфера научных интересов: e-Learning, learning analytics, машинное обучение, стохастическое моделирование.

Программа курса
Контейнеризация и Docker
1. Знакомство с Docker
2. Работа с файлами в контейнерах Docker
3. Взаимодействие контейнеров Docker
4. Работа с образами Docker
5. Технологические основы и роль контейнеризации
1. Работа с данными и пайплайны
2. Инструменты пайплайнинга и подходы к описанию пайплайнов
3. Snakemake: имплицитное описание графа анализа
4. Snakemake: создание пайплайнов
1. Знакомство с CWL
2. Описание инструментов с использованием CWL
3. CWL: полезные компоненты
4. CWL: создание пайплайнов
1. Введение
1. Заключение