Параллельная обработка больших графов

В рамках семинара пройдет обсуждение проблем обработки больших графов с использованием параллельных вычислений. В современном мире происходит сближение суперкомпьютерных технологий, технологий BigData и искусственного интеллекта. Поэтому главная задача семинара – дать возможность для обсуждения научных и практических проблем, возникающих при решении задач обработки графов с использованием одной или нескольких перечисленных технологий. Семинар является дополнением к конференции GraphHPC.

Семинар пройдет 25 сентября 2017 г. с 14:10 до 15:50.

Программа семинара

Трансляция проблемно-ориентированного языка Green-Marl для обработки графов в параллельный код на Charm++
А.С. Фролов, АО «НИЦЭВТ»

В докладе будут представлены результаты работы по реализации генератора кода на Charm++ в компиляторе проблемно-ориентированного языка Green-Marl, редназначенного для параллельного анализа статических графов. В качестве примера использован параллельный алгоритм поиска сильно связных компонент в ориентированном графе на основе раскраски вершин графа.  

Технология решения больших графовых задач на неоднородных вычислительных платформах
И.В. Афанасьев, Вл.В. Воеводин, МГУ им. М.В. Ломоносова

В работе описан подход к реализации графовых задач для двух современных высокопроизводительных платформ: NVIDIA GPU и Intel KNL. Основа подхода – глубокое априорное исследование потенциала алгоритмов, на основе чего выбирался способ реализации. В качестве примера рассмотрены проблемы поиска кратчайших путей и сильно связанных компонент в разреженных графах. Для каждой из задач подробно описан весь цикл разработки, начиная от исследования структуры алгоритма и выбора способа реализации, подходящего для конкретной платформы, и заканчивая оптимизациями, специфичными для каждой из архитектур. На основе совместного анализа свойств алгоритмов и особенностей архитектуры, выполнена тонкая настройка производительности с помощью оптимизации формата хранения графа, эффективного использования иерархии памяти, а так же использование векторизации.  Для разработанных реализаций проведены экспериментальные исследования, показавшие высокую производительность и хорошую масштабируемость предложенных решений. Кроме того, большое внимание в работе уделяется профилировке с помощью утилит NVIDIA Visual Profiler и Intel® VTune™ Amplifier, которые помогают оценить, насколько оптимально реализованы предложенные алгоритмы. Приводится сравнение полученных результатов для обеих платформ с указанием преимуществ и недостатков каждой из них в контексте решения графовых задач.

Подходы к решению задачи выявления аномалий в графах
А.В. Мазеев, А.С. Семенов, АО «НИЦЭВТ»

Выявление аномалий в графах – важнейший класс задач в современном мире Big Data. Разрабатываются различные методы решения задач для статических и динамических графов, с атрибутами и без. В докладе приводится обзор подходов к решению задач выявления аномалий в графах, а также пример решения одной из задач при помощи машинного обучения.

Оценочное тестирование Apache Spark на кластере с сетью Ангара
А.А. Агарков, А.С. Семенов, АО «НИЦЭВТ»

Apache Spark – один из наиболее широко распространенных фреймворков для обработки Больших Данных. Значимость приложений анализа данных и требования к их производительности в контексте сближения суперкомпьютерных технологий и технологий Big Data приводят к необходимости уделять особое внимание оценочному тестированию. В докладе будут представлены результаты оценочного тестирования Apache Spark на кластере с сетью Ангара на примере задачи сопоставления двух одинаковых по структуре больших таблиц.

Научные направления

Тематика семинара включает следующие вопросы (но не ограничивается ими):

  • Параллельные алгоритмы анализа графов
  • Приложения, использующие теорию графов
  • Графовые задачи и Big Data, искусственный интеллект
  • Модели параллельного программирования и инструментальные средства для разработки графовых приложений
  • Графовые базы данных и их приложения
  • Исследование производительности вычислительных систем на графовых задачах и синтетических тестах (бенчмарках)
  • Графовые задачи и архитектура вычислительных систем, экзафлопсные вычисления
  • Визуализация графов

Важные даты

  • 15 мая – представление полных версий статей
  • 5 июня – уведомление о включении работы в программу семинара
  • 26 июня – представление окончательного варианта статьи

Правила представления работ

Правила представления работ совпадают с общими правилами основной конференции. При подаче статей необходимо выбрать соответствующий трек в системе.

Программный комитет

  • Воеводин В.В., чл.-корр. РАН, НИВЦ МГУ (сопредседатель)
  • Симонов А.С., к.т.н., АО «НИЦЭВТ» (сопредседатель)
  • Фролов А.С., DISLab (АО «НИЦЭВТ»)
  • Семенов А.С., к.т.н., DISLab (АО «НИЦЭВТ»)
  • Позднеев А.В., к.ф.-м.н., IBM
  • Дарьин А.Н., к.ф.-м.н., Yandex
  • Корж А.А., к.ф.-м.н., Micron
  • Черноскутов М.А., ИММ УрО РАН

Контакты

Фролов Александр Сергеевич, DISLab (АО «НИЦЭВТ»), e-mail: alexndr.frolov at gmail com
Семенов Александр Сергеевич, DISLab (АО «НИЦЭВТ»), e-mail: alxdr.semenov at gmail com