Почему vGPU не уступают по производительности «железным» решениям

Почему vGPU не уступают по производительности «железным» решениям
/ фото Taylor Vick / Unsplash License

VMware обновили свой гипервизор ESXi. Теперь скорость работы виртуальных графических процессоров под его управлением сопоставима с возможностями их bare metal реализаций — разница составляет всего 3%.

Рассказываем, как компании удалось этого добиться.

Что поменяли

ИТ-гигант внес две модификации в конфигурацию ESXi: отключил функцию vMotion и добавил поддержку технологии DirectPath I/O.

Задачей vMotion является балансировка нагрузки — система мигрирует виртуальные машины (ВМ) между серверами. При переносе ВМ местоположение ее файлов не меняется, просто она начинает потреблять ресурсы (память и процессор) другого хоста ESXi. Отключив vMotion, VMware закрепили vGPU за конкретными виртуальными машинами. Такой подход сократил издержки, связанные с передачей данных при миграции, и увеличил общую производительность гипервизора.

Что касается DirectPath I/O, то эта технология напрямую связывает драйвер CUDA (программно-аппаратную архитектуру параллельных вычислений для GPU от Nvidia) с ВМ — в обход гипервизора.

Сам по себе метод DirectPath работает только для связки «одна виртуальная машина — один GPU». Если виртуальной машине требуется большее число ускорителей, то они связываются в единый кластер с помощью технологии FlexDirect (от партнеров VMware — BitFusion). Если же, наоборот, необходимо разделить мощности одного GPU среди нескольких виртуальных машин, то здесь используется технология Nvidia GRID — она делит память карты на независимые сегменты фиксированного размера.

Общую схему работы системы можно представить следующим образом:

Отключили функцию vMotion и добавил поддержку технологии DirectPath I/O

Перспективы

Инженеры VMware протестировали обновленный гипервизор на задаче с обучением языковой модели, используя открытую программную библиотеку для МО TensorFlow. Производительность виртуальных графических процессоров была всего на три-четыре процента меньше, чем у решений bare metal. При этом виртуальная система обладала большим потенциалом к масштабированию.

Производительность vGPU проверили и в работе с контейнерными технологиями. Разработчики ИТ-гиганта разделили ресурсы одного графического процессора между четырьмя контейнерными ВМ и запустили на этой инфраструктуре нейронную сеть для распознавания изображений. В этой ситуации производительность индивидуальных машин снизилась почти на 20% (по сравнению с одной ВМ, имеющей в своем распоряжении все ресурсы графического ускорителя), но при этом в три раза выросло (средний график) число обрабатываемых за секунду изображений.

Это интересно!  X-as-a-services: как не погрязнуть в аббревиатурах облачных услуг

В VMware говорят, что технология найдет применение в сфере высокопроизводительных вычислений (HPC): ESXi будут использовать для обучения нейросетей, рендеринга, моделирования и проведения симуляций. Пока что для таких нагрузок виртуализация практически не применяется.

Инженеры VMware надеются, что обновленный ESXi поспособствует распространению виртуализированных решений на рынке высокопроизводительных систем. Сегодня виртуализированы порядка 70% рабочих нагрузок в дата-центрах. Оставшиеся 30% по большей части представляют собой HPC-системы, которые работают на bare metal. В Statista говорят, что к 2021 году ситуация изменится и уже 94% рабочих нагрузок дата-центров будут выполняться в виртуальной среде (соответственно, всего 6% будет приходиться на системы без гипервизоров).

Unsplash License

/ фото Thomas Jensen / Unsplash License

Кто еще занимается vGPU

Кроме VMware разработкой технологий виртуализации графических ускорителей занимаются AMD и Intel.

Первый ИТ-гигант разрабатывает технологию SR-IOV. Она делит аппаратные возможности физического устройства между несколькими виртуальными машинами. Хотя основной целью SR-IOV является виртуализация сетевых плат, компания предлагает использовать её для работы с GPU. Технология уже позволяет разделить ресурсы одного ускорителя между шестнадцатью пользователями, поддерживая равную производительность для каждого из них.

Технология Intel строится на базе кросс-платформенного гипервизора Citrix XenServer 7. Она объединяет работу стандартного GPU-драйвера и виртуальной машины. ВМ получает возможность оперировать «тяжелыми» приложениями на устройствах нескольких сотен пользователей одновременно.

Что ждет рынок

Разработчики аппаратного и программного обеспечения для работы с графическими ускорителями делают ставку на рост популярности HPC-решений. Аналитики говорят, что объем продаж аппаратного обеспечения для высокопроизводительных систем составит 45 млрд долларов к 2022 году (с учетом того, что два года назад эта цифра равнялась 32 млрд). ИТ-гиганты надеются, что необходимость обрабатывать крупные объемы данных приведет к росту спроса на vGPU. При этом разрабатываются технологии, которые повысят производительность виртуальных решений.

Это интересно!  Защита персональных данных: европейский подход

Инженеры стараются совместить возможности классических и графических процессоров на одном чипе, чтобы получить лучшее от обоих миров. Такие технологии позволят эффективнее выполнять задачи, связанные с графикой и логическими операциями. По словам экспертов, новые объединенные решения изменят подход к виртуализации и распределению виртуальных ресурсов в рамках дата-центров.

Материалы по теме из нашего блога:


1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (3 оценок, среднее: 5,00 из 5)
Загрузка...