Типы инстансов (Flavor)

Управление арендованным пулом вычислительных ресурсов проекта выполняется путем комбинированного использования различных типов инстансов.

Предупреждение

В SIM-Cloud, для инстансов предоставляются только заранее определённые конфигурации ресурсов (типы инстансов). Конфигурацию с произвольным соотношением ядер и памяти, на данный момент, создать невозможно.

Тип инстанса (flavor) описывает конфигурацию вычислительных ресурсов:

  • количество виртуальных процессоров - vCPU;
  • объем оперативной памяти (RAM);

и может быть назначен инстансу в момент его создания или изменен после запуска.

Существующие в системе типы инстансов полностью покрывают большиство потребностей по разворачиванию современных систем и сервисов. Все доступные шаблоны соответствуют требованиям NUMA топологии использования процессорной возможности гипервизоров, что позволяет предоставить пользователю максимальную эффективность вычислительных ресурсов.

При создании инстанса, указанный вами тип инстанса (flavor) автоматически определяет подходящий по техническим требованиям хост - гипервизор, где и будет размещаться ваш инстанс.

Каждый тип инстанса предлагает разные возможности вычислений, не только по соотношению количества vCPU к RAM но их качественные показатели, в частности базовой тактовой частоте виртуальных процессоров. SIM-Cloud выделяет гарантированные вычислительные ресурсы гипервизора, такие как процессор и память конкретному инстансу на основе выбранного типа - flavor. Для вашего удобства мы сгруппировали типы инстансов в семейства на основе их вычислительных возможностей и производительности.

Для пользователей сервиса SIM-Cloud доступны 4 группы типов инстансов:

  1. Power Flavors.
  2. Memory Optimized Flavors.
  3. Standard Flavors.
  4. vGPU Flavors.

Power Flavors

Power Flavors (p1.*)
Flavor vCPU (3,3GHz) RAM (GB) Description
p1.C2R4 2 4 PowerCPU
p1.C2R8 2 8 PowerCPU
p1.C2R16 2 16 PowerCPU
p1.C4R8 4 8 PowerCPU
p1.C4R16 4 16 PowerCPU
p1.C4R24 4 24 PowerCPU
p1.C4R32 4 32 PowerCPU
p1.C6R12 6 12 PowerCPU
p1.C6R16 6 16 PowerCPU
p1.C6R24 6 24 PowerCPU
p1.C6R32 6 32 PowerCPU
p1.C6R64 6 64 PowerCPU
p1.C6R96 6 96 PowerCPU
p1.C8R16 8 16 PowerCPU
p1.C8R32 8 32 PowerCPU
p1.C8R64 8 64 PowerCPU
p1.C8R96 8 96 PowerCPU
p1.C12R32 12 32 PowerCPU
p1.C12R64 12 64 PowerCPU
p1.C12R96 12 96 PowerCPU
p1.C12R128 12 128 PowerCPU
p1.C12R192 12 192 PowerCPU
p1.C16R64 16 64 PowerCPU
p1.C16R96 16 96 PowerCPU
p1.C16R128 16 128 PowerCPU
p1.C20R96 20 96 PowerCPU
p1.C20R128 20 128 PowerCPU
p1.C24R128 24 128 PowerCPU

Memory Optimized Flavors

Memory Optimized Flavors (p1mo.*)
Flavor vCPU (3.3GHz) RAM (GB) Description
p1mo.C2R32 2 32 Memory optimized
p1mo.C4R64 4 64 Memory optimized
p1mo.C6R96 6 96 Memory optimized
p1mo.C8R128 8 128 Memory optimized
p1mo.C12R192 12 192 Memory optimized
p1mo.C16R256 16 256 Memory optimized
p1mo.C20R320 20 320 Memory optimized
p1mo.C24R384 24 384 Memory optimized
p1mo.C28R448 28 448 Memory optimized
p1mo.C32R512 32 512 Memory optimized

Standard Flavors

Standard Flavors
Flavor vCPU (2,3-2,6GHz) RAM (GB) Description
SIM-C1R1 1 1 StdCPU
SIM-C1R2 1 2 StdCPU
SIM-C1R4 1 4 StdCPU
SIM-C2R4 2 4 StdCPU
SIM-C2R8 2 8 StdCPU
SIM-C2R16 2 16 StdCPU
SIM-C4R8 4 8 StdCPU
SIM-C4R16 4 16 StdCPU
SIM-C4R24 4 24 StdCPU
SIM-C4R32 4 32 StdCPU
SIM-C6R12 6 12 StdCPU
SIM-C6R16 6 16 StdCPU
SIM-C6R24 6 24 StdCPU
SIM-C6R32 6 32 StdCPU
SIM-C6R64 6 64 StdCPU
SIM-C8R16 8 16 StdCPU
SIM-C8R32 8 32 StdCPU
SIM-C8R64 8 64 StdCPU
SIM-C8R96 8 96 StdCPU
SIM-C12R32 12 32 StdCPU
SIM-C12R64 12 64 StdCPU
SIM-C12R96 12 96 StdCPU
SIM-C12R128 12 128 StdCPU
SIM-C12R192 12 192 StdCPU
SIM-C16R64 16 64 StdCPU
SIM-C16R96 16 96 StdCPU
SIM-C16R128 16 128 StdCPU
SIM-C20R96 20 96 StdCPU
SIM-C20R128 20 128 StdCPU
SIM-C24R128 24 128 StdCPU
SIM-C32R128 32 128 StdCPU
SIM-C32R192 32 192 StdCPU

vGPU Flavors

vGPU Flavors
Flavor Product Name vCPU (3,3GHz) vRAM GPU (GB) RAM (GB) | Description
g1.C1R16-Q2 SIMGPU-2 1 2 16 vGPU
g1.C1R32-Q4 SIMGPU-4 1 4 32 vGPU
g1.C2R48-Q6 SIMGPU-6 2 6 48 vGPU
g1.C4R64-Q8 SIMGPU-8 4 8 64 vGPU
g1.C6R128-Q16 SIMGPU-16 6 16 128 vGPU
g1.C8R196-Q24 SIMGPU-24 8 24 196 vGPU
g1.C16R378-Q48 SIMGPU-48 16 48 378 vGPU

Наименование типов инстансов соответствует конфигурации, а точнее соотношению ядер к оперативной памяти. Предположим тип «SIM-C16R128» означает, что созданный инстанс на базе данного типа будет иметь 16 ядер (Cores - «С») и 128GB оперативной памяти (RAM - «R»). Данный подход в именовании поможет клиенту оперативно сориентироваться, какой тип нужен при планировании разворачивания виртуальных машин.

Для большинства систем и приложений умеренной производительности, где не требуется высокая тактовая частота, подойдут типы инстансов из группы «Standard Flavors», их технических параметров более чем достаточно. Типы инстансов данного семейства используют процессоры с базовой тактовой частотой 2,3-2,6GHz.

Для сервисов и приложений, которым требуется более высокая и согласованная производительность vCPU, рекомендуем выбирать типы инстансов из семейства «Power Flavors» с более высокой производительностью. В основе данных типов инстансов используются высокопроизводительные процессоры Intel® Xeon® Gold 6246 с тактовой частотой 3,3GHz. Важно отметить, что 3,3GHz – это базовая тактовая частота, в пиковых нагрузках частота процессора может достигать 4,2GHz– это максимальная тактовая частота, получаемая при использовании технологии Turbo Boost.

Memory Optimized Flavors (p1mo.*)

Общее описание

Memory Optimized Flavors — это специальная линейка типов виртуальных машин, спроектированных для выполнения задач, требующих повышенного объёма оперативной памяти при умеренном количестве vCPU. Эти флаворы обеспечивают баланс между высокой вычислительной производительностью и большой ёмкостью RAM, что особенно актуально для ресурсоёмких, но не сильно многопоточных рабочих нагрузок.

Все флаворы серии p1mo.* построены на базе процессоров с повышенной тактовой частотой PowerCPU (3.3GHz) — это гарантирует отличную однопоточную производительность, сравнимую с высокопроизводительными физическими серверами.

Предупреждение

Типы инстансов линейки p1mo.* всегда работают только на высокопроизводительных ядрах PowerCPU (3.3 GHz). Платформа не предусматривает Memory Optimized флаворы на основе стандартных vCPU (2.3–2.6 GHz). Это означает, что все инстансы, созданные с использованием p1mo.*, гарантированно получают доступ к высокой тактовой частоте и соответствующей производительности. Memory Optimized доступны только в конфигурации с PowerCPU.

Важно

Квотирование ресурсов: поскольку флаворы линейки p1mo.* основаны на PowerCPU (3.3 GHz), при создании инстансов этого типа будет использоваться квота vCPU, выделенная для PowerCPU. Учет и ограничение потребления процессорных ресурсов происходит отдельно от стандартных vCPU, что важно учитывать при планировании ресурсов проекта.

Назначение и ключевые сценарии использования

  • Использование Memory Optimized Flavors оправдано в случаях, когда: Приложению критичен большой объём RAM, но количество потоков (vCPU) может быть умеренным.
  • Необходимо обеспечить высокую производительность для однопоточных операций.
  • Приложения работают in-memory (вся рабочая нагрузка или значительная часть данных находятся в оперативной памяти).
  • Используются базы данных или middleware, лицензируемые по числу процессорных ядер.
  • Требуется горизонтальное масштабирование множества относительно «лёгких» по CPU, но тяжёлых по RAM инстансов (например, кэш-серверы, Redis, Memcached, Spark executors, Presto workers и т.д.).

Преимущества

1. Высокая тактовая частота (3.3GHz) Flavors используют CPU-ядра с увеличенной частотой, что даёт улучшенную производительность на ядро, особенно важную для сервисов с однопоточными или малопоточными задачами.

2. Оптимизация затрат на лицензирование Во многих сценариях программное обеспечение лицензируется по количеству ядер. Выбирая flavor с меньшим количеством vCPU и большим объёмом RAM, можно существенно сократить лицензионные расходы, не жертвуя производительностью.

3. Эффективное использование ресурсов Если приложению не требуется большое количество vCPU, но необходимо много RAM — p1mo-флаворы позволяют не переплачивать за избыточные процессорные мощности, как это происходило бы при использовании стандартных flavor с фиксированными соотношениями vCPU:RAM.

4. Гибкость масштабирования Сбалансированные flavor позволяют легко масштабировать инфраструктуру вширь, без необходимости перераспределения или резервирования большого количества CPU-ресурсов.

Примеры рабочих нагрузок

  • In-memory базы данных: Redis, Memcached, Aerospike
  • Аналитические движки: Apache Spark, Presto, ClickHouse
  • Механизмы кэширования на уровне приложений
  • Java-платформы с большим heap’ом: Elasticsearch, Solr, Kafka, Zookeeper
  • BI-системы и OLAP-решения
  • NoSQL-хранилища, чувствительные к объёму оперативной памяти

Заключение

Memory Optimized Flavors — это стратегически важный тип flavor’ов, предоставляющий заказчикам гибкость в проектировании инфраструктуры под задачи, в которых критична RAM, а CPU — вторична. Они снижают TCO, позволяют эффективнее управлять лицензиями и предоставляют улучшенную производительность без необходимости перехода на более дорогие flavor с избыточным числом vCPU.

vGPU Flavors

vGPU Flavors — это специализированная линейка виртуальных машин с поддержкой проброшенного GPU через технологию виртуализации видеокарт (vGPU). Такие инстансы получают доступ к аппаратным ресурсам графических ускорителей NVIDIA L40 на уровне гипервизора.

Каждый vGPU-инстанс обладает:

  • Аппаратным GPU-ускорением через проброшенную память и ядра физических видеокарт
  • Высокопроизводительными vCPU PowerCPU (3.30 GHz), аналогично линейке p1mo.*
  • Это делает vGPU Flavors отличным выбором для задач, требующих как высокой графической производительности, так и интенсивных CPU-вычислений.

Архитектура и технология vGPU

Инстансы данной линейки используют технологию NVIDIA vGPU, позволяющую эффективно делить ресурсы физических GPU между виртуальными машинами. Это даёт возможность масштабировать графические ресурсы без выделения целой видеокарты, что особенно важно для балансировки затрат и производительности.

Квотирование ресурсов

1. Ресурсы инстансов с vGPU квотируются отдельно. Каждая конфигурация vGPU Flavor включает фиксированный набор ресурсов:

  • Количество виртуальных ядер (vCPU),
  • Объём оперативной памяти (RAM),
  • Объём видеопамяти GPU (vGPU RAM).

2. Учёт ресурсов осуществляется независимо от стандартных флаворов. Указанные ресурсы имеют собственную стоимость и не зависят напрямую от пула общих доступных ресурсов проекта. днако, при просмотре проекта через Dashboard SIM-Cloud, часть ресурсов инстансов с vGPU может отображаться как часть общего пула.

3. Квота на vGPU выделяется отдельно. Для использования GPU-инстансов необходимо наличие доступной квоты на vGPU-профили, аналогично тому, как выделяются CPU и RAM в других группах.

Хранилище и диски для vGPU-инстансов

  • В состав vGPU-инстансов не входит хранилище.

Тип и объём хранилища для инстанса пользователь выбирает самостоятельно при создании VM.

  • Рекомендуемые типы хранилищ:

Для обеспечения соответствующей производительности GPU-нагрузок рекомендуется использовать:

  • IO1 — высокопроизводительные блочные устройства с предсказуемой латентностью,
  • GS1 — хранилища корпоративного класса для IOPS-чувствительных задач.
  • Хранилище учитывается в общей квоте проекта.

Независимо от использования vGPU, объём подключаемого дискового пространства влияет на общую квоту по хранилищу в проекте и тарифицируется отдельно от CPU/GPU-ресурсов.

Предупреждение

Нельзя менять вычислительные ресурсы внутри существующего типа vGPU-инстанса. Количество vCPU, RAM и vGPU памяти фиксировано. При необходимости других параметров необходимо выбрать другой тип vGPU-инстанса из доступной линейки.

Изменение объёма хранилища возможно только в большую сторону. Платформа не поддерживает уменьшение размеров томов ни для одного типа инстанса, включая vGPU. Увеличение размера возможно через стандартные процедуры изменения размера тома.

vGPU Flavors не масштабируются по vCPU/RAM/GPU. Это сделано намеренно для гарантии стабильной производительности и соответствия профилям виртуальных GPU. При необходимости масштабирования следует использовать более подходящий тип flavor.

Назначение и ключевые сценарии использования

vGPU Flavors предназначены для задач, требующих аппаратного ускорения при обработке графики, видео, ИИ и 3D-моделирования.

Типовые сценарии:

  • Machine Learning / Deep Learning обучение и инференс моделей на фреймворках: TensorFlow, PyTorch, JAX и др.
  • AI-инференс в продакшене ускорение выполнения ML-сервисов (NLP, CV, рекомендации)
  • Визуализация и 3D-графика приложения на базе CUDA/OpenGL/Vulkan, например: Blender, AutoCAD, SolidWorks, Adobe Premiere
  • Трансляция и обработка видео серверы потокового видео, transcoding (NVENC/NVDEC)
  • VDI / виртуальные рабочие места удалённые рабочие столы с GPU для дизайнеров, инженеров, аналитиков

Преимущества vGPU

1. Аппаратное ускорение с GPU Каждый инстанс получает выделенный виртуализированный профиль GPU, что обеспечивает высокую производительность графических операций ез нагрузки на CPU.

2. Высокочастотные vCPU (3.30 GHz) В дополнение к GPU, все vGPU-инстансы используют ядра PowerCPU, что особенно важно для однопоточных и гибридных нагрузок (CPU + GPU), характерных для ML, аналитики и визуализации.

3. Гибкость в масштабировании и лицензировании vGPU позволяет делить видеокарту между инстансами, что снижает стоимость и даёт гибкость при распределении GPU-ресурсов. Также это позволяет избегать переплаты за неиспользуемую часть физического GPU.

4. Поддержка сертифицированных драйверов и фреймворков Драйверы NVIDIA vGPU поддерживают множество фреймворков и решений: от CUDA и TensorRT до DirectX и OpenGL. Это делает флаворы совместимыми с большинством современных графических и AI-решений.

Заключение

  • vGPU Flavors — идеальный выбор для рабочих нагрузок, где требуются одновременно высокая CPU-производительность и аппаратное

ускорение GPU. Это могут быть и ML/AI задачи, и визуализация, и VDI-инфраструктура.

  • Благодаря сочетанию PowerCPU (3.3GHz) и GPU NVIDIA L40, такие инстансы обеспечивают производительность, сопоставимую с физическими

рабочими станциями или специализированными ML-серверами, но с преимуществами облачной инфраструктуры: масштабируемостью, гибкостью и снижением TCO.

Выберите тип экземпляра в зависимости от требований приложения или программного обеспечения, которое вы планируете запустить на своем экземпляре.

Примечание

Каждый тип инстанса обеспечивает разную производительность, выбор необходимого типа определяется следующими основными факторами:

  • Требования операционной системы.
    Каждая OS имеет минимальные требования для корректной работы. Как правило требования можно найти на официальном сайте продукта.
  • Требования программного обеспечения, которое будет запускаться.
    Преимущественно все разработчики программного обеспечения указывают технические минимальные или оптимальные требования по вычислительным мощностям. Эти требования также указываются на официальном сайте необходимого программного обеспечения.
  • Требования к сервисам и службам, которые будут функционировать .
    На сервере могут запускаться десятки и сотни сервисов или служб, все они потребляют вычислительные мощности инстанса. Для правильного выбора типа инстанса следует учитывать совокупную нагрузку от всех потребителей.
  • Нагрузка создаваемая пользователями сервисов весьма весомо влияет на выбор
    типа инстанса. Следует учитывать, как количество пользователей, так и характер возможных нагрузок. К примеру, для терминального сервера будет важно: сколько пользователей будет одновременно использовать сервер и каким программным обеспечением они будут пользоваться. Если это будет web-браузер с доступом в сеть Internet, то необходимо заложить достаточное количество оперативной памяти.

Совет

Обратите внимание, что, если совокупная расчётная мощность превышает параметры предлагаемых типов инстансов, следует задуматься над изменением архитектурного решения и создать два инстанса и разнести сервисы между ними. Предположим необходимо создать виртуальный сервер на 64 ядра и 500GB RAM, это больше чем тип SIM-C32R192. В данном случае можно создать два инстанса с параметрами SIM-C32R192 или четыре инстанса используя тип SIM-C16R128.

Такое решение позволит организовать более защищенную и отказоустойчивую архитектуру, повышая ее доступность и надежность.

Подсказка

Если по каким то причинам необходимо сменить тип инстанса, то Вы можете ознакомиться с этим процессом в нашей статье - Изменение типа инстанса

Просмотреть доступное количество vCPU в разрезе каждой группы типов инстансов можно в панеле управления вашего проекта - Dashboard.

../_images/overview_limit_summary.png
  • Power Flavors - vCPU (3,3GHz) отображаются как «PowerCPU».
  • Standard Flavors - vCPU (2,3-2,6GHz) отображаются как «StdCPU».