RMC(Remote Management Controller)
Remote Management Controller - программно-аппаратный комплекс для управления узлами входящими в состав вычислительного кластера.
- Out-of-band управление и мониторинг
- Независимое питание 12V RMC
- Отказоустойчивость
- Платформонезависимое ПО
- Возможность использовать в роли BMC при установке OpenBmc
Устанавливается на:
- Вычислительные узлы
- Узлы хранения
- Блоки резервного питания
RMC(Remote Management Controller) - ранее называлcя NMC(именно потому большинство комманд управления начинаются с nmc_****) RMC(Remote Managment Controller) - в зависимости от архитектуры узла, позволяет удаленно управлять материнской платой без физического доступа к узлу(упраление дажамерами, питанием, обновление BIOS и тд.), BMC и питанием узла (12v).
Базовая инвентаризация системы
RMC собирает важную системную информацию, которая может быть использована для идентификации и доступа к данному вычислительному узлу
Собираемая информация включает, но не ограничена:
- UUID материнской платы (Intel MB)
- Информация о версии BIOS (Intel MB)
- BMC UUID (Gigabyte MB)
- Сетевую информацию BMC - MAC, IP, etc
- RMC UUID
- RMC Версии аппартного обеспечения
- RMC Версии ПО и прошивки
- RMC Сетевая информация - MAC, IP, etc
- Местоположение узла в шкафу (requires rack-level hardware support)
- Информацию о сетевом расположении вычислительного узла - имя свитча ethernet и порт
- Информацию о производителе вычислительного узла
Большая часть информации доступна стразу же, как RMC-контроллер включен и не требует включения или настройки вычислительного узла
Это позволяет администратору удаленно запустить процедуру конфигурации узла:
- Выполнить диагностику - заметить проблемы с источниками питания, ошибки системы охлаждения и тд.
- Изменить настройки метод загрузки системы и пр.
-
Регистрация
Как только все данные собраны, RMC регистрирует свой вычислительный узел в Cluster Management Database (CMDB)
-
Конфигурация
Администратор может сконфигурировать вычислительный узел при помощи интерфейса управления кластером. Конфигурация может быть применена как при помощи шаблонов, созданных заранее, так и при помощи исполнения команд на RMC или коллекции RMC. В дополнение, вычислительные узел может быть сконфигурирован напрямую, используя конфигурационные утилиты или ipmitool, установленные на RMC
-
Восстановление
Используя прямой доступ к джамперам на материнской плате и имея полный контроль над PSU, RMC может удаленно производить операции, которые обычно потребуют физичческого доступа к материнской плате. Эти операции включают, но не ограничены следующими:
- Intel Motherboards
- BIOS Default - сброс конфигурации BIOS к значениям по умолчанию
- BIOS Recovery - запуск с образа BIOS recovery
- Gigabyte
- Clear CMOS
-
Управление кнопками узла
RMC имеет возможность полного удаленного управления циклами питания сервера: - Кнопки питания - Включить/Выключить узел - Выполнить "жесткое" отключение - Сброс узла - ID button - включение/отключение синего светодиода идентификации на передней панели. Эта возможность используется, чтобы удаленно определить узел для обслуживающего персонала на площадке.
-
USB Flash
RMC может выступать в роли USB Flash устройства для вычислительного узла. Это позволяет нам удаленно обновлять BIOS, BMC и в некоторых случаях даже ОС без физического доступа к вычислительному узлу.
Мониторинг системы
- Мониторинг системы
RMC опрашивает локальные сенсоры и, в зависимости от типа данных, либо отправляет их в CMDB, либо в базу данных временных рядов Influx.
Следующие данные собираются прямо сейчас на всех вычислительных узлах
1. Напряжение:
- Motherboard
- Standby
- SSD
2. Текущее энергопотребление вычислительного узла
3. Ошибки питания
- Over/Under voltage
- Overcurrent
4. Статус сигнала Throttling
5. Статус детектора протечки и его конфигурация
-
Мониторинг датчиков
В дополнение к данным, собираемым с датчиков RMC, RMC также может собирать данные напрямую с BMC, используя ipmitool
На данный момент мы собираем:
- Потребление питания CPU
- CPU И DIMM температуры
-
Вычислительные узлы
- Intel S2600KP
- Intel S7200AP
- Intel S2600BP
- Gigabyte MZ62-HD0
- Gigabyte MH62-HD0