Skip to content

Сеть и команды управления

  • RMC подключена к Сети управления (СУ) и поддерживает сетевое соединение с узлами управления и мониторинга комплекса с использованием стека протоколов TCP/IP;

Тест выполняется подключением к RMC используя стандартное приложение ssh с управляющего узла кластера с привилегиями пользователя root.

Результатом исполнения проверки является попадание на узел RMC по протоколу SSH. Протокол SSH входит в семейство протоколов TCP/IP, и, как результат, удачное подключение к RMC по протоколу SSH гарантирует работоспособность соединения с использованием стека протоколов TCP/IP.

Команда ssh

root@head3:~
# ssh root@n01p001-nmc

Пример исполнения команды

-----------------------------------------------------
   RSC NMC: imx287-20170424-11
 -----------------------------------------------------

[root@nmc-pos-s-SEI8-p-44:~]$
  • RMC реализует функционал удаленного управления – все управляющие команды RMC могут быть инициированы со стороны любого узла управления и мониторинга вычислительных систем информационной инфраструктуры ЦМД, и переданы RMC с использованием Сети управления (СУ) без необходимости наличия физического доступа к RMC.

Тест выполняется запуском управляющей команды RMC используя стандартное приложение ssh с управляющего узла кластера с привилегиями пользователя root.

Вывод управляющей команды RMC зависит от команды RMC - например команда /tools/nmc_ipmi_getuuid.sh выводит уникальный идентификатор ВУ в формате uuid. Тест считается завершенным если вывод запущенной команды соответствует выводу команды описанному в документации к данной команде RMC.

Команда ssh

root@head3:~
# ssh root@n01p001-nmc '/tools/nmc_ipmi_getuuid.sh'

Пример исполнения команды

 80b4a451-2566-e611-906e-0012795d96dd
  • RMC автоматически определяет расположение ВУ и обнаруживает изменение места установки ВУ в шкафах вычислительных систем (ШВ), а также определяет порт и изменение порта подключения ВУ в коммутаторах Сети управления;

Тест выполняется запуском управляющей команды mc_get_lldp_info.sh используя стандартное приложение ssh с управляющего узла кластера с привилегиями пользователя root.

Результатом исполнения данной команды являются данные о маршрутизаторе и порту в котором находится данный RMC. Для обнаружения изменение местоположение ВУ или изменение порта подключения ВУ требуется физическое изменение местоположения узла в ШВ. После установки ВУ на новое место, и запуска управляющей команды mc_get_lldp_info.sh используя стандартное приложение ssh с управляющего узла кластера с привилегиями пользователя root, команда должна показать данные о новом местоположении узла.

Команда ssh

root@head3:~
# ssh root@n02p001-nmc 'mc_get_lldp_info.sh'

Пример исполнения команды

 lldp.eth1.via=LLDP
lldp.eth1.rid=1
lldp.eth1.age=44 days, 19:00:58
lldp.eth1.chassis.mac=30:8d:99:08:32:40
lldp.eth1.chassis.name=SEI8
lldp.eth1.chassis.descr=HP J9781A 2530-48 Switch, revision YA.15.16.0006, ROM YA.15.17 (/ws/swbuildm/rel_orlando_qaoff/code/build/lakes(swbuildm_rel_orlando_qaoff_rel_orlando))
lldp.eth1.chassis.ttl=40
lldp.eth1.chassis.Bridge.enabled=on
lldp.eth1.port.local=45
lldp.eth1.port.descr=45
lldp.eth1.port.auto-negotiation.supported=yes
lldp.eth1.port.auto-negotiation.enabled=yes
lldp.eth1.port.auto-negotiation.10Base-T.hd=yes
lldp.eth1.port.auto-negotiation.10Base-T.fd=yes
lldp.eth1.port.auto-negotiation.100Base-TX.hd=yes
lldp.eth1.port.auto-negotiation.100Base-TX.fd=yes
lldp.eth1.port.auto-negotiation.current=100BaseTXFD - 2 pair category 5 UTP, full duplex mode
lldp.eth1.port.power.supported=no
lldp.eth1.port.power.enabled=no
lldp.eth1.port.power.paircontrol=no
lldp.eth1.port.power.device-type=PSE
lldp.eth1.port.power.pairs=signal
lldp.eth1.port.power.class=class 0
lldp.eth1.vlan.vlan-id=369
lldp.eth1.vlan.pvid=yes
  • RMC поддерживает набор операций совместимый с протоколом IPMI v2 или более поздней версии;

Тест выполняется запуском управляющей команды '/usr/bin/ipmitool lan print 1' используя стандартное приложение ssh с управляющего узла кластера с привилегиями пользователя root. В случае успешного выполнения команды - доступности протокола IPMI v2 на RMC, команды возвращает данные о первом сетевом интерфейсе BMC.

Команда ssh

root@head3:~
# ssh root@n02p001-nmc '/usr/bin/ipmitool lan print 1'

Пример исполнения команды

Set in Progress         : Set Complete
Auth Type Support       : MD5 PASSWORD
Auth Type Enable        : Callback : MD5 PASSWORD
                        : User     : MD5 PASSWORD
                        : Operator : MD5 PASSWORD
                        : Admin    : MD5
                        : OEM      :
IP Address Source       : Static Address
IP Address              : 10.69.0.144
Subnet Mask             : 255.255.0.0
MAC Address             : a4:bf:01:14:17:62
SNMP Community String   : public
IP Header               : TTL=0x00 Flags=0x00 Precedence=0x00 TOS=0x00
BMC ARP Control         : ARP Responses Enabled, Gratuitous ARP Disabled
Gratituous ARP Intrvl   : 0.0 seconds
Default Gateway IP      : 10.69.0.100
Default Gateway MAC     : 00:00:00:00:00:00
Backup Gateway IP       : 0.0.0.0
Backup Gateway MAC      : 00:00:00:00:00:00
802.1q VLAN ID          : 369
802.1q VLAN Priority    : 0
RMCP+ Cipher Suites     : 0,1,2,3,4,6,7,8,9,11,12,13,15,16,17,18
Cipher Suite Priv Max   : caaaaaaaaaaaaaa
                        :     X=Cipher Suite Unused
                        :     c=CALLBACK
                        :     u=USER
                        :     o=OPERATOR
                        :     a=ADMIN
                        :     O=OEM
  • RMC обеспечивает выполнение аппаратного сброса (hardware reset) ВУ для его перезагрузки без необходимости наличия работающей ОС на ВУ;

Тест выполняется запуском управляющей команды /tools/nmc_baseboard_power_hard_off.sh используя стандартное приложение ssh с управляющего узла кластера с привилегиями пользователя root.

После выполнения данной команды, узел будет выключен.

Для подтверждения факта выключения узла выполняется запуск управляющей команды ' /tools/nmc_powerboard_read_status.sh " ' используя стандартное приложение ssh с управляющего узла кластера с привилегиями пользователя root.

Один из параметров, выводимый данной командой, это ток потребляемый ВУ на данный момент - 'MAIN 0.164A OFF'. Значения OFF, обозначают отсутствие энергопотребления, и, как результат, идентифицируют данный ВУ как выключенный.

Выполняется запуск управляющей команды /tools/nmc_baseboard_power_on.sh используя стандартное приложение ssh с управляющего узла кластера с привилегиями пользователя root. Для подтверждения факта включения узла выполняется запуск управляющей команды ' /tools/nmc_powerboard_read_status.sh " ' используя стандартное приложение ssh с управляющего узла кластера с привилегиями пользователя root. Один из параметров, выводимый данной командой, это ток потребляемый ВУ на данный момент - 'MAIN 12.164A OК'. Значения OFF, обозначают отсутствие энергопотребления, и, как результат, идентифицируют данный ВУ как выключенный.

Команда ssh

root@head3:~
# ssh root@n02p001-nmc '/tools/nmc_baseboard_power_hard_off.sh'
# ssh root@n02p001-nmc '/tools/nmc_powerboard_read_status.sh'
# ssh root@n02p001-nmc '/tools/nmc_baseboard_power_on.sh'
# ssh root@n02p001-nmc '/tools/nmc_powerboard_read_status.sh'

Пример исполнения команды

#
ACDC 12.86V  OK
RDND 12.41V  OK
 SSD 12.79V  OK
MAIN 0.81V  OFF
OWRT 3.275V  OK
 STB 12.82V  OK
CTRL 12.81V  OK

MAIN 0.164A  OK

#
ACDC 12.86V  OK
RDND 12.41V  OK
 SSD 12.79V  OK
MAIN 12.81V   OK
OWRT 3.275V  OK
 STB 12.82V  OK
CTRL 12.81V  OK

MAIN 9.164A  OK
  • Команды для обновлений
  • RMC обеспечивает выполнение процедуры удаленного обновления BIOS и других микропрограмм системной платы ВУ;
    • Изменение настроек BIOS с RMC невозможно
    • Тест выполняется запуском управляющей команды '/usr/sbin/nmc_update_bios.sh -target=<список узлов требующих обновления BIOS> -sourсe=< сетевой путь к новой версии BIOS > ' на управляющем узла кластера с привилегиями пользователя root. Результатом выполнения данной команды является обновление версии BIOS. Для проверки версии BIOS выполняется управляющая команда '/tools/nmc_ipmb_getbiosversion.sh' используя стандартное приложение ssh с управляющего узла кластера с привилегиями пользователя root. Версия BIOS, выводимая данной командой, должна соответствовать новой версии BIOS.
    • Тест выполнения процедуры удаленного обновления микропрограмм системной платы ВУ (далее BMC) выполняется запуском управляющей команды '/usr/sbin/nmc_update_bmc.sh -target=<список узлов требующих обновления BMC> -sourсe=< сетевой путь к новой версии BMC > ' на управляющем узла кластера с привилегиями пользователя root. Результатом выполнения данной команды является обновление версии BMC. Для проверки версии BMC выполняется запуском управляющей команды '/tools/nmc_ipmb_getbmcinfo.sh' используя стандартное приложение ssh с управляющего узла кластера с привилегиями пользователя root. Версия BMC, выводимая данной командой, должна соответствовать новой версии BMC.
  • RMC изменяет их конфигурацию;
    • Изменение конфигурации микропрограммы системной платы ВУ (далее BMC) осуществляется инструментом ipmitool установленным на RMC. Тест выполняется запуском управляющей команды '/usr/bin/ipmitool <команда изменения конфигурации BMC>' используя стандартное приложение ssh с управляющего узла кластера с привилегиями пользователя root.
    • Чтение измененных параметров BMC выполняется запуском управляющей команды '/usr/bin/ipmitool <команда чтения конфигурации BMC>' используя стандартное приложение ssh с управляющего узла кластера с привилегиями пользователя root. Вывод данных параметров должен соответствовать параметрам выставленным в пункте (i).
  • RMC выполняет восстановление после сбоя процедуры обновления или изменения конфигурации (в частности, реализовывать функционал: восстановления BIOS (BIOS recovery);
    • Сброс настроек BIOS изменения конфигурации BIOS осуществляется командой /tools/nmc_baseboard_jumper_bios_default.sh на выключенном узле.
      Результатом выполнения данной команды является сброс конфигурации BIOS и включение узла.

Команда ssh

root@head3:~
# ssh root@n02p001-nmc '/tools/nmc_baseboard_power_hard_off.sh'
# ssh root@n02p001-nmc '/tools/nmc_powerboard_read_status.sh'
# ssh root@n02p001-nmc '/tools/nmc_baseboard_jumper_bios_default.sh'
# ssh root@n02p001-nmc '/tools/nmc_powerboard_read_status.sh'

Пример исполнения команды

#
ACDC 12.86V  OK
RDND 12.41V  OK
 SSD 12.79V  OK
MAIN 0.81V  OFF
OWRT 3.275V  OK
 STB 12.82V  OK
CTRL 12.81V  OK

MAIN 0.164A  OK

#
ACDC 12.86V  OK
RDND 12.41V  OK
 SSD 12.79V  OK
MAIN 12.81V   OK
OWRT 3.275V  OK
 STB 12.82V  OK
CTRL 12.81V  OK

MAIN 9.164A  OK
    6.3.2 Загрузка из резервной копии BIOS осуществляется запуском управляющей команды  /tools/nmc_baseboard_jumper_bios_recovery_on.sh используя стандартное приложение ssh с управляющего узла кластера с привилегиями пользователя root.
    Для проверки версии BIOS выполняется управляющая команда '/tools/nmc_ipmb_getbiosversion.sh'  используя стандартное приложение ssh с управляющего узла кластера с привилегиями пользователя root. Версия BIOS должна соответствовать версии recovery BIOS.

-  RMC возврат к последней работоспособной версии BIOS ВУ в случае сбоя процесса обновления BIOS);
Тест выполняется запуском управляющей команды  /usr/sbin/nmc_restore_bios.sh используя стандартное приложение ssh с управляющего узла кластера с привилегиями пользователя root.
Для проверки версии BIOS выполняется управляющая команда '/tools/nmc_ipmb_getbiosversion.sh'  используя стандартное приложение ssh с управляющего узла кластера с привилегиями пользователя root. Версия BIOS должна соответствовать восстановленной версии BIOS.
  • RMC обеспечивает чтение значения моментального энергопотребления узла, процессоров и памяти ВУ; Тест выполняется запуском управляющей команды '/tools/nmc_ipmi_read_power_consumption.sh ' используя стандартное приложение ssh с управляющего узла кластера с привилегиями пользователя root. Выводятся параметры температуры или термального запаса для центральных процессоров и памяти, установленной в ВУ

Utils

Основная утилита для работы с Cypres & GPIO - nmc_cmd_module (конфиги команд находятся в etc/mc_hal_config)

Для вывода cписка доступных комманд: nmc_cmd_module -list

grep RebootProgram /etc/slurm/slurm.conf RebootProgram=/etc/slurm/node_reset.sh

cat /etc/slurm/node_reset.sh !/bin/bash

/usr/bin/rsc-ba command run hostname -s reset-node-power

nmc_cmd_module конфиги команд находятся в etc/mc_hal_config