Brocade DCX 8510 inter DC latency - понимание OID для поиска проблем L1
Попытка определить, есть ли некоторая периодическая задержка между DC на каналах FC, но иметь доступ только к счетчикам OID для DCX 8510. Поскольку это канал L1 через DWDM, у поставщика услуг нет статистики для измерения возможных проблем. кроме подключения тестового комплекта, который всегда выходит чистым, так как проблема периодически.
Наблюдать скачки значений для этого OID при возникновении проблемы, но попытаться найти правильную информацию о ней действительно сложно.
swfcportrxbados
Будем весьма благодарны за любую помощь в лучшем объяснении этого OID и указателя на некоторую информацию для лучшего понимания результатов SNMP.
1 ответ
Фон
swFCPortRxBadOs отслеживает количество недопустимых упорядоченных наборов, в большинстве случаев это ошибка физического или виртуального интерфейса, она также может применяться к объединительной плате.
Неверно упорядоченные наборы для DWDM или прямого FC, будь то Cisco или Broccade, часто являются результатом плохо работающего хоста или узла. Массив RAID с длиной диска более 6 или около того на другой стороне DWDM может привести к тайм-ауту виртуального канала. Как правило, это означает, что у вас виртуальные каналы "зависают". Когда порт коммутатора исчерпывает все доступные кредиты, порт коммутатора, подключенный к устройству, должен содержать дополнительные исходящие кадры, пока устройство не вернет кредит для входа в буфер. Когда устройство не отвечает в течение тайм-аута, передающий коммутатор будет удерживать кадры дольше, что приводит к высокой загрузке буфера. Это приводит к тому, что коммутатор снижает скорость, с которой он возвращает буферные кредиты другим передающим коммутаторам. Затем он распространяется через коммутаторы (потенциально несколько коммутаторов с устройствами, пытающимися отправить кадры хостам, или коммутаторы, подключенные к коммутатору с хостом или коммутатором с высокой задержкой) и влияет на производительность матрицы.
Итак..... Следующие шаги
Возможные виновники
Недостаток физического уровня - SFP, который является или идет плохо, находится на другой стороне или на коммутаторе, на который вы смотрите.
Виртуальный канал "застрял" - объяснение выше. Если виртуальный канал завис, то он не пропускает трафик или сигналы, и вы увидите увеличение счетчиков er_bad_os.
Brocade рекомендует включить bottleneckmon в FOS. Это сбросит VC (виртуальный канал), когда есть двухсекундное окно без трафика.
bottleneckmon –cfgcredittools -intport -recover onLrOnly
Когда один или несколько кредитов потеряны, он начнет искать свое окно для сброса VC.
Этот великолепный PDF-документ о передовых методах обеспечения отказоустойчивости тканей http://www.brocade.com/downloads/documents/html_product_manuals/NOS_MIB_301/wwhelp/wwhimpl/common/html/wwhelp.htm
используйте portstatushow для вашего порта и посмотрите, получите ли вы er_bad_os 591691 Неверно упорядоченный набор
Это может дать вам гарантию того, что вы испытываете недопустимый упорядоченный набор, так что вы можете начать устранение неполадок с кредитами и буферами, в которых часто встречаются проблемы такого типа.
Отличная статья о буферных кредитах. http://community.brocade.com/t5/Mainframe-Solutions/Buffer-Credits-and-Frame-Size-calculation-in-FOS-7-1/ba-p/455