立即咨询
MQ 典型故障案例:集群信息混乱

故障现象

 

 

某些场景下 MQ 集群信息会进入混乱状态,集群信息混乱后,刷新集群信息时,会导致产生 FDC 日志及错误日志,严重时集群通道 not running 集群进程amqrrmfa 会异常终止,需要重启队列管理器进行恢复。

 

 

分析过程

 

 

通过收集并分析 MQ dump 可以看到,该集群名字叫做NFXSCLUSTER,但在 dump 中能够看到有对象指向了一个未知的集群名字 'E.RQ.202 NFXS_QM1_201' 表示集群信息已经混乱。

 

11/29/15 17:39:22 - Process(48431228.1) User(root) Pr ogram(amqrrmfa)Host(NFXS1)AMQ9419: No cluster-receiver channels for cluster 'E.RQ.20

2NFXS_QM1_201'EXPLANATION:The repository manager has received information about a cluster for which nocluster-receiver channels are known. ACTION:Define cluster-receiver channels for the cluster on the local queue manager.

 

 

解决方案

 

 

MQ 有一个高危补丁 IV25030,如 MQ 集群信息未混乱,安装该补丁可以有效预防,使集群信息不混乱; 如集群信息已经混乱,安装该补丁也无法使集群信息回复正常,需要冷启 MQ 集群进行恢复。

国内领先的I架构服务+产品提供商
立即领取企业福利 预约您的专属顾问
400-1037-370