12700e堆疊重啟6小時(shí)45分鐘,ap仍然無(wú)法上線。
1、ap存在認(rèn)證掉線記錄,掉線原因是ip沖突:ip address conflict
2、ap上線需要mac 認(rèn)證
3、設(shè)備也存在ap的arp沖突日志
處理過(guò)程
1、12700e備升主時(shí)dhcp server ip分配記錄丟失,而ap未重啟,導(dǎo)致12700e待分配的ip被未重啟的ap占用;
2、12700e分配ip前ping檢測(cè)沖突功能關(guān)閉(dhcp sever ping packet 0,默認(rèn)值2);
3、和現(xiàn)場(chǎng)工程師了解連接ap的接入設(shè)備配置端口隔離,導(dǎo)致ap dhcp獲取ip后arp探測(cè)ip沖突功能也失效。
4、進(jìn)一步檢查dhcp server配置,發(fā)現(xiàn)地址池可分配ip數(shù)量不足、dhcp server可分配地址掩碼被設(shè)置為24位,而ap數(shù)量有379個(gè)
5、由于地址池被手動(dòng)清除過(guò)分配記錄,部分ap使用沖突的ip地址上線,因此上線ap數(shù)量超過(guò)254個(gè)
6、部分ap使用沖突的ip地址上線
根因
通過(guò)云控制器修改接口地址池ip地址掩碼,擴(kuò)大可分配地址范圍,備用主控板基于舊掩碼自動(dòng)生成dhcp sever mask x.x.x.x配置,備用主控板只能分配舊掩碼范圍內(nèi)的ip地址,舊掩碼范圍之外的地址分配記錄丟失。
解決方案
業(yè)務(wù)恢復(fù)方案:
開(kāi)啟dhcp server分配ip地址前ping檢測(cè)功能,重新配置ap地址池,重啟所有ap,之后ap上線正常。
最終解決方案:
開(kāi)發(fā)補(bǔ)丁解決云控制器修改接口地址池ip地址掩碼導(dǎo)致備用主控板地址分配記錄丟失問(wèn)題,預(yù)計(jì)9月初發(fā)布。