加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

韓國KT割接時(shí)路由配置錯(cuò)誤,導(dǎo)致全網(wǎng)癱瘓

2021/10/28
743
閱讀需 5 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

當(dāng)?shù)貢r(shí)間2021年10月25日11點(diǎn)20分開始,韓國運(yùn)營商KT的整個(gè)有線和無線互聯(lián)網(wǎng)服務(wù)在全國范圍內(nèi)發(fā)生中斷,導(dǎo)致其所有客戶在大約一個(gè)小時(shí)內(nèi)無法連接互聯(lián)網(wǎng)和使用電話服務(wù)。

同時(shí),因KT整網(wǎng)服務(wù)中斷,還并發(fā)導(dǎo)致了韓國另外兩家運(yùn)營商SKT和LG U+的網(wǎng)絡(luò)擁塞。

可以說,在這一個(gè)小時(shí)內(nèi),韓國通信界遭遇了“至暗時(shí)刻”。

10月26日,KT官網(wǎng)以CEO的名義發(fā)布了公開致歉信,并對事故原因進(jìn)行了確認(rèn)。

信中表示,對于引起這起重大網(wǎng)絡(luò)事故的原因,最初估計(jì)是因外部DDoS攻擊導(dǎo)致,但最終確認(rèn)原因?yàn)椋涸诟鼡Q路由器以升級網(wǎng)絡(luò)的時(shí)候,因網(wǎng)絡(luò)路由設(shè)置錯(cuò)誤導(dǎo)致。

路由設(shè)置錯(cuò)誤,可能會導(dǎo)致數(shù)據(jù)流量流向不正確而引起局部節(jié)點(diǎn)負(fù)荷過載,從而引發(fā)全網(wǎng)癱瘓。

看起來,與前幾天日本軟銀遭遇的網(wǎng)絡(luò)重大故障相似,本次事故也是因割接導(dǎo)致。

盡管KT已公布故障原因,但并未進(jìn)行詳細(xì)解釋,仍然給業(yè)界留下了不少謎團(tuán)...

1 為何沒有自愈保護(hù)?

電信網(wǎng)絡(luò)一直以高穩(wěn)定性、高可靠性著稱,早在PSTN電話網(wǎng)絡(luò)時(shí)代,網(wǎng)絡(luò)線路就設(shè)置了1+1保護(hù)或自愈保護(hù),主用線路在發(fā)生中斷后,通常可在50ms內(nèi)自動切換到備用線路,或從相反方向迂回連通。

2018年11月,因KT位于首爾Ahyeon區(qū)中心的電信大樓發(fā)生火災(zāi),導(dǎo)致該地區(qū)網(wǎng)絡(luò)癱瘓,通信服務(wù)中斷了數(shù)天。事后,有韓國業(yè)內(nèi)人士質(zhì)疑,這可能是因?yàn)镵T的網(wǎng)絡(luò)拓?fù)?/a>設(shè)計(jì)不夠先進(jìn),設(shè)備和線路的冗余配置和自愈保護(hù)不夠完善導(dǎo)致。他認(rèn)為,盡管KT的骨干匯聚網(wǎng)絡(luò)擁有充分的冗余配置和自愈保護(hù)機(jī)制,但在昂貴而龐大的接入網(wǎng)部分,冗余配置不夠充足,環(huán)狀自愈保護(hù)設(shè)計(jì)不夠完善,從而導(dǎo)致了此次火災(zāi)后網(wǎng)絡(luò)長時(shí)間中斷。

但本次事故比2018年的火災(zāi)事故要嚴(yán)重得多,火災(zāi)事故影響范圍為一個(gè)區(qū)域,而本次事故影響范圍為全國。既然影響范圍這么廣,可以估計(jì),本次事故的故障點(diǎn)并非在網(wǎng)絡(luò)接入層,而是在網(wǎng)絡(luò)骨干核心部分,這就好比“主動脈”阻塞,導(dǎo)致全網(wǎng)的“血液”輸送不暢。

那問題是,難道KT的核心網(wǎng)絡(luò)也缺乏完善的自愈保護(hù)機(jī)制?這顯然是不太可能的。那是不是還有其他原因?

2 是否因?yàn)锽GP路由配置錯(cuò)誤導(dǎo)致?

BGP路由錯(cuò)誤會阻止數(shù)據(jù)包到達(dá)其預(yù)期的IP 地址和服務(wù)器而導(dǎo)致服務(wù)中斷。聯(lián)想到最近 Facebook、Instagram和WhatsApp服務(wù)中斷均由BGP路由問題導(dǎo)致,一些業(yè)內(nèi)人士推測可能是由于BGP配置錯(cuò)誤導(dǎo)致。

3 為什么割接操作在白天進(jìn)行?

為避免影響網(wǎng)絡(luò)業(yè)務(wù),割接操作一般都在凌晨進(jìn)行,這是電信業(yè)的常識。但本次事故因“更換路由器以升級網(wǎng)絡(luò)”引起,且事故發(fā)生時(shí)間為白天。難道有什么不得已的原因非要在白天11點(diǎn)進(jìn)行割接操作?還是因?yàn)榱璩扛罱硬僮骱?,白天才發(fā)生了故障?

4 是設(shè)備問題還是人工操作失誤?

路由配置可能是自動化的,也可能是人工操作,那到底是設(shè)備的問題,還是人工操作失誤?

不管是設(shè)備問題,還是人為操作失誤,還是缺乏備份系統(tǒng),一些韓國業(yè)內(nèi)人士表示,這都反映了KT在網(wǎng)絡(luò)和流程管理上存在疏忽。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險(xiǎn)等級 參考價(jià)格 更多信息
KSZ8863RLL 1 Microchip Technology Inc DATACOM, LAN SWITCHING CIRCUIT, PQFP48

ECAD模型

下載ECAD模型
$4.82 查看
KSZ8895MQI 1 Micrel Inc Ethernet Transceiver, CMOS, PQFP128, LEAD FREE, PLASTIC, QFP-128
$8.91 查看
KSZ9021RNI 1 Microchip Technology Inc DATACOM, ETHERNET TRANSCEIVER, QCC48

ECAD模型

下載ECAD模型
$5.6 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜