新聞中心
周一早上,軟件開發(fā)平臺GitHub出現(xiàn)了嚴(yán)重宕機(jī),眾多開發(fā)人員為之抓狂。

創(chuàng)新互聯(lián)公司于2013年開始,公司以網(wǎng)站建設(shè)、成都網(wǎng)站建設(shè)、系統(tǒng)開發(fā)、網(wǎng)絡(luò)推廣、文化傳媒、企業(yè)宣傳、平面廣告設(shè)計等為主要業(yè)務(wù),適用行業(yè)近百種。服務(wù)企業(yè)客戶上1000+,涉及國內(nèi)多個省份客戶。擁有多年網(wǎng)站建設(shè)開發(fā)經(jīng)驗(yàn)。為企業(yè)提供專業(yè)的網(wǎng)站建設(shè)、創(chuàng)意設(shè)計、宣傳推廣等服務(wù)。 通過專業(yè)的設(shè)計、獨(dú)特的風(fēng)格,為不同客戶提供各種風(fēng)格的特色服務(wù)。
GitHub故障是從04:06 UTC(03:06 BST)開始的,在09:31 BST已得到了解決。
這次事件讓人們對單單在2020年4月發(fā)生三起單獨(dú)故障后GitHub的可靠性提出了新的疑問。
GitHub將4月的那三次故障分別歸咎于:
- 軟件負(fù)載均衡系統(tǒng)的錯誤配置破壞了在服務(wù)于GitHub.com的應(yīng)用程序與其依賴的內(nèi)部服務(wù)之間的流量內(nèi)部路由;
- 數(shù)據(jù)庫連接配置錯誤,與當(dāng)時進(jìn)行中的數(shù)據(jù)分區(qū)工作有關(guān),“導(dǎo)致意外地進(jìn)入到生產(chǎn)環(huán)境”;
- 網(wǎng)絡(luò)配置“無意中應(yīng)用于我們的生產(chǎn)網(wǎng)絡(luò)”。
GitHub在4月曾承認(rèn),其模擬實(shí)驗(yàn)室環(huán)境存在問題。
該公司稱:“該模擬環(huán)境構(gòu)建數(shù)據(jù)庫和數(shù)據(jù)庫連接的方式與生產(chǎn)環(huán)境不一樣。這可能導(dǎo)致生產(chǎn)環(huán)境所特有的連接變更的可測試性受限制。我們會在未來幾個月內(nèi)解決這個問題?!?/p>
GitHub的大部分平臺都在其自己的裸機(jī)基礎(chǔ)架構(gòu)上運(yùn)行,網(wǎng)絡(luò)基礎(chǔ)架構(gòu)則“圍繞Clos網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)而建,每個網(wǎng)絡(luò)設(shè)備都通過邊界網(wǎng)關(guān)協(xié)議(BGP)共享路由?!?/p>
GitHub在2018年被微軟以75億美元的價格收購,被5000多萬開發(fā)人員所使用??紤]到它支持的工作負(fù)載以及外界廣泛依賴它以確保高可用性,像這樣的大規(guī)模故障可能會帶來嚴(yán)重影響。
與其他許多大型基礎(chǔ)架構(gòu)提供商一樣,GitHub的所有者微軟也面臨這個挑戰(zhàn):新冠疫情后遠(yuǎn)程工作人員數(shù)量激增,從而導(dǎo)致工作負(fù)載激增,因此需要迅速擴(kuò)大數(shù)據(jù)中心基礎(chǔ)架構(gòu)的規(guī)模。微軟在4月份承認(rèn),疫情過后,它面臨供應(yīng)鏈方面的一些問題。
眾多網(wǎng)友在twitter、微博議論:
由于全球各地的工廠紛紛關(guān)閉,大企業(yè)和超大規(guī)模公司需要檢修數(shù)據(jù)中心,新冠疫情嚴(yán)重影響了全球服務(wù)器硬件供應(yīng)鏈。(Dropbox的首席技術(shù)官表示,他公司的數(shù)據(jù)中心團(tuán)隊“在8周內(nèi)主動更換掉了30000個部件”,以安全地減少現(xiàn)場工作人員)。
與此同時,芯片制造商AMD在第一季度財報電話會議上表示,新冠疫情危機(jī)期間的短短10天內(nèi),一家未透露名稱的云提供商為數(shù)據(jù)中心增加了10000臺服務(wù)器,由于工作負(fù)載猛增,該云提供商拼命擴(kuò)大其基礎(chǔ)架構(gòu)的規(guī)模。
然而,GitHub的問題似乎主要還是跟模擬環(huán)境與生產(chǎn)環(huán)境之間的缺口方面的問題有關(guān)。
名稱欄目:GitHub全球崩潰:數(shù)百萬開發(fā)人員下班;國產(chǎn)Github呼聲強(qiáng)烈
當(dāng)前URL:http://www.5511xx.com/article/cohsghg.html


咨詢
建站咨詢
