日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關咨詢
選擇下列產品馬上在線溝通
服務時間:8:30-17:00
你可能遇到了下面的問題
關閉右側工具欄

新聞中心

這里有您想知道的互聯網營銷解決方案
創(chuàng)新互聯Hadoop教程:HadoopFailover

失敗類型

  1. 程序問題
  2. 進程崩潰
  3. 硬件問題

失敗處理

任務失敗

  1. 運行時異?;蛘逬VM退出都會報告給ApplicationMaster
  2. 通過心跳來檢查掛住的任務(timeout),會檢查多次(可配置)才判斷該任務是否失效
  3. 一個作業(yè)的任務失敗率超過配置,則認為該作業(yè)失敗
  4. 失敗的任務或作業(yè)都會有ApplicationMaster重新運行

ApplicationMaster失敗

  1. ApplicationMaster定時發(fā)送心跳信號到ResourceManager,通常一旦ApplicationMaster失敗,則認為失敗,但也可以通過配置多次后才失敗
  2. 一旦ApplicationMaster失敗,ResourceManager會啟動一個新的ApplicationMaster
  3. 新的ApplicationMaster負責恢復之前錯誤的ApplicationMaster的狀態(tài)(yarn.app.mapreduce.am.job.recovery.enable=true),這一步是通過將應用運行狀態(tài)保存到共享的存儲上來實現的,ResourceManager不會負責任務狀態(tài)的保存和恢復
  4. Client也會定時向ApplicationMaster查詢進度和狀態(tài),一旦發(fā)現其失敗,則向ResouceManager詢問新的ApplicationMaster

NodeManager失敗

  1. NodeManager定時發(fā)送心跳到ResourceManager,如果超過一段時間沒有收到心跳消息,ResourceManager就會將其移除
  2. 任何運行在該NodeManager上的任務和ApplicationMaster都會在其他NodeManager上進行恢復
  3. 如果某個NodeManager失敗的次數太多,ApplicationMaster會將其加入黑名單(ResourceManager沒有),任務調度時不在其上運行任務

ResourceManager失敗

  1. 通過checkpoint機制,定時將其狀態(tài)保存到磁盤,然后失敗的時候,重新運行
  2. 通過zookeeper同步狀態(tài)和實現透明的HA

可以看出,一般的錯誤處理都是由當前模塊的父模塊進行監(jiān)控(心跳)和恢復。而最頂端的模塊則通過定時保存、同步狀態(tài)和zookeeper來?實現HA

創(chuàng)新互聯公司長期為1000+客戶提供的網站建設服務,團隊從業(yè)經驗10年,關注不同地域、不同群體,并針對不同對象提供差異化的產品和服務;打造開放共贏平臺,與合作伙伴共同營造健康的互聯網生態(tài)環(huán)境。為昌都企業(yè)提供專業(yè)的成都網站制作、網站建設,昌都網站改版等技術服務。擁有十年豐富建站經驗和眾多成功案例,為您定制開發(fā)。


新聞標題:創(chuàng)新互聯Hadoop教程:HadoopFailover
瀏覽地址:http://www.5511xx.com/article/cdoheip.html