日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關咨詢
選擇下列產(chǎn)品馬上在線溝通
服務時間:8:30-17:00
你可能遇到了下面的問題
關閉右側工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
創(chuàng)新互聯(lián)Hadoop教程:HadoopHDFS

簡介

Hadoop Distributed File System,分布式文件系統(tǒng)

創(chuàng)新互聯(lián)建站-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設、高性價比巴南網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫,直接使用。一站式巴南網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設找我們,業(yè)務覆蓋巴南地區(qū)。費用合理售后完善,10年實體公司更值得信賴。

架構

  • Block數(shù)據(jù)塊;

    1. 基本存儲單位,一般大小為64M(配置大的塊主要是因為:
      1)減少搜尋時間,一般硬盤傳輸速率比尋道時間要快,大的塊可以減少尋道時間;
      2)減少管理塊的數(shù)據(jù)開銷,每個塊都需要在NameNode上有對應的記錄;
      3)對數(shù)據(jù)塊進行讀寫,減少建立網(wǎng)絡的連接成本)

    2. 一個大文件會被拆分成一個個的塊,然后存儲于不同的機器。如果一個文件少于Block大小,那么實際占用的空間為其文件的大小

    3. 基本的讀寫單位,類似于磁盤的頁,每次都是讀寫一個塊

    4. 每個塊都會被復制到多臺機器,默認復制3份

 HDFS2.x以后的block默認128M(截止至hadoop3.3.5版本仍是128M)

  • NameNode

    1. 存儲文件的metadata,運行時所有數(shù)據(jù)都保存到內存,整個HDFS可存儲的文件數(shù)受限于NameNode的內存大小

    2. 一個Block在NameNode中對應一條記錄(一般一個block占用150字節(jié)),如果是大量的小文件,會消耗大量內存。同時map task的數(shù)量是由splits來決定的,所以用MapReduce處理大量的小文件時,就會產(chǎn)生過多的map task,線程管理開銷將會增加作業(yè)時間。處理大量小文件的速度遠遠小于處理同等大小的大文件的速度。因此Hadoop建議存儲大文件

    3. 數(shù)據(jù)會定時保存到本地磁盤,但不保存block的位置信息,而是由DataNode注冊時上報和運行時維護(NameNode中與DataNode相關的信息并不保存到NameNode的文件系統(tǒng)中,而是NameNode每次重啟后,動態(tài)重建)

    4. NameNode失效則整個HDFS都失效了,所以要保證NameNode的可用性
  • Secondary NameNode

    1. 定時與NameNode進行同步(定期合并文件系統(tǒng)鏡像和編輯日志,然后把合并后的傳給NameNode,替換其鏡像,并清空編輯日志,類似于CheckPoint機制),但NameNode失效后仍需要手工將其設置成主機
  • DataNode

    1. 保存具體的block數(shù)據(jù)

    2. 負責數(shù)據(jù)的讀寫操作和復制操作

    3. DataNode啟動時會向NameNode報告當前存儲的數(shù)據(jù)塊信息,后續(xù)也會定時報告修改信息

    4. DataNode之間會進行通信,復制數(shù)據(jù)塊,保證數(shù)據(jù)的冗余性

新聞名稱:創(chuàng)新互聯(lián)Hadoop教程:HadoopHDFS
地址分享:http://www.5511xx.com/article/cdsjssc.html