日韩欧美人人爱人人操国产 ,亚洲一区二区三区免得费观看视频 ,熿片A片免费亚洲bt网站

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案

資深程序員多年總結(jié)：解密Kafka吞吐量高的原因

前端Kafka 眾所周知kafka的吞吐量比一般的消息隊列要高，號稱the fastest，那他是如何做到的，讓我們從以下幾個方面分析一下原因。

眾所周知kafka的吞吐量比一般的消息隊列要高，號稱the fastest，那他是如何做到的，讓我們從以下幾個方面分析一下原因。

生產(chǎn)者（寫入數(shù)據(jù)）

生產(chǎn)者（producer）是負(fù)責(zé)向Kafka提交數(shù)據(jù)的，我們先分析這一部分。
Kafka會把收到的消息都寫入到硬盤中，它絕對不會丟失數(shù)據(jù)。為了優(yōu)化寫入速度Kafak采用了兩個技術(shù)，順序?qū)懭牒蚆MFile。

順序?qū)懭?/h3>
因為硬盤是機(jī)械結(jié)構(gòu)，每次讀寫都會尋址->寫入，其中尋址是一個“機(jī)械動作”，它是最耗時的。所以硬盤最“討厭”隨機(jī)I/O，最喜歡順序I/O。為了提高讀寫硬盤的速度，Kafka就是使用順序I/O。
上圖就展示了Kafka是如何寫入數(shù)據(jù)的，每一個Partition其實都是一個文件，收到消息后Kafka會把數(shù)據(jù)插入到文件末尾（虛框部分）。
這種方法有一個缺陷——沒有辦法刪除數(shù)據(jù)，所以Kafka是不會刪除數(shù)據(jù)的，它會把所有的數(shù)據(jù)都保留下來，每個消費(fèi)者（Consumer）對每個Topic都有一個offset用來表示讀取到了第幾條數(shù)據(jù)。
上圖中有兩個消費(fèi)者，Consumer1有兩個offset分別對應(yīng)Partition0、Partition1（假設(shè)每一個Topic一個Partition）；Consumer2有一個offset對應(yīng)Partition2。這個offset是由客戶端SDK負(fù)責(zé)保存的，Kafka的Broker完全無視這個東西的存在；一般情況下SDK會把它保存到zookeeper里面。(所以需要給Consumer提供zookeeper的地址)。
如果不刪除硬盤肯定會被撐滿，所以Kakfa提供了兩種策略來刪除數(shù)據(jù)。一是基于時間，二是基于partition文件大小。具體配置可以參看它的配置文檔。

Memory Mapped Files

即便是順序?qū)懭胗脖P，硬盤的訪問速度還是不可能追上內(nèi)存。所以Kafka的數(shù)據(jù)并不是實時的寫入硬盤，它充分利用了現(xiàn)代操作系統(tǒng)分頁存儲來利用內(nèi)存提高I/O效率。
Memory Mapped Files(后面簡稱mmap)也被翻譯成內(nèi)存映射文件，在64位操作系統(tǒng)中一般可以表示20G的數(shù)據(jù)文件，它的工作原理是直接利用操作系統(tǒng)的Page來實現(xiàn)文件到物理內(nèi)存的直接映射。完成映射之后你對物理內(nèi)存的操作會被同步到硬盤上（操作系統(tǒng)在適當(dāng)?shù)臅r候）。

通過mmap，進(jìn)程像讀寫硬盤一樣讀寫內(nèi)存（當(dāng)然是虛擬機(jī)內(nèi)存），也不必關(guān)心內(nèi)存的大小有虛擬內(nèi)存為我們兜底。
使用這種方式可以獲取很大的I/O提升，省去了用戶空間到內(nèi)核空間復(fù)制的開銷（調(diào)用文件的read會把數(shù)據(jù)先放到內(nèi)核空間的內(nèi)存中，然后再復(fù)制到用戶空間的內(nèi)存中。）也有一個很明顯的缺陷——不可靠，寫到mmap中的數(shù)據(jù)并沒有被真正的寫到硬盤，操作系統(tǒng)會在程序主動調(diào)用flush的時候才把數(shù)據(jù)真正的寫到硬盤。Kafka提供了一個參數(shù)——producer.type來控制是不是主動flush，如果Kafka寫入到mmap之后就立即flush然后再返回Producer叫同步(sync)；寫入mmap之后立即返回Producer不調(diào)用flush叫異步(async)。
mmap其實是Linux中的一個函數(shù)就是用來實現(xiàn)內(nèi)存映射的，謝謝Java NIO，它給我提供了一個mappedbytebuffer類可以用來實現(xiàn)內(nèi)存映射（所以是沾了Java的光才可以如此神速和Scala沒關(guān)系?。。?/p>

消費(fèi)者（讀取數(shù)據(jù)）

Kafka使用磁盤文件還想快速？這是我看到Kafka之后的第一個疑問，ZeroMQ完全沒有任何服務(wù)器節(jié)點，也不會使用硬盤，按照道理說它應(yīng)該比Kafka快?？墒菍嶋H測試下來它的速度還是被Kafka“吊打”?！?strong>一個用硬盤的比用內(nèi)存的快”，這絕對違反常識；如果這種事情發(fā)生說明——它作弊了。
沒錯，Kafka“作弊”。無論是順序?qū)懭脒€是mmap其實都是作弊的準(zhǔn)備工作。

如何提高Web Server靜態(tài)文件的速度 ?

仔細(xì)想一下，一個Web Server傳送一個靜態(tài)文件，如何優(yōu)化？答案是zero copy。傳統(tǒng)模式下我們從硬盤讀取一個文件是這樣的

先復(fù)制到內(nèi)核空間（read是系統(tǒng)調(diào)用，放到了DMA，所以用內(nèi)核空間），然后復(fù)制到用戶空間(1,2)；從用戶空間重新復(fù)制到內(nèi)核空間（你用的socket是系統(tǒng)調(diào)用，所以它也有自己的內(nèi)核空間），最后發(fā)送給網(wǎng)卡（3、4）。

Zero Copy中直接從內(nèi)核空間（DMA的）到內(nèi)核空間（Socket的），然后發(fā)送網(wǎng)卡。
這個技術(shù)非常普遍，The C10K problem 里面也有很詳細(xì)的介紹，Nginx也是用的這種技術(shù)，稍微搜一下就能找到很多資料。

Java的NIO提供了FileChannle，它的transferTo、transferFrom方法就是Zero Copy。

Kafka是如何耍賴的?

想到了嗎？Kafka把所有的消息都存放在一個一個的文件中，當(dāng)消費(fèi)者需要數(shù)據(jù)的時候Kafka直接把“文件”發(fā)送給消費(fèi)者。這就是秘訣所在，比如：10W的消息組合在一起是10MB的數(shù)據(jù)量，然后Kafka用類似于發(fā)文件的方式直接扔出去了，如果消費(fèi)者和生產(chǎn)者之間的網(wǎng)絡(luò)非常好（只要網(wǎng)絡(luò)稍微正常一點10MB根本不是事。。。家里上網(wǎng)都是100Mbps的帶寬了），10MB可能只需要1s。所以答案是——10W的TPS，Kafka每秒鐘處理了10W條消息。
可能你說：不可能把整個文件發(fā)出去吧？里面還有一些不需要的消息呢？是的，Kafka作為一個“高級作弊分子”自然要把作弊做的有逼格。Zero Copy對應(yīng)的是sendfile這個函數(shù)（以Linux為例），這個函數(shù)接受

out_fd作為輸出（一般及時socket的句柄）

in_fd作為輸入文件句柄

off_t表示in_fd的偏移（從哪里開始讀?。?/p>

size_t表示讀取多少個

沒錯，Kafka是用mmap作為文件讀寫方式的，它就是一個文件句柄，所以直接把它傳給sendfile；偏移也好解決，用戶會自己保持這個offset，每次請求都會發(fā)送這個offset。（還記得嗎？放在zookeeper中的）；數(shù)據(jù)量更容易解決了，如果消費(fèi)者想要更快，就全部扔給消費(fèi)者。如果這樣做一般情況下消費(fèi)者肯定直接就被壓死了；所以Kafka提供了的兩種方式——Push，我全部扔給你了，你死了不管我的事情；Pull，好吧你告訴我你需要多少個，我給你多少個。

總結(jié)

Kafka速度的秘訣在于，它把所有的消息都變成一個的文件。通過mmap提高I/O速度，寫入數(shù)據(jù)的時候它是末尾添加所以速度最優(yōu)；讀取數(shù)據(jù)的時候配合sendfile直接暴力輸出。阿里的RocketMQ也是這種模式，只不過是用Java寫的。

單純的去測試MQ的速度沒有任何意義，Kafka這種“暴力”、“流氓”、“無恥”的做法已經(jīng)脫了MQ的底褲，更像是一個暴力的“數(shù)據(jù)傳送器”。所以對于一個MQ的評價只以速度論英雄，世界上沒人能干的過Kafka，我們設(shè)計的時候不能聽信網(wǎng)上的流言蜚語——“Kafka最快，大家都在用，所以我們的MQ用Kafka沒錯”。在這種思想的作用下，你可能根本不會關(guān)心“失敗者”；而實際上可能這些“失敗者”是更適合你業(yè)務(wù)的MQ。

新聞標(biāo)題：資深程序員多年總結(jié)：解密Kafka吞吐量高的原因
瀏覽路徑：http://www.5511xx.com/article/ccichcg.html

日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区