新聞中心
Beanstalkd一個高性能分布式內存隊列系統(tǒng)
作者:千石 2011-09-14 10:08:07
開發(fā)
前端
分布式 Beanstalkd之于RabbitMQ,就好比Nginx之于Apache,Varnish之于Squid。后面在項目中使用Beanstalkd的過程中,更發(fā)現(xiàn)其簡單、輕量級、高性能、易使用等特點,以及優(yōu)先級、多隊列、持久化、分布式容錯、超時控制等特性。下面就簡單介紹一下Beanstalkd。

專注于為中小企業(yè)提供網(wǎng)站設計、成都網(wǎng)站設計服務,電腦端+手機端+微信端的三站合一,更高效的管理,為中小企業(yè)新會免費做網(wǎng)站提供優(yōu)質的服務。我們立足成都,凝聚了一批互聯(lián)網(wǎng)行業(yè)人才,有力地推動了成百上千家企業(yè)的穩(wěn)健成長,幫助中小企業(yè)通過網(wǎng)站建設實現(xiàn)規(guī)模擴充和轉變。
之前在微博上調查過大家正在使用的分布式內存隊列系統(tǒng),反饋有Memcacheq,Fqueue, RabbitMQ, Beanstalkd以及l(fā)inkedin的kafka。RabbitMQ使用比較廣泛,Beanstalkd是后起之秀。Beanstalkd之于RabbitMQ,就好比Nginx之于Apache,Varnish之于Squid。后面在項目中使用Beanstalkd的過程中,更發(fā)現(xiàn)其簡單、輕量級、高性能、易使用等特點,以及優(yōu)先級、多隊列、持久化、分布式容錯、超時控制等特性。下面就簡單介紹一下Beanstalkd,不足之處請大家指正。
設計思想
高性能離不開異步,異步離不開隊列,而其內部都是Producer-Comsumer模式的原理。
圖1 Producer-Comsumer模式
應用
Beanstalkd,一個高性能、輕量級的分布式內存隊列系統(tǒng),最初設計的目的是想通過后臺異步執(zhí)行耗時的任務來降低高容量Web應用系統(tǒng)的頁面訪問延遲,支持過有9.5 million用戶的Facebook Causes應用。后來開源,現(xiàn)在有PostRank大規(guī)模部署和使用,每天處理***任務。Beanstalkd是典型的類Memcached設計,協(xié)議和使用方式都是同樣的風格,所以使用過memcached的用戶會覺得Beanstalkd似曾相識。
核心概念
Beanstalkd設計里面的核心概念:
◆ job
一個需要異步處理的任務,是Beanstalkd中的基本單元,需要放在一個tube中。
◆ tube
一個有名的任務隊列,用來存儲統(tǒng)一類型的job,是producer和consumer操作的對象。
◆ producer
Job的生產者,通過put命令來將一個job放到一個tube中。
◆ consumer
Job的消費者,通過reserve/release/bury/delete命令來獲取job或改變job的狀態(tài)。
Beanstalkd中一個job的生命周期如圖2所示。一個job有READY, RESERVED, DELAYED, BURIED四種狀態(tài)。當producer直接put一個job時,job就處于READY狀態(tài),等待consumer來處理,如果選擇延遲put,job就先到DELAYED狀態(tài),等待時間過后才遷移到READY狀態(tài)。consumer獲取了當前READY的job后,該job的狀態(tài)就遷移到RESERVED,這樣其他的consumer就不能再操作該job。當consumer完成該job后,可以選擇delete, release或者bury操作;delete之后,job從系統(tǒng)消亡,之后不能再獲取;release操作可以重新把該job狀態(tài)遷移回READY(也可以延遲該狀態(tài)遷移操作),使其他的consumer可以繼續(xù)獲取和執(zhí)行該job;有意思的是bury操作,可以把該job休眠,等到需要的時候,再將休眠的job kick回READY狀態(tài),也可以delete BURIED狀態(tài)的job。正是有這些有趣的操作和狀態(tài),才可以基于此做出很多意思的應用,比如要實現(xiàn)一個循環(huán)隊列,就可以將RESERVED狀態(tài)的job休眠掉,等沒有READY狀態(tài)的job時再將BURIED狀態(tài)的job一次性kick回READY狀態(tài)。
圖2 Beanstalkd中job的生命周期
特性
Beanstalkd基于的源碼安裝和使用很簡單,在此略過。這里重點介紹一下其幾個很nice的特性。
◆ 優(yōu)先級
支持0到2**32的優(yōu)先級,值越小,優(yōu)先級越高,默認優(yōu)先級為1024。
◆ 持久化
可以通過binlog將job及其狀態(tài)記錄到文件里面,在Beanstalkd下次啟動時可以通過讀取binlog來恢復之前的job及狀態(tài)。
◆ 分布式容錯
分布式設計和Memcached類似,beanstalkd各個server之間并不知道彼此的存在,都是通過client來實現(xiàn)分布式以及根據(jù)tube名稱去特定server獲取job。
◆ 超時控制
為了防止某個consumer長時間占用任務但不能處理的情況,Beanstalkd為reserve操作設置了timeout時間,如果該consumer不能在指定時間內完成job,job將被遷移回READY狀態(tài),供其他consumer執(zhí)行。
不足
在使用中發(fā)現(xiàn)一個Beanstalkd尚無提供刪除一個tube的操作,只能將tube的job依次刪除,并讓Beanstalkd來自動刪除空tube。還有就是Beanstalkd不支持客戶端認證機制(開發(fā)者將應用場景定位在局域網(wǎng))。
后續(xù)工作
1.介紹Beanstalkd的命令和使用
2. 翻譯Beanstalkd協(xié)議
3. 分析Beanstalkd源碼
原文:http://rdc.taobao.com/blog/cs/?p=1201
【編輯推薦】
- LAMP網(wǎng)站架構方案深入分析
- 9月編程語言排行榜:專為機器人玩具設計的語言NXT-G
- 從新浪微博的改版談網(wǎng)頁重構
- 9月10款非常有用的jQuery工具提示插件推薦
- Google強推Dart語言替代JavaScript 意欲何為?
分享文章:Beanstalkd一個高性能分布式內存隊列系統(tǒng)
網(wǎng)頁路徑:http://www.5511xx.com/article/cdhpjjs.html


咨詢
建站咨詢
