新聞中心
本文介紹了一款開源 Go 語言監(jiān)控項目。

成都創(chuàng)新互聯(lián)公司-專業(yè)網(wǎng)站定制、快速模板網(wǎng)站建設、高性價比南澗網(wǎng)站開發(fā)、企業(yè)建站全套包干低至880元,成熟完善的模板庫,直接使用。一站式南澗網(wǎng)站制作公司更省心,省錢,快速模板網(wǎng)站建設找我們,業(yè)務覆蓋南澗地區(qū)。費用合理售后完善,10多年實體公司更值得信賴。
go-monitor基于golang開發(fā),是一個輕量的,用于服務質量監(jiān)控并實現(xiàn)分析告警的工具。go-monitor目前并不是一個獨立的服務,而是希望被大多數(shù)基于golang開發(fā)的項目如同引入一個日志組件一樣使用。
go-monitor能做什么
通過上報接口、函數(shù)、或者是任意調用服務的耗時以及其成功狀態(tài),go-monitor將按照設定的周期自動進行服務質量分析,統(tǒng)計,并輸出詳細的報告數(shù)據(jù)。
在服務質量達不到理想狀態(tài)時,go-monitor將觸發(fā)告警,并在服務質量回升時,觸發(fā)恢復通知。
go-monitor提供非常多靈活的配置,以使其在大多數(shù)場景下都可以通過參數(shù)調整來勝任服務監(jiān)控的職責。
go-monitor采用無鎖隊列的方式避免并發(fā)鎖帶來的性能問題,MBP2012版本實測500萬次上報數(shù)據(jù)(go test bench)僅花費1.6s即完成所有分析統(tǒng)計(此前并發(fā)鎖方案為1.9s),強大的性能允許你像記錄日志一樣來使用它,并且不需要擔心IO壓力(大部分日志組件使用緩存寫盤的方式提升性能,大并發(fā)下IO壓力明顯)。
什么場景建議使用go-monitor
例如我們開發(fā)了一個web應用以對外提供服務,我們可以嵌入go-monitor,上報每一個訪問的耗時、狀態(tài),以達到對我們整個web應用服務質量的監(jiān)控,也可以在服務質量下滑甚至不可用時及時作出告警,更詳盡的,我們可以上報任何一個調用服務的狀態(tài),例如我們所訪問的數(shù)據(jù)庫,所依賴的外部接口等,除了監(jiān)控服務質量,事實上也可以通過go-monitor提供的統(tǒng)計數(shù)據(jù)了解任何一個服務的平均時延,大到一個完整的接口,小到一個數(shù)據(jù)庫查詢語句。而使用go-monitor的成本非常小,僅僅是在golang項目中引入go-monitor,像使用日志組件一樣,毫無負擔。
使用方法
安裝
go get github.com/blurooo/go-monitor
引入使用
go-monitor的使用非常簡單,只需調用其提供的Register函數(shù)即可注冊得到一個上報客戶端,上報客戶端暴露了Report方法用于上報服務的耗時指標:
import (
"github.com/blurooo/go-monitor"
"time"
)
// 注冊得到一個上報客戶端用于http服務質量監(jiān)控
var httpReportClient = monitor.Register(monitor.ReportClientConfig {
Name: "http服務監(jiān)控",
StatisticalCycle: 100, // 每100ms統(tǒng)計一次服務質量
})
func main() {
t := time.NewTicker(10 * time.Millisecond)
for curTime := range t.C {
// 每10ms向http監(jiān)控客戶端上報一條http服務數(shù)據(jù),耗時0-100ms,狀態(tài)為200
httpReportClient.Report("GET - /app/api/users", uint32(curTime.Nanosecond() % 100), 200)
}
}
go-monitor將每個統(tǒng)計周期(100ms,默認1min)輸出一條服務質量分析報告,例如:
{"timestamp":"2018-01-24T09:10:55.190503145Z","clientName":"http服務監(jiān)控","interfaceName":"GET - /app/api/users","count":10,"successCount":10,"successRate":1,"successMsAver":48,"maxMs":98,"minMs":9,"fastCount":10,"fastRate":1,"failCount":0,"failDistribution":{},"timeConsumingDistribution":{"100~150":0,"150~200":0,"200~250":0,"250~300":0,"300~350":0,"350~400":0,"400~450":0,"450~500":0,"<100":10,">500":0}}默認的報告數(shù)據(jù)將輸出在控制臺,但允許我們定制,例如打印到日志文件或寫入數(shù)據(jù)庫等,只需傳入我們自己的OutputCaller即可:
import (
"github.com/Blurooo/go-monitor"
"time"
)
// 注冊得到一個上報客戶端用于http服務質量監(jiān)控
var httpReportClient = monitor.Register(monitor.ReportClientConfig {
Name: "http服務監(jiān)控",
StatisticalCycle: 100, // 每100ms統(tǒng)計一次服務質量
OutputCaller: func(o *monitor.OutPutData) {
// 寫入數(shù)據(jù)庫等邏輯
...
},
})
func main() {
t := time.NewTicker(10 * time.Millisecond)
for curTime := range t.C {
// 每10ms向http監(jiān)控客戶端上報一條http服務數(shù)據(jù),耗時0-100ms,狀態(tài)為200
httpReportClient.Report("GET - /app/api/users", uint32(curTime.Nanosecond() % 100), 200)
}
}
go-monitor支持多實例,并鼓勵使用多實例。實例之間互不影響,例如在同個應用下,我們除了可以注冊一個http服務監(jiān)控之外,還可以注冊一個函數(shù)耗時監(jiān)控:
// 注冊得到一個上報客戶端用于http服務質量監(jiān)控
var httpReportClient = monitor.Register(monitor.ReportClientConfig {
Name: "http服務監(jiān)控",
})
// 注冊得到一個上報客戶端用于函數(shù)耗時監(jiān)控
var funcReportClient = monitor.Register(monitor.ReportClientConfig {
Name: "函數(shù)耗時監(jiān)控",
})
go-monitor除了分析統(tǒng)計之外,還幫助實現(xiàn)告警策略,這依賴于服務異常的判定規(guī)則。默認當上報code為200時,認為成功。當然,在大多數(shù)應用中,如此簡單的判定規(guī)則通常難以勝任各類復雜的場景。所以go-monitor允許我們使用白名單的方式定制自己的一套規(guī)則:
// 注冊得到一個上報客戶端用于http服務質量監(jiān)控
var httpReportClient = monitor.Register(monitor.ReportClientConfig {
Name: "http服務監(jiān)控",
CodeFeatureMap: map[int]monitor.CodeFeature {
0: {
Success: true,
Name: "成功",
},
10000: {
Success: false,
Name: "服務不可用",
},
}
})
CodeFeatureMap中允許聲明該狀態(tài)碼是否成功,并指定其名稱(使用在統(tǒng)計報告中),除此之外的code都將認為失敗。
除了使用白名單機制來決斷code之外,go-monitor也提供了一個適應性更強的方式去判定(優(yōu)先于CodeFeatureMap):
// 注冊得到一個上報客戶端用于http服務質量監(jiān)控
var httpReportClient = monitor.Register(monitor.ReportClientConfig {
Name: "http服務監(jiān)控",
GetCodeFeature: func(code int) (success bool, name string) {
if code == 0 {
return true, "成功"
} else {
return false, "失敗"
}
},
})
在每個統(tǒng)計周期內,成功率達不到期望的值時,該條目將被標記,在連續(xù)標記若干個統(tǒng)計周期之后,go-monitor便會觸發(fā)成功率不達標告警,告警數(shù)據(jù)明確指明了具體的監(jiān)控服務和告警條目,并附帶連續(xù)被標記為成功率不達標的幾次統(tǒng)計數(shù)據(jù),默認打印到控制臺,但同樣允許我們定制,我們可以按照自己的意愿處理,例如發(fā)送郵件通知相關人等:
// 注冊得到一個上報客戶端用于http服務質量監(jiān)控
var httpReportClient = monitor.Register(monitor.ReportClientConfig {
Name: "http服務監(jiān)控",
AlertCaller: func(clientName string, interfaceName string, alertType monitor.AlertType, recentOutputData []monitor.OutPutData) {
// 處理相關告警
}
})
除了成功率不達標告警,go-monitor也提供了耗時不達標告警,精確到每個監(jiān)控條目都允許定制耗時達標參數(shù)。
// 一個上報客戶端全局的耗時達標值
var httpReportClient = monitor.Register(monitor.ReportClientConfig {
Name: "http服務監(jiān)控",
DefaultFastTime: 1000, // 設定http上報客戶端的默認耗時達標為1000ms內
})
// 具體到一個條目的耗時標準
httpReportClient.AddEntryConfig("GET - /app/api/users", monitor.EntryConfig {
FastLessThan: 100, // 設定接口"GET - /app/api/users"的耗時達標值為100ms以內
})
go-monitor同時也支持服務質量恢復通知,與告警的策略類似,當出現(xiàn)告警狀態(tài)時,后續(xù)若干次連續(xù)標記為服務達標的統(tǒng)計數(shù)據(jù)將觸發(fā)恢復通知,我們只需要定制RecoverCaller即可:
var httpReportClient = monitor.Register(monitor.ReportClientConfig {
Name: "http服務監(jiān)控",
RecoverCaller: func(clientName string, interfaceName string, alertType monitor.AlertType, recentOutputData []monitor.OutPutData) {
// 處理恢復通知
},
})還有更多靈活的配置在go-monitor中得到支持,歡迎大家在使用中發(fā)現(xiàn)它們,更歡迎有意向的開發(fā)人參與到這份工作來,在設想中,希望go-monitor可以脫胎為一個完善的獨立服務,以支持任何系統(tǒng)接入(包括前后端上報),并提供盡可能多的現(xiàn)成方案,例如統(tǒng)計數(shù)據(jù)輸出到數(shù)據(jù)庫,郵箱告警,接口通知等。在此拋磚引玉了:??https://github.com/blurooo/go-monitor??
網(wǎng)頁題目:go-monitor:服務質量統(tǒng)計分析告警工具
轉載來源:http://www.5511xx.com/article/copspdh.html


咨詢
建站咨詢
