新聞中心
作為一種自由和開(kāi)源的操作系統(tǒng),Linux已經(jīng)成為了眾多開(kāi)發(fā)者和企業(yè)的選擇,它的可靠性和穩(wěn)定性在很大程度上得到了驗(yàn)證。然而,與所有操作系統(tǒng)一樣,Linux也會(huì)遇到一些困難和挑戰(zhàn)。在本文中,我們將探討Linux操作系統(tǒng)遇到大IO操作時(shí)內(nèi)核卡死的原因,并且尋找解決問(wèn)題的方法。

什么是大IO操作?
在計(jì)算機(jī)領(lǐng)域,IO是指輸入和輸出,通常涉及數(shù)據(jù)的讀取和寫(xiě)入,例如,打開(kāi)文件,讀取文件或網(wǎng)絡(luò)通信。由于IO操作涉及慢速設(shè)備(磁盤(pán)驅(qū)動(dòng)器、網(wǎng)絡(luò)連接等),因此,在執(zhí)行IO操作時(shí),操作系統(tǒng)必須等待設(shè)備完成操作,然后才能將數(shù)據(jù)傳送到CPU中進(jìn)行處理。
當(dāng)IO請(qǐng)求過(guò)多時(shí),CPU必須在不同的IO請(qǐng)求之間進(jìn)行切換。這通常稱(chēng)為上下文切換。在大I/O負(fù)載下,上下文切換的數(shù)量變得非常龐大,這可能導(dǎo)致操作系統(tǒng)變慢,響應(yīng)時(shí)間變長(zhǎng)或系統(tǒng)崩潰。
為什么會(huì)出現(xiàn)內(nèi)核卡死?
內(nèi)核卡死指的是操作系統(tǒng)內(nèi)核變得無(wú)響應(yīng),不再執(zhí)行任何命令或操作。 當(dāng)內(nèi)核無(wú)響應(yīng)時(shí),系統(tǒng)上的任何任務(wù)、進(jìn)程或應(yīng)用程序都無(wú)法響應(yīng),這往往會(huì)導(dǎo)致系統(tǒng)的死機(jī)或崩潰。 當(dāng)Linux操作系統(tǒng)遇到大IO操作時(shí),可能會(huì)出現(xiàn)內(nèi)核卡死的情況。
原因分析
硬盤(pán)故障
在一個(gè)極端的情況下,磁盤(pán)驅(qū)動(dòng)器中出現(xiàn)問(wèn)題可能會(huì)導(dǎo)致內(nèi)核卡死,甚至在系統(tǒng)加載過(guò)程中就不能引導(dǎo)。 我們可以通過(guò)查看系統(tǒng)日志來(lái)確定磁盤(pán)驅(qū)動(dòng)器是否出現(xiàn)了某些錯(cuò)誤。 如果您的磁盤(pán)驅(qū)動(dòng)器出現(xiàn)錯(cuò)誤,則應(yīng)該立即停止使用,并進(jìn)行更換或維修。
內(nèi)存故障
內(nèi)存故障可能導(dǎo)致內(nèi)核卡死。 當(dāng)系統(tǒng)內(nèi)存出現(xiàn)問(wèn)題時(shí),可能會(huì)導(dǎo)致內(nèi)核出現(xiàn)錯(cuò)誤或崩潰。 如果您的系統(tǒng)無(wú)法響應(yīng),您可以嘗試使用MemTest86等工具來(lái)測(cè)試系統(tǒng)內(nèi)存。 如果測(cè)試結(jié)果顯示有錯(cuò)誤,則需要更換或修復(fù)系統(tǒng)內(nèi)存。
驅(qū)動(dòng)問(wèn)題
驅(qū)動(dòng)程序問(wèn)題可能導(dǎo)致內(nèi)核卡死。 如果機(jī)器上的一個(gè)驅(qū)動(dòng)程序存在問(wèn)題,它可能會(huì)干擾其他的驅(qū)動(dòng)程序 或者內(nèi)核的正常運(yùn)行。 這可能會(huì)導(dǎo)致系統(tǒng)不確定崩潰 或出現(xiàn)無(wú)法選定的情況,從而導(dǎo)致操作系統(tǒng)無(wú)法響應(yīng)。
大量IO操作
如前所述,在大量IO負(fù)載下,可能會(huì)發(fā)生內(nèi)核卡死現(xiàn)象。這主要是因?yàn)樵趫?zhí)行IO操作時(shí),操作系統(tǒng)必須等待設(shè)備完成操作,然后才能將數(shù)據(jù)傳送到CPU中進(jìn)行處理。這會(huì)導(dǎo)致上下文切換數(shù)量大幅增加,從而可能會(huì)導(dǎo)致系統(tǒng)崩潰。
解決方法
硬件檢測(cè)
如果硬件故障導(dǎo)致內(nèi)核卡死,那么硬件檢測(cè)是之一步。 您可以使用MemTest86等工具來(lái)測(cè)試系統(tǒng)內(nèi)存,或者使用ART等工具來(lái)檢測(cè)磁盤(pán)驅(qū)動(dòng)器是否存在問(wèn)題。 如果有硬件故障,則需要盡快更換或維修。
升級(jí)內(nèi)核
如果內(nèi)核版本太老,可能會(huì)出現(xiàn)內(nèi)核卡死的問(wèn)題。 在這種情況下,升級(jí)內(nèi)核是一個(gè)好的解決方法。 升級(jí)內(nèi)核可以解決系統(tǒng)中的一些錯(cuò)誤和安全問(wèn)題,提高系統(tǒng)性能。
優(yōu)化I/O調(diào)度程序
Linux內(nèi)核有幾個(gè)I/O調(diào)度程序可供選擇,例如CFQ , NOOP , DEADLINE等。 每個(gè)調(diào)度程序都有自己的優(yōu)缺點(diǎn)。 單個(gè)調(diào)度程序不會(huì)適用于所有情況。 選擇不合適的調(diào)度程序可能會(huì)導(dǎo)致系統(tǒng)響應(yīng)遲緩。 因此,優(yōu)化I/O調(diào)度程序可能會(huì)有所幫助。
調(diào)整文件系統(tǒng)相關(guān)參數(shù)
文件系統(tǒng)相關(guān)參數(shù)是影響硬盤(pán)I/O性能的重要因素之一。 通過(guò)調(diào)整文件系統(tǒng)參數(shù),可以提高硬盤(pán)I/O性能,從而減少可能的內(nèi)核卡死現(xiàn)象。 例如,調(diào)整文件系統(tǒng)緩存大小和進(jìn)程文件限制等參數(shù)可能會(huì)對(duì)性能產(chǎn)生積極影響。
當(dāng)Linux操作系統(tǒng)遇到大I/O負(fù)載時(shí),內(nèi)核卡死的情況是很常見(jiàn)的。 這可能是由于硬件故障、內(nèi)存故障、驅(qū)動(dòng)程序問(wèn)題或大量I/O操作等因素導(dǎo)致的。 針對(duì)不同原因可以采取不同的解決方法,例如硬件檢測(cè),升級(jí)內(nèi)核,優(yōu)化I/O調(diào)度程序等。 維護(hù)好Linux操作系統(tǒng)所需要的多方面的知識(shí)和技能,將對(duì)操作系統(tǒng)的穩(wěn)定性和應(yīng)用程序的可靠性產(chǎn)生積極作用。
相關(guān)問(wèn)題拓展閱讀:
- Linux 磁盤(pán)IO
Linux 磁盤(pán)IO
磁盤(pán)結(jié)構(gòu)與數(shù)據(jù)存儲(chǔ)方式, 數(shù)據(jù)是如何存儲(chǔ)的,又通過(guò)怎樣的方式被訪問(wèn)?
機(jī)械硬盤(pán)主要由磁盤(pán)盤(pán)片、磁頭、主軸與傳動(dòng)軸等組成;數(shù)據(jù)就存放在磁盤(pán)盤(pán)片中
現(xiàn)代硬盤(pán)尋道都是采用CHS( Cylinder Head Sector )的方式,硬盤(pán)讀取數(shù)據(jù)時(shí),讀寫(xiě)磁頭沿徑向移動(dòng),移到要讀取的扇區(qū)所在磁道的上方,這段時(shí)間稱(chēng)為
尋道時(shí)間(seek time)
。
因讀寫(xiě)磁頭的起始位置與目標(biāo)位置之間的距離不同,尋道時(shí)間也不同
。磁頭到達(dá)指定磁道后,然后通過(guò)盤(pán)片的旋轉(zhuǎn),使得要讀取的扇區(qū)轉(zhuǎn)到讀寫(xiě)磁頭的下方,這段時(shí)間稱(chēng)為
旋轉(zhuǎn)延遲時(shí)間(rotational latencytime)
。然后再讀寫(xiě)數(shù)據(jù),讀手租寫(xiě)數(shù)據(jù)也需要時(shí)間,這段時(shí)間稱(chēng)為
傳輸時(shí)間(transfer time)
。
固態(tài)硬盤(pán)主要由主控芯片、閃存顆粒與緩存組成;數(shù)據(jù)就存放在閃存芯片中
通過(guò)主控芯片進(jìn)行尋址, 因?yàn)楫吅谜资请娦盘?hào)方式, 沒(méi)有任何物理結(jié)構(gòu), 所以尋址速度非常快且與數(shù)據(jù)存儲(chǔ)位置無(wú)關(guān)
如何查看系統(tǒng)IO狀態(tài)
查看磁盤(pán)空間
調(diào)用 open , fwrite 時(shí)到底發(fā)生了什么?
在一個(gè)IO過(guò)程中,以下5個(gè)API/系統(tǒng)調(diào)用是必不可少的
Create 函數(shù)用來(lái)打開(kāi)一個(gè)文件,如果該文件不存在,那么需要在磁盤(pán)上創(chuàng)建該文件
Open 函數(shù)用于打開(kāi)一個(gè)指定的文件。如果在 Open 函數(shù)中指定 O_CREATE 標(biāo)記,那么 Open 函數(shù)同樣可以實(shí)現(xiàn) Create 函數(shù)的功能
Clos e函數(shù)用于釋放文件句柄
Write 和 Read 函數(shù)用于實(shí)現(xiàn)文件的讀寫(xiě)過(guò)程
O_SYNC (先寫(xiě)緩存, 但是需要實(shí)際落襪粗盤(pán)之后才返回, 如果接下來(lái)有讀請(qǐng)求, 可以從內(nèi)存讀 ), write-through
O_DSYNC (D=data, 類(lèi)似O_SYNC, 但是只同步數(shù)據(jù), 不同步元數(shù)據(jù))
O_DIRECT (直接寫(xiě)盤(pán), 不經(jīng)過(guò)緩存)
O_ASYNC (異步IO, 使用信號(hào)機(jī)制實(shí)現(xiàn), 不推薦, 直接用aio_xxx)
O_NOATIME (讀取的時(shí)候不更新文件 atime(access time))
sync() 全局緩存寫(xiě)回磁盤(pán)
fsync() 特定fd的sync()
fdatasync() 只刷數(shù)據(jù), 不同步元數(shù)據(jù)
mount noatime(全局不記錄atime), re方式(只讀), sync(同步方式)
一個(gè)IO的傳奇一生 這里有一篇非常好的資料,講述了整個(gè)IO過(guò)程;
下面簡(jiǎn)單記錄下自己的理解的一次常見(jiàn)的Linux IO過(guò)程, 想了解更詳細(xì)及相關(guān)源碼,非常推薦閱讀上面的原文
Linux IO體系結(jié)構(gòu)
Superblock
超級(jí)描述了整個(gè)文件系統(tǒng)的信息。為了保證可靠性,可以在每個(gè)塊組中對(duì)superblock進(jìn)行備份。為了避免superblock冗余過(guò)多,可以采用稀疏存儲(chǔ)的方式,即在若干個(gè)塊組中對(duì)superblock進(jìn)行保存,而不需要在所有的塊組中都進(jìn)行備份
GDT 組描述符表
組描述符表對(duì)整個(gè)組內(nèi)的數(shù)據(jù)布局進(jìn)行了描述。例如,數(shù)據(jù)塊位圖的起始地址是多少?inode位圖的起始地址是多少?inode表的起始地址是多少?塊組中還有多少空閑塊資源等。組描述符表在superblock的后面
數(shù)據(jù)塊位圖
數(shù)據(jù)塊位圖描述了塊組內(nèi)數(shù)據(jù)塊的使用情況。如果該數(shù)據(jù)塊已經(jīng)被某個(gè)文件使用,那么位圖中的對(duì)應(yīng)位會(huì)被置1,否則該位為0
Inode位圖
Inode位圖描述了塊組內(nèi)inode資源使用情況。如果一個(gè)inode資源已經(jīng)使用,那么對(duì)應(yīng)位會(huì)被置1
Inode表
(即inode資源)和數(shù)據(jù)塊。這兩塊占據(jù)了塊組內(nèi)的絕大部分空間,特別是數(shù)據(jù)塊資源
一個(gè)文件是由inode進(jìn)行描述的。一個(gè)文件占用的數(shù)據(jù)塊block是通過(guò)inode管理起來(lái)的
。在inode結(jié)構(gòu)中保存了直接塊指針、一級(jí)間接塊指針、二級(jí)間接塊指針和三級(jí)間接塊指針。對(duì)于一個(gè)小文件,直接可以采用直接塊指針實(shí)現(xiàn)對(duì)文件塊的訪問(wèn);對(duì)于一個(gè)大文件,需要采用間接塊指針實(shí)現(xiàn)對(duì)文件塊的訪問(wèn)
最簡(jiǎn)單的調(diào)度器。它本質(zhì)上就是一個(gè)鏈表實(shí)現(xiàn)的
fifo
隊(duì)列,并對(duì)請(qǐng)求進(jìn)行簡(jiǎn)單的
合并
處理。
調(diào)度器本身并沒(méi)有提供任何可以配置的參數(shù)
讀寫(xiě)請(qǐng)求被分成了兩個(gè)隊(duì)列, 一個(gè)用訪問(wèn)地址作為索引,一個(gè)用進(jìn)入時(shí)間作為索引,并且采用兩種方式將這些request管理起來(lái);
在請(qǐng)求處理的過(guò)程中,deadline算法會(huì)優(yōu)先處理那些訪問(wèn)地址臨近的請(qǐng)求,這樣可以更大程度的減少磁盤(pán)抖動(dòng)的可能性。
只有在有些request即將被餓死的時(shí)候,或者沒(méi)有辦法進(jìn)行磁盤(pán)順序化操作的時(shí)候,deadline才會(huì)放棄地址優(yōu)先策略,轉(zhuǎn)而處理那些即將被餓死的request
deadline算法可調(diào)整參數(shù)
read_expire
: 讀請(qǐng)求的超時(shí)時(shí)間設(shè)置(ms)。當(dāng)一個(gè)讀請(qǐng)求入隊(duì)deadline的時(shí)候,其過(guò)期時(shí)間將被設(shè)置為當(dāng)前時(shí)間+read_expire,并放倒fifo_list中進(jìn)行排序
write_expire
:寫(xiě)請(qǐng)求的超時(shí)時(shí)間設(shè)置(ms)
fifo_batch
:在順序(sort_list)請(qǐng)求進(jìn)行處理的時(shí)候,deadline將以batch為單位進(jìn)行處理。每一個(gè)batch處理的請(qǐng)求個(gè)數(shù)為這個(gè)參數(shù)所限制的個(gè)數(shù)。在一個(gè)batch處理的過(guò)程中,不會(huì)產(chǎn)生是否超時(shí)的檢查,也就不會(huì)產(chǎn)生額外的磁盤(pán)尋道時(shí)間。這個(gè)參數(shù)可以用來(lái)平衡順序處理和饑餓時(shí)間的矛盾,當(dāng)饑餓時(shí)間需要盡可能的符合預(yù)期的時(shí)候,我們可以調(diào)小這個(gè)值,以便盡可能多的檢查是否有饑餓產(chǎn)生并及時(shí)處理。增大這個(gè)值當(dāng)然也會(huì)增大吞吐量,但是會(huì)導(dǎo)致處理饑餓請(qǐng)求的延時(shí)變長(zhǎng)
writes_starved
:這個(gè)值是在上述deadline出隊(duì)處理之一步時(shí)做檢查用的。用來(lái)判斷當(dāng)讀隊(duì)列不為空時(shí),寫(xiě)隊(duì)列的饑餓程度是否足夠高,以時(shí)deadline放棄讀請(qǐng)求的處理而處理寫(xiě)請(qǐng)求。當(dāng)檢查存在有寫(xiě)請(qǐng)求的時(shí)候,deadline并不會(huì)立即對(duì)寫(xiě)請(qǐng)求進(jìn)行處理,而是給相關(guān)數(shù)據(jù)結(jié)構(gòu)中的starved進(jìn)行累計(jì),如果這是之一次檢查到有寫(xiě)請(qǐng)求進(jìn)行處理,那么這個(gè)計(jì)數(shù)就為1。如果此時(shí)writes_starved值為2,則我們認(rèn)為此時(shí)饑餓程度還不足夠高,所以繼續(xù)處理讀請(qǐng)求。只有當(dāng)starved >= writes_starved的時(shí)候,deadline才回去處理寫(xiě)請(qǐng)求??梢哉J(rèn)為這個(gè)值是用來(lái)平衡deadline對(duì)讀寫(xiě)請(qǐng)求處理優(yōu)先級(jí)狀態(tài)的,這個(gè)值越大,則寫(xiě)請(qǐng)求越被滯后處理,越小,寫(xiě)請(qǐng)求就越可以獲得趨近于讀請(qǐng)求的優(yōu)先級(jí)
front_merges
:當(dāng)一個(gè)新請(qǐng)求進(jìn)入隊(duì)列的時(shí)候,如果其請(qǐng)求的扇區(qū)距離當(dāng)前扇區(qū)很近,那么它就是可以被合并處理的。而這個(gè)合并可能有兩種情況,一個(gè)是向當(dāng)前位置后合并,另一種是向前合并。在某些場(chǎng)景下,向前合并是不必要的,那么我們就可以通過(guò)這個(gè)參數(shù)關(guān)閉向前合并。默認(rèn)deadline支持向前合并,設(shè)置為0關(guān)閉
在調(diào)度一個(gè)request時(shí),首先需要選擇一個(gè)一個(gè)合適的cfq_group。Cfq調(diào)度器會(huì)為每個(gè)cfq_group分配一個(gè)時(shí)間片,當(dāng)這個(gè)時(shí)間片耗盡之后,會(huì)選擇下一個(gè)cfq_group。每個(gè)cfq_group都會(huì)分配一個(gè)vdisktime,并且通過(guò)該值采用紅黑樹(shù)對(duì)cfq_group進(jìn)行排序。在調(diào)度的過(guò)程中,每次都會(huì)選擇一個(gè)vdisktime最小的cfq_group進(jìn)行處理。
一個(gè)cfq_group管理了7棵service tree,每棵service tree管理了需要調(diào)度處理的對(duì)象cfq_queue。因此,一旦cfq_group被選定之后,需要選擇一棵service tree進(jìn)行處理。這7棵service tree被分成了三大類(lèi),分別為RT、BE和IDLE。這三大類(lèi)service tree的調(diào)度是按照優(yōu)先級(jí)展開(kāi)的
通過(guò)優(yōu)先級(jí)可以很容易的選定一類(lèi)Service tree。當(dāng)一類(lèi)service tree被選定之后,采用service time的方式選定一個(gè)合適的cfq_queue。每個(gè)Service tree是一棵紅黑樹(shù),這些紅黑樹(shù)是按照service time進(jìn)行檢索的,每個(gè)cfq_queue都會(huì)維護(hù)自己的service time。分析到這里,我們知道,cfq算法通過(guò)每個(gè)cfq_group的vdisktime值來(lái)選定一個(gè)cfq_group進(jìn)行服務(wù),在處理cfq_group的過(guò)程通過(guò)優(yōu)先級(jí)選擇一個(gè)最需要服務(wù)的service tree。通過(guò)該Service tree得到最需要服務(wù)的cfq_queue。該過(guò)程在 cfq_select_queue 函數(shù)中實(shí)現(xiàn)
一個(gè)cfq_queue被選定之后,后面的過(guò)程和deadline算法有點(diǎn)類(lèi)似。在選擇request的時(shí)候需要考慮每個(gè)request的延遲等待時(shí)間,選擇那種等待時(shí)間最長(zhǎng)的request進(jìn)行處理。但是,考慮到磁盤(pán)抖動(dòng)的問(wèn)題,cfq在處理的時(shí)候也會(huì)進(jìn)行順序批量處理,即將那些在磁盤(pán)上連續(xù)的request批量處理掉
cfq調(diào)度算法的參數(shù)
back_seek_max
:磁頭可以向后尋址的更大范圍,默認(rèn)值為16M
back_seek_penalty
:向后尋址的懲罰系數(shù)。這個(gè)值是跟向前尋址進(jìn)行比較的
fifo_expire_async
:設(shè)置異步請(qǐng)求的超時(shí)時(shí)間。同步請(qǐng)求和異步請(qǐng)求是區(qū)分不同隊(duì)列處理的,cfq在調(diào)度的時(shí)候一般情況都會(huì)優(yōu)先處理同步請(qǐng)求,之后再處理異步請(qǐng)求,除非異步請(qǐng)求符合上述合并處理的條件限制范圍內(nèi)。當(dāng)本進(jìn)程的隊(duì)列被調(diào)度時(shí),cfq會(huì)優(yōu)先檢查是否有異步請(qǐng)求超時(shí),就是超過(guò)fifo_expire_async參數(shù)的限制。如果有,則優(yōu)先發(fā)送一個(gè)超時(shí)的請(qǐng)求,其余請(qǐng)求仍然按照優(yōu)先級(jí)以及扇區(qū)編號(hào)大小來(lái)處理
fifo_expire_sync
:這個(gè)參數(shù)跟上面的類(lèi)似,區(qū)別是用來(lái)設(shè)置同步請(qǐng)求的超時(shí)時(shí)間
slice_idle
:參數(shù)設(shè)置了一個(gè)等待時(shí)間。這讓cfq在切換cfq_queue或service tree的時(shí)候等待一段時(shí)間,目的是提高機(jī)械硬盤(pán)的吞吐量。一般情況下,來(lái)自同一個(gè)cfq_queue或者service tree的IO請(qǐng)求的尋址局部性更好,所以這樣可以減少磁盤(pán)的尋址次數(shù)。這個(gè)值在機(jī)械硬盤(pán)上默認(rèn)為非零。當(dāng)然在固態(tài)硬盤(pán)或者硬RAID設(shè)備上設(shè)置這個(gè)值為非零會(huì)降低存儲(chǔ)的效率,因?yàn)楣虘B(tài)硬盤(pán)沒(méi)有磁頭尋址這個(gè)概念,所以在這樣的設(shè)備上應(yīng)該設(shè)置為0,關(guān)閉此功能
group_idle
:這個(gè)參數(shù)也跟上一個(gè)參數(shù)類(lèi)似,區(qū)別是當(dāng)cfq要切換cfq_group的時(shí)候會(huì)等待一段時(shí)間。在cgroup的場(chǎng)景下,如果我們沿用slice_idle的方式,那么空轉(zhuǎn)等待可能會(huì)在cgroup組內(nèi)每個(gè)進(jìn)程的cfq_queue切換時(shí)發(fā)生。這樣會(huì)如果這個(gè)進(jìn)程一直有請(qǐng)求要處理的話,那么直到這個(gè)cgroup的配額被耗盡,同組中的其它進(jìn)程也可能無(wú)法被調(diào)度到。這樣會(huì)導(dǎo)致同組中的其它進(jìn)程餓死而產(chǎn)生IO性能瓶頸。在這種情況下,我們可以將slice_idle = 0而group_idle = 8。這樣空轉(zhuǎn)等待就是以cgroup為單位進(jìn)行的,而不是以cfq_queue的進(jìn)程為單位進(jìn)行,以防止上述問(wèn)題產(chǎn)生
low_latency
:這個(gè)是用來(lái)開(kāi)啟或關(guān)閉cfq的低延時(shí)(low latency)模式的開(kāi)關(guān)。當(dāng)這個(gè)開(kāi)關(guān)打開(kāi)時(shí),cfq將會(huì)根據(jù)target_latency的參數(shù)設(shè)置來(lái)對(duì)每一個(gè)進(jìn)程的分片時(shí)間(slice time)進(jìn)行重新計(jì)算。這將有利于對(duì)吞吐量的公平(默認(rèn)是對(duì)時(shí)間片分配的公平)。關(guān)閉這個(gè)參數(shù)(設(shè)置為0)將忽略target_latency的值。這將使系統(tǒng)中的進(jìn)程完全按照時(shí)間片方式進(jìn)行IO資源分配。這個(gè)開(kāi)關(guān)默認(rèn)是打開(kāi)的
target_latency
:當(dāng)low_latency的值為開(kāi)啟狀態(tài)時(shí),cfq將根據(jù)這個(gè)值重新計(jì)算每個(gè)進(jìn)程分配的IO時(shí)間片長(zhǎng)度
quantum
:這個(gè)參數(shù)用來(lái)設(shè)置每次從cfq_queue中處理多少個(gè)IO請(qǐng)求。在一個(gè)隊(duì)列處理事件周期中,超過(guò)這個(gè)數(shù)字的IO請(qǐng)求將不會(huì)被處理。這個(gè)參數(shù)只對(duì)同步的請(qǐng)求有效
slice_sync
:當(dāng)一個(gè)cfq_queue隊(duì)列被調(diào)度處理時(shí),它可以被分配的處理總時(shí)間是通過(guò)這個(gè)值來(lái)作為一個(gè)計(jì)算參數(shù)指定的。公式為: time_slice = slice_sync + (slice_sync/5 * (4 – prio)) 這個(gè)參數(shù)對(duì)同步請(qǐng)求有效
slice_async
:這個(gè)值跟上一個(gè)類(lèi)似,區(qū)別是對(duì)異步請(qǐng)求有效
slice_async_rq
:這個(gè)參數(shù)用來(lái)限制在一個(gè)slice的時(shí)間范圍內(nèi),一個(gè)隊(duì)列最多可以處理的異步請(qǐng)求個(gè)數(shù)。請(qǐng)求被處理的更大個(gè)數(shù)還跟相關(guān)進(jìn)程被設(shè)置的io優(yōu)先級(jí)有關(guān)
通常在Linux上使用的IO接口是同步方式的,進(jìn)程調(diào)用 write / read 之后會(huì)阻塞陷入到內(nèi)核態(tài),直到本次IO過(guò)程完成之后,才能繼續(xù)執(zhí)行,下面介紹的異步IO則沒(méi)有這種限制,但是當(dāng)前Linux異步IO尚未成熟
目前Linux aio還處于較不成熟的階段,只能在 O_DIRECT 方式下才能使用(glibc_aio),也就是無(wú)法使用默認(rèn)的Page Cache機(jī)制
正常情況下,使用aio族接口的簡(jiǎn)要方式如下:
io_uring 是 2023 年 5 月發(fā)布的 Linux 5.1 加入的一個(gè)重大特性 —— Linux 下的全新的異步 I/O 支持,希望能徹底解決長(zhǎng)期以來(lái) Linux AIO 的各種不足
io_uring 實(shí)現(xiàn)異步 I/O 的方式其實(shí)是一個(gè)生產(chǎn)者-消費(fèi)者模型:
邏輯卷管理
RAID0
RAID1
RAID5(糾錯(cuò))
條帶化
Linux系統(tǒng)性能調(diào)整:IO過(guò)程
Linux的IO調(diào)度
一個(gè)IO的傳奇一生
理解inode
Linux 文件系統(tǒng)是怎么工作的?
Linux中Buffer cache性能問(wèn)題一探究竟
Asynchronous I/O and event notification on linux
AIO 的新歸宿:io_uring
linux大io內(nèi)核卡死的介紹就聊到這里吧,感謝你花時(shí)間閱讀本站內(nèi)容,更多關(guān)于linux大io內(nèi)核卡死,Linux操作系統(tǒng)遇到大IO操作時(shí)內(nèi)核卡死原因分析,Linux 磁盤(pán)IO的信息別忘了在本站進(jìn)行查找喔。
香港服務(wù)器選創(chuàng)新互聯(lián),2H2G首月10元開(kāi)通。
創(chuàng)新互聯(lián)(www.cdcxhl.com)互聯(lián)網(wǎng)服務(wù)提供商,擁有超過(guò)10年的服務(wù)器租用、服務(wù)器托管、云服務(wù)器、虛擬主機(jī)、網(wǎng)站系統(tǒng)開(kāi)發(fā)經(jīng)驗(yàn)。專(zhuān)業(yè)提供云主機(jī)、虛擬主機(jī)、域名注冊(cè)、VPS主機(jī)、云服務(wù)器、香港云服務(wù)器、免備案服務(wù)器等。
網(wǎng)站欄目:Linux操作系統(tǒng)遇到大IO操作時(shí)內(nèi)核卡死原因分析(linux大io內(nèi)核卡死)
文章鏈接:http://www.5511xx.com/article/dhiceie.html


咨詢(xún)
建站咨詢(xún)
