新聞中心
awk是Unix環(huán)境下一種非常好的語言,適合于文本處理和報表生成,它還有許多精心設計的特性,允許進行特殊技巧程序設計。對于短消息來說,比如處理話單文件,使用awk就非常方便本篇文章重點為大家講解一下 awk 的特殊模式:BEGIN 和 END 。

創(chuàng)新互聯(lián)建站是一家專業(yè)提供沙市企業(yè)網站建設,專注與網站設計、做網站、H5場景定制、小程序制作等業(yè)務。10年已為沙市眾多企業(yè)、政府機構等服務。創(chuàng)新互聯(lián)專業(yè)網站建設公司優(yōu)惠進行中。
隨著我們逐漸展開,并探索出更多構建復雜 awk 操作的方法,將會證明 awk 的這些特殊功能的是多么強大。
開始前,先讓我們回顧一下 awk 系列的介紹,記得當我們開始這個系列時,我就指出 awk 指令的通用語法是這樣的:
# awk 'script' filenames
在上述語法中,awk 腳本擁有這樣的形式:
/pattern/ { actions }
你通常會發(fā)現(xiàn)腳本中的模式(/pattern )是一個正則表達式,此外,你也可以在這里用特殊模式 BENGIN 和 END 。因此,我們也能按照下面的形式編寫一條 awk 命令:
awk ' BEGIN { actions } /pattern/ { actions } /pattern/ { actions } ………. END { actions } ' filenames
假如你在 awk 腳本中使用了特殊模式:BEGIN 和 END ,以下則是它們對應的含義:
-
BEGIN 模式:是指 awk 將在讀取任何輸入行之前立即執(zhí)行BEGIN 中指定的動作。
-
END 模式:是指 awk 將在它正式退出前執(zhí)行 END中指定的動作。
含有這些特殊模式的 awk 命令腳本的執(zhí)行流程如下:
-
當在腳本中使用了 BEGIN 模式,則 BEGIN 中所有的動作都會在讀取任何輸入行之前執(zhí)行。
-
然后,讀入一個輸入行并解析成不同的段。
-
接下來,每一條指定的非特殊模式都會和輸入行進行比較匹配,當匹配成功后,就會執(zhí)行模式對應的動作。對所有你指定的模式重復此執(zhí)行該步驟。
-
再接下來,對于所有輸入行重復執(zhí)行步驟 2 和 步驟 3。
-
當讀取并處理完所有輸入行后,假如你指定了 END 模式,那么將會執(zhí)行相應的動作。
當你使用特殊模式時,想要在 awk 操作中獲得最好的結果,你應當記住上面的執(zhí)行順序。
為了便于理解,讓我們使用第八節(jié)的例子進行演示,那個例子是關于 Tecmint 擁有的域名列表,并保存在一個叫做 domains.txt 的文件中。
news.tecmint.com
tecmint.com
linuxsay.com
windows.tecmint.com
tecmint.com
news.tecmint.com
tecmint.com
linuxsay.com
tecmint.com
news.tecmint.com
tecmint.com
linuxsay.com
windows.tecmint.com
tecmint.com
$ cat ~/domains.txt
查看文件內容
在這個例子中,我們希望統(tǒng)計出 domains.txt 文件中域名tecmint.com 出現(xiàn)的次數(shù)。所以,我們編寫了一個簡單的 shell 腳本幫助我們完成任務,它使用了變量、數(shù)學表達式和賦值運算符的思想,腳本內容如下:
#!/bin/bash
for file in $@; do
if [ -f $file ] ; then
### 輸出文件名
echo "File is: $file"
### 輸出一個遞增的數(shù)字記錄包含 tecmint.com 的行數(shù)
awk '/^tecmint.com/ { counter+=1 ; printf "%s/n", counter ; }' $file
else
### 若輸入不是文件,則輸出錯誤信息
echo "$file 不是一個文件,請指定一個文件。" >&2 && exit 1
fi
done
### 成功執(zhí)行后使用退出代碼 0 終止腳本
exit 0
現(xiàn)在讓我們像下面這樣在上述腳本的 awk 命令中應用這兩個特殊模式:BEGIN 和 END :
我們應當把腳本:
awk '/^tecmint.com/ { counter+=1 ; printf "%s/n", counter ; }' $file
改成:
awk ' BEGIN { print "文件中出現(xiàn) tecmint.com 的次數(shù)是:" ; } /^tecmint.com/ { counter+=1 ; } END { printf "%s/n", counter ; } ' $file
在修改了 awk 命令之后,現(xiàn)在完整的 shell 腳本就像下面這樣:
#!/bin/bash
for file in $@; do
if [ -f $file ] ; then
### 輸出文件名
echo "File is: $file"
### 輸出文件中 tecmint.com 出現(xiàn)的總次數(shù)
awk ' BEGIN { print "文件中出現(xiàn) tecmint.com 的次數(shù)是:" ; } /^tecmint.com/ { counter+=1 ; } END { printf "%s/n", counter ; } ' $file
else
### 若輸入不是文件,則輸出錯誤信息
echo "$file 不是一個文件,請指定一個文件。" >&2 && exit 1
fi
done
### 成功執(zhí)行后使用退出代碼 0 終止腳本
exit 0
awk 模式 BEGIN 和 END
當我們運行上面的腳本時,它會首先輸出 domains.txt 文件的位置,然后執(zhí)行 awk 命令腳本,該命令腳本中的特殊模式 BEGIN 將會在從文件讀取任何行之前幫助我們輸出這樣的消息“文件中出現(xiàn) tecmint.com 的次數(shù)是: ”。
接下來,我們的模式/^tecmint.com/ 會在每個輸入行中進行比較,對應的動作{ counter+=1 ; } 會在每個匹配成功的行上執(zhí)行,它會統(tǒng)計出 tecmint.com 在文件中出現(xiàn)的次數(shù)。
最終,END 模式將會輸出域名 tecmint.com 在文件中出現(xiàn)的總次數(shù)。
$ ./script.sh ~/domains.txt
用于統(tǒng)計字符串出現(xiàn)次數(shù)的腳本
最后總結一下,我們在本節(jié)中演示了更多的 awk 功能,并學習了特殊模式 BEGIN 和 END 的概念。
標題名稱:Awk的特殊模式:BEGIN和END
網站鏈接:http://www.5511xx.com/article/dpsdsgp.html


咨詢
建站咨詢
