精品久久人人妻人人做精品,久久久婷婷技巧图片,日本岛国电影亚洲中文字幕日

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷解決方案

如何把a(bǔ)wk腳本移植到Python

將一個(gè) awk 腳本移植到 Python 主要在于代碼風(fēng)格而不是轉(zhuǎn)譯。
創(chuàng)新互聯(lián)建站專注于浮山網(wǎng)站建設(shè)服務(wù)及定制，我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗(yàn)。熱誠(chéng)為您提供浮山營(yíng)銷型網(wǎng)站建設(shè)，浮山網(wǎng)站制作、浮山網(wǎng)頁(yè)設(shè)計(jì)、浮山網(wǎng)站官網(wǎng)定制、小程序設(shè)計(jì)服務(wù)，打造浮山網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供浮山網(wǎng)站排名全網(wǎng)營(yíng)銷落地服務(wù)。

腳本是解決問(wèn)題的有效方法，而 awk 是編寫腳本的出色語(yǔ)言。它特別擅長(zhǎng)于簡(jiǎn)單的文本處理，它可以帶你完成配置文件的某些復(fù)雜重寫或目錄中文件名的重新格式化。

何時(shí)從 awk 轉(zhuǎn)向 Python

但是在某些方面，awk 的限制開始顯現(xiàn)出來(lái)。它沒(méi)有將文件分解為模塊的真正概念，它缺乏質(zhì)量錯(cuò)誤報(bào)告，并且缺少了現(xiàn)在被認(rèn)為是編程語(yǔ)言工作原理的其他內(nèi)容。當(dāng)編程語(yǔ)言的這些豐富功能有助于維護(hù)關(guān)鍵腳本時(shí)，移植將是一個(gè)不錯(cuò)的選擇。

我最喜歡的完美移植 awk 的現(xiàn)代編程語(yǔ)言是 Python。

在將 awk 腳本移植到 Python 之前，通常值得考慮一下其原始使用場(chǎng)景。例如，由于 awk 的局限性，通常從 Bash 腳本調(diào)用 awk 代碼，其中包括一些對(duì) sed、sort 之類的其它命令行常見工具的調(diào)用。最好將所有內(nèi)容轉(zhuǎn)換為一個(gè)一致的 Python 程序。有時(shí)，腳本會(huì)做出過(guò)于寬泛的假設(shè)，例如，即使實(shí)際上只運(yùn)行一個(gè)文件，該代碼也可能允許任意數(shù)量的文件。

在仔細(xì)考慮了上下文并確定了要用 Python 替代的東西之后，該編寫代碼了。

標(biāo)準(zhǔn) awk 到 Python 功能

以下 Python 功能是有用的，需要記?。?/p>

 
 
 
  
  
  with open(some_file_name) as fpin:
  
  
      for line in fpin:
  
  
          pass # do something with line

此代碼將逐行循環(huán)遍歷文件并處理這些行。

如果要訪問(wèn)行號(hào)（相當(dāng)于 awk 的 NR），則可以使用以下代碼：

 
 
 
  
  
  with open(some_file_name) as fpin:
  
  
      for nr, line in enumerate(fpin):
  
  
          pass # do something with line

在 Python 中實(shí)現(xiàn)多文件的 awk 式行為

如果你需要能夠遍歷任意數(shù)量的文件同時(shí)保持行數(shù)的持續(xù)計(jì)數(shù)（類似 awk 的 FNR），則此循環(huán)可以做到這一點(diǎn)：

 
 
 
  
  
  def awk_like_lines(list_of_file_names):
  
  
      def _all_lines():
  
  
          for filename in list_of_file_names:
  
  
              with open(filename) as fpin:
  
  
                  yield from fpin
  
  
      yield from enumerate(_all_lines())

此語(yǔ)法使用 Python 的生成器和 yield from 來(lái)構(gòu)建迭代器，該迭代器將遍歷所有行并保持一個(gè)持久計(jì)數(shù)。

如果你需要同時(shí)使用 FNR 和 NR，這是一個(gè)更復(fù)雜的循環(huán)：

 
 
 
  
  
  def awk_like_lines(list_of_file_names):
  
  
      def _all_lines():
  
  
          for filename in list_of_file_names:
  
  
              with open(filename) as fpin:
  
  
                  yield from enumerate(fpin)
  
  
      for nr, (fnr, line) in _all_lines:
  
  
          yield nr, fnr, line

更復(fù)雜的 FNR、NR 和行數(shù)的 awk 行為

如果 FNR、NR 和行數(shù)這三個(gè)你全都需要，仍然會(huì)有一些問(wèn)題。如果確實(shí)如此，則使用三元組（其中兩個(gè)項(xiàng)目是數(shù)字）會(huì)導(dǎo)致混淆。命名參數(shù)可使該代碼更易于閱讀，因此最好使用 dataclass：

 
 
 
  
  
  import dataclass
  
  
  
  
  
  @dataclass.dataclass(frozen=True)
  
  
  class AwkLikeLine:
  
  
      content: str
  
  
      fnr: int
  
  
      nr: int
  
  
  
  
  
  def awk_like_lines(list_of_file_names):
  
  
      def _all_lines():
  
  
          for filename in list_of_file_names:
  
  
              with open(filename) as fpin:
  
  
                  yield from enumerate(fpin)
  
  
      for nr, (fnr, line) in _all_lines:
  
  
          yield AwkLikeLine(nr=nr, fnr=fnr, line=line)

你可能想知道，為什么不一直用這種方法呢？使用其它方式的的原因是總用這種方法太復(fù)雜了。如果你的目標(biāo)是把一個(gè)通用庫(kù)更容易地從 awk 移植到 Python，請(qǐng)考慮這樣做。但是編寫一個(gè)可以使你確切地了解特定情況所需的循環(huán)的方法通常更容易實(shí)現(xiàn)，也更容易理解（因而易于維護(hù)）。

理解 awk 字段

一旦有了與一行相對(duì)應(yīng)的字符串，如果要轉(zhuǎn)換 awk 程序，則通常需要將其分解為字段。Python 有幾種方法可以做到這一點(diǎn)。這將把行按任意數(shù)量的連續(xù)空格拆分，返回一個(gè)字符串列表：

 
 
 
  
  
  line.split()

如果需要另一個(gè)字段分隔符，比如以 : 分隔行，則需要 rstrip 方法來(lái)刪除最后一個(gè)換行符：

 
 
 
  
  
  line.rstrip("\n").split(":")

完成以下操作后，列表 parts 將存有分解的字符串：

 
 
 
  
  
  parts = line.rstrip("\n").split(":")

這種拆分非常適合用來(lái)處理參數(shù)，但是我們處于偏差一個(gè)的錯(cuò)誤場(chǎng)景中?，F(xiàn)在 parts[0] 將對(duì)應(yīng)于 awk 的 $1，parts[1] 將對(duì)應(yīng)于 awk 的 $2，依此類推。之所以偏差一個(gè)，是因?yàn)?awk 計(jì)數(shù)“字段”從 1 開始，而 Python 從 0 開始計(jì)數(shù)。在 awk 中，$0 是整個(gè)行 —— 等同于 line.rstrip("\n")，而 awk 的 NF（字段數(shù)）更容易以 len(parts) 的形式得到。

移植 awk 字段到 Python

例如，讓我們將這個(gè)單行代碼“如何使用 awk 從文件中刪除重復(fù)行”轉(zhuǎn)換為 Python。

awk 中的原始代碼是：

 
 
 
  
  
  awk '!visited[$0]++' your_file > deduplicated_file

“真實(shí)的” Python 轉(zhuǎn)換將是：

 
 
 
  
  
  import collections
  
  
  import sys
  
  
  
  
  
  visited = collections.defaultdict(int)
  
  
  for line in open("your_file"):
  
  
      did_visit = visited[line]
  
  
      visited[line] += 1
  
  
      if not did_visit:
  
  
          sys.stdout.write(line)

但是，Python 比 awk 具有更多的數(shù)據(jù)結(jié)構(gòu)。與其計(jì)數(shù)訪問(wèn)次數(shù)（除了知道是否看到一行，我們不使用它），為什么不記錄訪問(wèn)的行呢？

 
 
 
  
  
  import sys
  
  
  
  
  
  visited = set()
  
  
  for line in open("your_file"):
  
  
      if line in visited:
  
  
          continue
  
  
      visited.add(line)
  
  
      sys.stdout.write(line)

編寫 Python 化的 awk 代碼

Python 社區(qū)提倡編寫 Python 化的代碼，這意味著它要遵循公認(rèn)的代碼風(fēng)格。更加 Python 化的方法將區(qū)分唯一性和輸入/輸出的關(guān)注點(diǎn)。此更改將使對(duì)代碼進(jìn)行單元測(cè)試更加容易：

 
 
 
  
  
  def unique_generator(things):
  
  
      visited = set()
  
  
      for thing in things:
  
  
          if thing in visited:
  
  
              continue
  
  
          visited.add(things)
  
  
          yield thing
  
  
  
  
  
  import sys
  
  
     
  
  
  for line in unique_generator(open("your_file")):
  
  
      sys.stdout.write(line)

將所有邏輯置于輸入/輸出代碼之外，可以更好地分離問(wèn)題，并提高代碼的可用性和可測(cè)試性。

結(jié)論：Python 可能是一個(gè)不錯(cuò)的選擇

將 awk 腳本移植到 Python 時(shí)，通常是在考慮適當(dāng)?shù)?Python 代碼風(fēng)格時(shí)重新實(shí)現(xiàn)核心需求，而不是按條件/操作進(jìn)行笨拙的音譯?？紤]原始上下文并產(chǎn)生高質(zhì)量的 Python 解決方案。雖然有時(shí)候使用 awk 的 Bash 單行代碼可以完成這項(xiàng)工作，但 Python 編碼是通往更易于維護(hù)的代碼的途徑。

本文標(biāo)題：如何把a(bǔ)wk腳本移植到Python
瀏覽路徑：http://www.5511xx.com/article/cosgdsd.html

日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

新聞中心

何時(shí)從 awk 轉(zhuǎn)向 Python

標(biāo)準(zhǔn) awk 到 Python 功能

在 Python 中實(shí)現(xiàn)多文件的 awk 式行為

更復(fù)雜的 FNR、NR 和行數(shù)的 awk 行為

理解 awk 字段

移植 awk 字段到 Python

編寫 Python 化的 awk 代碼

結(jié)論：Python 可能是一個(gè)不錯(cuò)的選擇

其他資訊

新聞中心

何時(shí)從 awk 轉(zhuǎn)向 Python

標(biāo)準(zhǔn) awk 到 Python 功能

在 Python 中實(shí)現(xiàn)多文件的 awk 式行為

更復(fù)雜的 FNR、NR 和行數(shù)的 awk 行為

理解 awk 字段

移植 awk 字段到 Python

編寫 Python 化的 awk 代碼

結(jié)論：Python 可能是一個(gè)不錯(cuò)的選擇

其他資訊

更復(fù)雜的 FNR、NR 和行數(shù)的 awk 行為