日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關咨詢
選擇下列產品馬上在線溝通
服務時間:8:30-17:00
你可能遇到了下面的問題
關閉右側工具欄

新聞中心

這里有您想知道的互聯網營銷解決方案
創(chuàng)新互聯Python教程:如何解決運行較大excel文件openpyxl變慢問題

平時打開小文件的時候沒有注意,當偶爾有較大的excel需要運行,就會出現openpyxl變慢問題 。今天小編就教大家解決運行較大excel文件時openpyxl變慢的問題 。

運行以下代碼:

from openpyxl import Workbook  from openpyxl.utils import get_column_letter  from openpyxl import load_workbook  import time  wb = load_workbook("E:/a.xlsx", read_only=True)  sh = wb["Sheet"]  # rowItem = {}  # for j in range(1,2000):  #   for i in range(1, 30):  #     rowItem[get_column_letter(i)] = i  #   sh.append(rowItem)  # wb.save("E:/a.xlsx")  t0 = time.time()  print(sh['V500'].value)  t1 = time.time()  print("openpyxl所用時間:", str(t1-t0))  import xlrd  xlsPath = "E:/a.xlsx"  WorkBook = xlrd.open_workbook(xlsPath)  sh = WorkBook.sheet_by_name("Sheet")  t0 = time.time()  print(sh.cell(499,22).value)  t1 = time.time()  print("xlrd所用時間:", str(t1-t0))

測試結果:


22 openpyxl所用時間: 0.44217610359191895 23.0 xlrd所用時間: 0.0010063648223876953


結論

openpyxl的慢是讀取慢,可以選擇xlrd代替,詳細測試下面繼續(xù)。

不直接使用xlwt+xlrd是因為xlwt僅支持2003及以下版本,行數限制在65536,不夠用,而openpyxl大概在一百多萬。

主要的說完了,下面詳細說了:在寫工具的時候遇到的這個問題,開始是用的xlwt+xlrd,然后行數超標了,沒辦法換成openpyxl使用excel2007的版本,原本測試不到三萬行的數據,只要三四秒,換成openpyxl以后,花了好幾分鐘,具體沒看多少了,然后加上函數運行時間的監(jiān)視器以后,才看到是讀取的時候出的問題。

推測原因:

推測的話,openpyxl的根據行號列號讀取的時候,是從第一行第一列開始遍歷,直到行號等于指定行號,列號等于指定列號,所以要讀取的行號列號越多就越慢,(也可能是從第一個有數據的行或列),而xlrd則是類似與數組一樣,我們要取第幾個元素,直接根據下標找到內存中對應地址的元素即可,所以無論excel總量多少,速度基本都是不變的。

知識拓展:

xlwt寫入僅支持65536行,那xlrd的讀取很可能也是,也就是超過這么多的數據可能也會出錯。

我這里因為是讀多表數據生成單表數據,生成方式大概是Na*Nb這樣,所以實際讀取的不會太多,但生成的很多,所以基本可以用考慮這個問題。

另外,據說xlrd讀取xlsx格式的偶爾會出現問題,具體沒測試,暫時用還沒毛病。

最后,順帶上一下監(jiān)控函數運行時間的裝飾器吧:

import time from functools import wraps def fn_timer(function):  @wraps(function)  def function_timer(*args, **kwargs):    t0 = time.time()    result = function(*args, **kwargs)    t1 = time.time()    print ("Total time running %s: %s seconds" %      (function.__name__, str(t1-t0))      )    return result  return function_timer

使用方式的話,就是在要監(jiān)控的函數定義上面加上 @fn_timer 就行了。

相信下次用openpyxl打開大的excel文件后,小伙伴們不需要慢慢等待了。


文章題目:創(chuàng)新互聯Python教程:如何解決運行較大excel文件openpyxl變慢問題
文章路徑:http://www.5511xx.com/article/dpisogd.html