日韩无码专区无码一级三级片|91人人爱网站中日韩无码电影|厨房大战丰满熟妇|AV高清无码在线免费观看|另类AV日韩少妇熟女|中文日本大黄一级黄色片|色情在线视频免费|亚洲成人特黄a片|黄片wwwav色图欧美|欧亚乱色一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務(wù)時(shí)間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營(yíng)銷解決方案
讓Python更加充分的使用Sqlite3

我最近在涉及大量數(shù)據(jù)處理的項(xiàng)目中頻繁使用 sqlite3。我最初的嘗試根本不涉及任何數(shù)據(jù)庫(kù),所有的數(shù)據(jù)都將保存在內(nèi)存中,包括字典查找、迭代和條件等查詢。這很好,但可以放入內(nèi)存的只有那么多,并且將數(shù)據(jù)從磁盤重新生成或加載到內(nèi)存是一個(gè)繁瑣又耗時(shí)的過程。

創(chuàng)新互聯(lián)建站于2013年開始,是專業(yè)互聯(lián)網(wǎng)技術(shù)服務(wù)公司,擁有項(xiàng)目成都網(wǎng)站制作、網(wǎng)站設(shè)計(jì)網(wǎng)站策劃,項(xiàng)目實(shí)施與項(xiàng)目整合能力。我們以讓每一個(gè)夢(mèng)想脫穎而出為使命,1280元源匯做網(wǎng)站,已為上家服務(wù),為源匯各地企業(yè)和個(gè)人服務(wù),聯(lián)系電話:18982081108

我決定試一試sqlite3。 因?yàn)橹恍璐蜷_與數(shù)據(jù)庫(kù)的連接, 這樣可以增加可處理的數(shù)據(jù)量,并將應(yīng)用程序的加載時(shí)間減少到零。此外,我可以通過 SQL 查詢替換很多Python邏輯語句。

我想分享一些關(guān)于這次經(jīng)歷的心得和發(fā)現(xiàn)。

TL;DR

  • 使用大量操作 (又名 executemany)。
  • 你不需要使用光標(biāo) (大部分時(shí)間)。
  • 光標(biāo)可被迭代。
  • 使用上下文管理器。
  • 使用編譯指示 (當(dāng)它有意義)。
  • 推遲索引創(chuàng)建。
  • 使用占位符來插入 python 值。

1. 使用大量操作

如果你需要在數(shù)據(jù)庫(kù)中一次性插入很多行,那么你真不應(yīng)該使用 execute。sqlite3 模塊提供了批量插入的方式:executemany。

而不是像這樣做:

 
 
 
 
  1. for row in iter_data():  
  2. connection.execute('INSERT INTO my_table VALUES (?)', row) 

你可以利用這個(gè)事實(shí),即 executemany 接受元組的生成器作為參數(shù):

 
 
 
 
  1. connection.executemany( 
  2.     'INSERT INTO my_table VALUE (?)', 
  3.     iter_data() 

這不僅更簡(jiǎn)潔,而且更高效。實(shí)際上,sqlite3 在幕后利用 executemany 實(shí)現(xiàn) execute,但后者插入一行而不是多行。

我寫了一個(gè)小的基準(zhǔn)測(cè)試,將一百萬行插入空表(數(shù)據(jù)庫(kù)在內(nèi)存中):

  • executemany: 1.6 秒
  • execute: 2.7 秒

2. 你不需要游標(biāo)

一開始我經(jīng)常搞混的事情就是,光標(biāo)管理。在線示例和文檔中通常如下:

 
 
 
 
  1. connection = sqlite3.connect(':memory:') 
  2. cursor = connection.cursor() 
  3. # Do something with cursor 

但大多數(shù)情況下,你根本不需要光標(biāo),你可以直接使用連接對(duì)象。

像 execute

 
 
 
 
  1. executemany 

類似的操作可以直接在連接上調(diào)用。以下是一個(gè)證明此事的示例:

 
 
 
 
  1. import sqlite3 
  2.  
  3. connection = sqlite3(':memory:') 
  4.  
  5. # Create a table 
  6. connection.execute('CREATE TABLE events(ts, msg)') 
  7.  
  8. # Insert values 
  9. connection.executemany( 
  10.     'INSERT INTO events VALUES (?,?)', 
  11.     [ 
  12.         (1, 'foo'), 
  13.         (2, 'bar'), 
  14.         (3, 'baz') 
  15.     ] 
  16.  
  17. # Print inserted rows 
  18. for row in connnection.execute('SELECT * FROM events'): 
  19.     print(row) 

3. 光標(biāo)(Cursor)可被用于迭代

你可能經(jīng)常會(huì)看到使用fetchone或fetchall來處理 SELECT 查詢結(jié)果的示例。但是我發(fā)現(xiàn)處理這些結(jié)果的最自然的方式是直接在光標(biāo)上迭代:

 
 
 
 
  1. for row in connection.execute('SELECT * FROM events'): 
  2.     print(row) 

這樣一來,只要你得到足夠的結(jié)果,你就可以終止查詢,并且不會(huì)引起資源浪費(fèi)。當(dāng)然,如果事先知道你需要多少結(jié)果,可以改用 LIMIT SQL語句,但Python生成器是非常方便的,可以讓你將數(shù)據(jù)生成與數(shù)據(jù)消耗分離。

4. 使用Context Managers(上下文管理器)

即使在處理SQL事務(wù)的中間,也會(huì)發(fā)生討厭的事情。為了避免手動(dòng)處理回滾或提交,你可以簡(jiǎn)單地使用連接對(duì)象作為上下文管理器。 在以下示例中,我們創(chuàng)建了一個(gè)表,并錯(cuò)誤地插入了重復(fù)的值:

 
 
 
 
  1. import sqlite3 
  2. connection = sqlite3.connect(':memory:') 
  3.  
  4. with connection: 
  5.     connection.execute( 
  6.         'CREATE TABLE events(ts, msg, PRIMARY KEY(ts, msg))') 
  7.  
  8. try: 
  9.     with connection: 
  10.         connection.executemany('INSERT INTO events VALUES (?, ?)', [ 
  11.             (1, 'foo'), 
  12.             (2, 'bar'), 
  13.             (3, 'baz'), 
  14.             (1, 'foo'), 
  15.         ]) 
  16. except (sqlite3.OperationalError, sqlite3.IntegrityError) as e: 
  17.     print('Could not complete operation:', e) 
  18.      
  19. # No row was inserted because transaction failed 
  20. for row in connection.execute('SELECT * FROM events'): 
  21.     print(row) 
  22.      
  23. connection.close() 

5. 使用Pragmas

…當(dāng)它真的有用時(shí)

在你的程序中有幾個(gè) pragma 可用于調(diào)整 sqlite3 的行為。特別地,其中一個(gè)可以改善性能的是 synchronous :

 
 
 
 
  1. connection.execute('PRAGMA synchronous = OFF') 

你應(yīng)該知道這可能是危險(xiǎn)的。如果應(yīng)用程序在事務(wù)中間意外崩潰,數(shù)據(jù)庫(kù)可能會(huì)處于不一致的狀態(tài)。所以請(qǐng)小心使用! 但是如果你要更快地插入很多行,那么這可能是一個(gè)選擇。

6. 推遲索引創(chuàng)建

假設(shè)你需要在數(shù)據(jù)庫(kù)上創(chuàng)建幾個(gè)索引,而你需要在插入很多行的同時(shí)創(chuàng)建索引。把索引的創(chuàng)建推遲到所有行的插入之后可以導(dǎo)致實(shí)質(zhì)性的性能改善。

7. 使用占位符插入 Python 值

使用 Python 字符串操作將值包含到查詢中是很方便的。但是這樣做非常不安全,而 sqlite3 給你提供了更好的方法來做到這一點(diǎn):

 
 
 
 
  1. # Do not do this! 
  2. my_timestamp = 1 
  3. c.execute("SELECT * FROM events WHERE ts = '%s'" % my_timestamp) 
  4.  
  5. # Do this instead 
  6. my_timestamp = (1,) 
  7. c.execute('SELECT * FROM events WHERE ts = ?', my_timestamp) 

此外,使用Python%s(或格式或格式的字符串常量)的字符串插值對(duì)于 executemany 來說并不是總是可行。所以在此嘗試沒有什么真正意義!

請(qǐng)記住,這些小技巧可能會(huì)(也可能不會(huì))給你帶來好處,具體取決于特定的用例。你應(yīng)該永遠(yuǎn)自己去嘗試,決定是否值得這么做。


網(wǎng)站欄目:讓Python更加充分的使用Sqlite3
標(biāo)題網(wǎng)址:http://www.5511xx.com/article/ccdjipe.html