新聞中心
這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
創(chuàng)新互聯(lián)Python教程:python開發(fā)中的編碼方式如何對比使用?
編碼方式的歷史大致為ASCII ->gb2312->unicode->utf-8,期間具體詳細信息感興趣的可以去做一些查詢,正因為存在這樣的過渡,因此對同一模塊的不同使用,需要我們?nèi)ミM行有選擇性的挑選使用,因此,這就衍生出了我們今天的主題,怎么去對比使用這些存在的編碼方式。

創(chuàng)新互聯(lián)是網(wǎng)站建設(shè)技術(shù)企業(yè),為成都企業(yè)提供專業(yè)的做網(wǎng)站、成都網(wǎng)站制作,網(wǎng)站設(shè)計,網(wǎng)站制作,網(wǎng)站改版等技術(shù)服務(wù)。擁有十載豐富建站經(jīng)驗和眾多成功案例,為您定制適合企業(yè)的網(wǎng)站。十載品質(zhì),值得信賴!
來個編碼解碼的小例子先,記住中文可以進行GBK和utf-8編碼,在GBk一個中文字符對應(yīng)兩個字節(jié),在utf-8一個中文字符對應(yīng)三個字節(jié),中文不能進行ASCII編碼。
>>> '爬森'.encode('GBK')
b'\xc1\xf5\xc8\xf3\xc9\xad'
>>> '爬森'.encode('ascii')
Traceback (most recent call last):
File "", line 1, in
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128)
>>> 'Runsen'.encode('ascii')
b'Runsen'
>>> "爬森".encode('utf-8')
b'\xe5\x88\x98\xe6\xb6\xa6\xe6\xa3\xae'
>>> '爬森'.encode('GBK').decode('GBK')
'爬森'
>>> '爬森'.encode('GBK').decode('utf-8')
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc1 in position 0: invalid start byte
如果編碼解碼格式不一致可能會出現(xiàn)亂碼,encode表示編碼,decode表示解碼,這樣大家可以對選擇上有明確想法了吧,如果還想知道更多相關(guān)內(nèi)容,進入python學(xué)習(xí)網(wǎng)即可。
當(dāng)前題目:創(chuàng)新互聯(lián)Python教程:python開發(fā)中的編碼方式如何對比使用?
鏈接URL:http://www.5511xx.com/article/dhhdisi.html


咨詢
建站咨詢
